微信上其實(shí)還有很多你不知道的事,Python微信平臺(tái)開(kāi)發(fā)編寫實(shí)錄
本文主要講述如何利用Python開(kāi)發(fā)微信公眾平臺(tái)。
說(shuō)明:如果你是Python小白,爬蟲(chóng)小白,覺(jué)得本節(jié)課程的代碼晦澀難懂。沒(méi)關(guān)系,不需要懂,按照步驟一步步操作就可以了。這一節(jié)我們主要是搭框架,幾乎沒(méi)有真正的爬蟲(chóng)代碼。這些代碼和操作,你可能一生也就只用這一次。下一節(jié),我們?cè)僦v述怎么在這個(gè)框架上擴(kuò)展我們的爬蟲(chóng)程序。
當(dāng)然小編這里也準(zhǔn)備一份適合你的學(xué)習(xí)資料爬蟲(chóng) ,web開(kāi)發(fā)的學(xué)習(xí)資料視頻教程,私信小編“01”都可以免費(fèi)獲??!
需要的操作:
- 微信公眾賬號(hào)的申請(qǐng)。
- 微信接口的獲取,SAE的設(shè)置等。
- 簡(jiǎn)單的Python爬蟲(chóng)代碼編寫
需掌握的知識(shí)點(diǎn):
- 了解微信公眾號(hào)與云計(jì)算平臺(tái)之間的連接關(guān)系。明確其運(yùn)行機(jī)制。
- 了解web.py的概念,wsgi的機(jī)制。
- 了解簡(jiǎn)單的python爬蟲(chóng)知識(shí),json解析,API調(diào)用,urllib庫(kù)函數(shù)。
自動(dòng)回復(fù)實(shí)現(xiàn)原理
首先了解一下,到底是什么樣的機(jī)制能實(shí)現(xiàn)微信的自動(dòng)回復(fù)功能呢?(不是微信系統(tǒng)的自動(dòng)回復(fù))原理就是微信平臺(tái)將用戶輸入的文字發(fā)送到云平臺(tái)上,然后云平臺(tái)上運(yùn)行的程序捕捉到這一文字信息,就return一個(gè)結(jié)果,然后云平臺(tái)再將該結(jié)果返回至微信平臺(tái)。最后微信平臺(tái)將返回的結(jié)果展現(xiàn)給用戶。用一張圖表示一下:
微信開(kāi)發(fā)者模式與SAE的設(shè)置
這一節(jié)我盡量講的細(xì)致一些,如果仍有不清楚的,可以私信我。
首先需要兩大平臺(tái)支持:
- 微信公眾平臺(tái);這個(gè)申請(qǐng)比較簡(jiǎn)單。只要有郵箱就可以免費(fèi)申請(qǐng)個(gè)人版的訂閱號(hào)。不再贅述。
- 云計(jì)算平臺(tái);我這里使用的SAE(新浪的去年本來(lái)就不收費(fèi),坑爹,今年開(kāi)始收費(fèi)了,單純代碼托管最低一天1毛),也可以用騰訊云。
具體步驟:
微信公眾號(hào)的申請(qǐng)。
只要有郵箱就可以免費(fèi)申請(qǐng)個(gè)人版的訂閱號(hào)。不再贅述。
SAE的申請(qǐng)及設(shè)置
注冊(cè)登錄SAE之后,選用SAE
創(chuàng)建新項(xiàng)目,SAE暫時(shí)只支持Python2.7,Python3暫時(shí)用不了。
如果項(xiàng)目比較小,建議填寫SVN,因?yàn)榭梢栽诰€編輯。如果項(xiàng)目比較大,就Git吧。這里選用SVN。
創(chuàng)建第一個(gè)版本
可以開(kāi)始編輯啦~
編寫config.yaml和index.wsgi文件。
WSGI是PythonWeb服務(wù)器網(wǎng)關(guān)接口(Python Web Server Gateway Interface)。我們使用的是web.py框架。同類型比較強(qiáng)大的框架有Django,F(xiàn)lask等。為什么選用web.py呢,是因?yàn)樗禽p量級(jí)的,而且有著良好的xml解析功能。插句題外話,web.py的開(kāi)發(fā)者AaronH. Swartz是個(gè)十足的天才,可惜英年早逝。有個(gè)關(guān)于他的一部紀(jì)錄片,推薦看一下:互聯(lián)網(wǎng)之子。
好了,言歸正傳,我們首先編寫config.yaml
name: pifuhandashu version: 1 libraries: - name: webpy version: "0.36" - name: lxml version: "2.3.4" ...
這里我們引入了web.py框架以及l(fā)xml模塊,接著我們編寫index.wsgi文件。
# coding: utf-8 import os import sae import web from weixinInterface import WeixinInterface urls = ('/weixin','WeixinInterface') app_root = os.path.dirname(__file__) templates_root = os.path.join(app_root, 'templates') render = web.template.render(templates_root) app = web.application(urls, globals()).wsgifunc() application = sae.create_wsgi_app(app)
這里就是簡(jiǎn)單的python利用web.py網(wǎng)頁(yè)開(kāi)發(fā)的知識(shí)了。設(shè)置了根目錄,模板目錄,/weixin的路由,開(kāi)啟應(yīng)用。
為了使頁(yè)面顯得更整潔,我們?cè)傩陆艘粋€(gè)py文件weixinInterface.py(weixinInterface.py和index.wsgi在同一級(jí)目錄,見(jiàn)后面的截圖)。
- 編輯weixinInterface.py,大小寫一定要看清啊,不然很容易出錯(cuò)。注意自己填寫一個(gè)專屬的token,這個(gè)等會(huì)微信公眾號(hào)設(shè)置里面有用到。
# -*- coding: utf-8 -*- import hashlib import web import lxml import time import os import urllib2,json from lxml import etree class WeixinInterface: def __init__(self): self.app_root = os.path.dirname(__file__) self.templates_root = os.path.join(self.app_root, 'templates') self.render = web.template.render(self.templates_root) def GET(self): #獲取輸入?yún)?shù) data = web.input() signature = data.signature timestamp = data.timestamp nonce = data.nonce echostr = data.echostr #自己的token token = "XXXXXXXXXXX" #注意:填寫之后在微信公眾平臺(tái)里輸入的token!??! #字典序排序 list = [token, timestamp, nonce] list.sort() sha1 = hashlib.sha1() map(sha1.update,list) hashcode = sha1.hexdigest() #sha1加密算法 #如果是來(lái)自微信的請(qǐng)求,則回復(fù)echostr if hashcode == signature: return echostr
代碼大致講解一下,def __init__(self)是告訴我們模板文件的加載位置。 def GET(self)是應(yīng)微信公眾平臺(tái)的要求,進(jìn)行的token驗(yàn)證。這里的驗(yàn)證采用的是哈希算法。具體可參考微信官方的接口接入說(shuō)明:微信公眾平臺(tái)接入指南。里面有個(gè)php示例。本文采用的是python實(shí)現(xiàn)。
微信開(kāi)發(fā)者模式設(shè)置
基本設(shè)置
修改配置
URL一定要認(rèn)真填寫,仔細(xì)核對(duì)。
比如查看url應(yīng)用信息:
token填寫剛才新浪SAE里面填寫的token,一定要一致。EncodingAESKey可以隨機(jī)生成。填完之后點(diǎn)擊提交。如果提示“提交成功”。恭喜你,最關(guān)鍵的一步已經(jīng)完成了。這個(gè)階段可能要折騰蠻長(zhǎng)時(shí)間。完成之后,一定要啟用開(kāi)發(fā)者模式!!!!切記!!!
微信機(jī)器人實(shí)現(xiàn)
上一步完成之后,我們就可以做一些有趣的事情:微信機(jī)器人。不過(guò)在此之前,還要完成一小步:模板的創(chuàng)建。由于微信開(kāi)發(fā)是采用的xml的形式。為了先實(shí)現(xiàn)文本形式自動(dòng)回復(fù)(后面可以實(shí)現(xiàn)回復(fù)音頻,圖文信息等形式),首先新建模板文件夾templates,然后在templates文件夾下創(chuàng)建reply_text.xml文件(文件放置位置見(jiàn)后面的截圖)。根據(jù)微信消息被動(dòng)回復(fù)所示,填入以下代碼:
$def with (toUser,fromUser,createTime,Content) <xml> <ToUserName><![CDATA[$toUser]]></ToUserName> <FromUserName><![CDATA[$fromUser]]></FromUserName> <CreateTime>$createTime</CreateTime> <MsgType><![CDATA[text]]></MsgType> <Content>$content</Content> </xml>
然后,在weixinInterface.py里的def GET(self)后面編寫POST函數(shù)。該函數(shù)用來(lái)獲取用戶的ID,發(fā)送的消息類型,發(fā)送的時(shí)間等。判斷用戶發(fā)送的消息類型,如果是純文本類型,if mstype == 'text',那么可以進(jìn)行下一步操作。
def POST(self): str_xml = web.data() #獲得post來(lái)的數(shù)據(jù) xml = etree.fromstring(str_xml)#進(jìn)行XML解析 mstype = xml.find("MsgType").text#消息類型 fromUser = xml.find("FromUserName").text toUser = xml.find("ToUserName").text
為了實(shí)現(xiàn)微信機(jī)器人,我們需要實(shí)現(xiàn)自動(dòng)回復(fù)的內(nèi)容。這里有兩種方式。
- 爬取網(wǎng)上的機(jī)器人回復(fù)的內(nèi)容,比如找不到小黃雞的接口,我就自己爬蟲(chóng)爬取它的回復(fù)結(jié)果。
- 調(diào)用自動(dòng)能夠回復(fù)的機(jī)器人API。
這里我選用第二種方法,采用的是圖靈機(jī)器人的API。這種方法方便快捷,一般不會(huì)被墻。但是自由度不高,可拓展性差。
注冊(cè)圖靈機(jī)器人賬號(hào),注意是采用圖靈的網(wǎng)頁(yè)api,而不是授權(quán)。獲取圖靈機(jī)器人回復(fù)的key。幾行代碼就可以搞定微信機(jī)器人自動(dòng)回復(fù)啦~
源碼展示
index.wsgi源碼
# coding: utf-8 import os import sae import web from weixinInterface import WeixinInterface urls = ( '/weixin','WeixinInterface', ) app_root = os.path.dirname(__file__) templates_root = os.path.join(app_root, 'templates') render = web.template.render(templates_root) app = web.application(urls, globals()).wsgifunc() application = sae.create_wsgi_app(app)
config.yaml源碼
name: myzhihu version: 1 libraries: - name: webpy version: "0.36" - name: lxml version: "2.3.4" ...
templates下的reply_text.xml源碼
$def with (toUser,fromUser,createTime,content) <xml> <ToUserName><![CDATA[$toUser]]></ToUserName> <FromUserName><![CDATA[$fromUser]]></FromUserName> <CreateTime>$createTime</CreateTime> <MsgType><![CDATA[text]]></MsgType> <Content>$content</Content> </xml>
weixinInterface.py源碼
# -*- coding: utf-8 -*- import hashlib import web import lxml import time import os import json import urllib from lxml import etree class WeixinInterface: def __init__(self): self.app_root = os.path.dirname(__file__) self.templates_root = os.path.join(self.app_root, 'templates') self.render = web.template.render(self.templates_root) def GET(self): #獲取輸入?yún)?shù) data = web.input() signature=data.signature timestamp=data.timestamp nonce=data.nonce echostr=data.echostr #自己的token token="################" #這里填寫在微信公眾平臺(tái)里輸入的token #字典序排序 list=[token,timestamp,nonce] list.sort() sha1=hashlib.sha1() map(sha1.update,list) hashcode=sha1.hexdigest() #sha1加密算法 #如果是來(lái)自微信的請(qǐng)求,則回復(fù)echostr if hashcode == signature: return echostr def POST(self): str_xml = web.data() #獲得post來(lái)的數(shù)據(jù) xml = etree.fromstring(str_xml)#進(jìn)行XML解析 mstype = xml.find("MsgType").text fromUser = xml.find("FromUserName").text toUser = xml.find("ToUserName").text if mstype == 'text': content = xml.find("Content").text#獲得用戶所輸入的內(nèi)容 key = '#####################' ###圖靈機(jī)器人的key api = 'http://www.tuling123.com/openapi/api?key=' key '&info=' info = content.encode('UTF-8') url = api info page = urllib.urlopen(url) html = page.read() dic_json = json.loads(html) reply_content = dic_json['text'] return self.render.reply_text(fromUser,toUser,int(time.time()),reply_content)
尾記
本次教程實(shí)現(xiàn)了利用Python開(kāi)發(fā)微信公眾平臺(tái),能夠自動(dòng)回復(fù)用戶輸入的文字。包括了微信公眾平臺(tái)的設(shè)置,SAE的設(shè)置,相關(guān)代碼的編寫等。