摘要:本著開源精神和方便用戶,現(xiàn)已將微信公眾號文章采集系統(tǒng)打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。規(guī)則代碼主要的邏輯是對于微信公眾號的請求進(jìn)行攔截,把數(shù)據(jù)轉(zhuǎn)發(fā)到。這里主要是作為服務(wù)器來處理攔截的請求,處理微信文章數(shù)據(jù)和點贊數(shù)閱讀數(shù)。
本著開源精神和方便用戶,現(xiàn)已將"微信公眾號文章采集系統(tǒng)"打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。
系統(tǒng)鏡像有6個G,只能通過種子的形式下載了, 鏡像種子下載地址
鏈接: https://pan.baidu.com/s/1bq9rhO7 密碼: 7r4d
首先要感謝飯口組組長 把他的采集方案開源出來 。
這里能夠稱之為系統(tǒng)是因為涉及到的技術(shù)很多,這里一一羅列:
1、anyproxy 阿里巴巴開源的代理攔截器,使用的是4.0的版本,可以很方便的修改 response 信息。anyproxy 我在系統(tǒng)中已經(jīng)安裝好了,安裝也很簡單,先安裝nodejs環(huán)境,然后用npm安裝anyproxy.
anyproxy 4.0開始規(guī)則可以作為模塊來開發(fā),寫好了規(guī)則代碼之后,不用動原來的代碼,只需要在anproxy的參數(shù)帶上規(guī)則文件。這里用到的命令 anproxy --rule weixin.js。 關(guān)于anproxy如何設(shè)置https 證書問題,可以參考官網(wǎng)。我在虛擬機(jī)中設(shè)置了全局的代理,所以需要 anyproxy 打開后才能,8001端口可以訪問請求才能成功。
規(guī)則代碼主要的邏輯是對于微信公眾號的請求進(jìn)行攔截,把數(shù)據(jù)轉(zhuǎn)發(fā)到 php。
2、apache+php+mysql 這里主要是作為web服務(wù)器來處理anyproxy 攔截的請求,處理微信文章數(shù)據(jù)和點贊數(shù)、閱讀數(shù)。
攔截過來的數(shù)據(jù)的處理可以看具體的php代碼,邏輯不算太復(fù)雜。這里為了方便使用的是phpstudy的集成開發(fā)環(huán)境。
3、按鍵精靈,按鍵精靈是國產(chǎn)的一種類似vb語法的模擬鍵盤鼠標(biāo)的工具。這里用到按鍵精靈來模擬點擊windows下的微信客戶端。
在處理多個微信公眾號的時候,需要客戶端來點擊,把所有的手動操作通過按鍵精靈來模擬出來。去查看具體的代碼的時候,我在處理點擊歷史消息使用了一個小技巧,事實是開始想通過直接通過識別圖片的辦法來找到 “歷史消息” 按鈕的位置,但是發(fā)現(xiàn)怎么也找不到,然后只能 循環(huán)向下移動鼠標(biāo),直到區(qū)域內(nèi)找到特定的顏色,就是“歷史消息”按鈕。
在一條思路行不通的時候,就要嘗試其他思路。整個系統(tǒng)就是做下來,就是要處理這種看似行得通,實際不通,然后再去嘗試,如此反復(fù)。
4、windows 微信客戶端,其實我嘗試過用安卓模擬器,因為我的目標(biāo)是開箱即用,所以需要把所有的程序都能夠裝到一起,但是在虛擬機(jī)中是沒法安裝安卓模擬器,也就是說虛擬機(jī)中是沒法做二次虛擬的。這個坑我已經(jīng)踩過了,大家就不用踩了,記得之前有人問過,阿里云windows服務(wù)器能不能裝 安卓模擬器,我想答案是一樣的,虛擬機(jī)不能做二次虛擬化,阿里云windows服務(wù)器不能裝安卓模擬器。
所以,當(dāng)我嘗試安卓模擬器后,發(fā)現(xiàn)原來微信pc客戶端(包括mac)的功能已經(jīng)做的很完善了,然后就去嘗試windows客戶端。
5、virtualbox 虛擬機(jī),這個是甲骨文公司出的虛擬機(jī)。會涉及到一些網(wǎng)絡(luò)的配置,比如設(shè)置為NAT模式。
現(xiàn)在把虛擬機(jī)鏡像開源出來,里面所有的代碼都在虛擬機(jī)中,大家可以隨意修改。
從最開始知道公眾號文章采集到知道實現(xiàn)原理,再到最后做出鏡像,中間經(jīng)歷過各種困難,耗時耗力,請教各種人,甚至吃飯睡覺都在想某個細(xì)節(jié)的解決方案,有解決問題的快樂,有被問題纏繞時的苦惱,感謝這個過程中給予過幫助人。
在安裝使用過程中遇到什么問題可以加我微信 ( liuhan199012 )
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/25551.html
摘要:本著開源精神和方便用戶,現(xiàn)已將微信公眾號文章采集系統(tǒng)打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。規(guī)則代碼主要的邏輯是對于微信公眾號的請求進(jìn)行攔截,把數(shù)據(jù)轉(zhuǎn)發(fā)到。這里主要是作為服務(wù)器來處理攔截的請求,處理微信文章數(shù)據(jù)和點贊數(shù)閱讀數(shù)。 本著開源精神和方便用戶,現(xiàn)已將微信公眾號文章采集系統(tǒng)打包成虛擬機(jī),你只需下載安裝虛擬機(jī)鏡像,即可使用。 系統(tǒng)鏡像有6個G,只能通過種子的形式下載了, ...
摘要:極致的插件機(jī)制,系統(tǒng)內(nèi)的系統(tǒng),安裝和卸載不會對原來的系統(tǒng)產(chǎn)生影響強(qiáng)大的功能完全滿足各階段的需求,支持用戶多端訪問后臺微信前臺等,系統(tǒng)中的系統(tǒng)。多入口模式,多入口分為后臺前端,微信,對內(nèi)接口,對外接口,不同的業(yè)務(wù),不同的設(shè)備,進(jìn)入不同的入口。 RageFrame 2.0 為二次開發(fā)而生,讓開發(fā)變得更簡單 項目地址:https://github.com/jianyan74/... 前言 這...
摘要:極致的插件機(jī)制,系統(tǒng)內(nèi)的系統(tǒng),安裝和卸載不會對原來的系統(tǒng)產(chǎn)生影響強(qiáng)大的功能完全滿足各階段的需求,支持用戶多端訪問后臺微信前臺等,系統(tǒng)中的系統(tǒng)。多入口模式,多入口分為后臺前端,微信,對內(nèi)接口,對外接口,不同的業(yè)務(wù),不同的設(shè)備,進(jìn)入不同的入口。 RageFrame 2.0 為二次開發(fā)而生,讓開發(fā)變得更簡單 項目地址:https://github.com/jianyan74/... 前言 這...
摘要:我從年就開始做微信公眾號內(nèi)容的批量采集,最開始的目的是為了做一個的垃圾內(nèi)容網(wǎng)站。經(jīng)過實測的微信客戶端在批量采集過程中崩潰率高于安卓系統(tǒng)。在年年初的時候微信公眾號和微信文章開始使用鏈接。 我從2014年就開始做微信公眾號內(nèi)容的批量采集,最開始的目的是為了做一個html5的垃圾內(nèi)容網(wǎng)站。當(dāng)時垃圾站采集到的微信公眾號的內(nèi)容很容易在公眾號里面?zhèn)鞑?。?dāng)時批量采集特別好做,采集入口是公眾號的歷史消...
閱讀 3237·2021-11-11 16:55
閱讀 2507·2021-10-13 09:39
閱讀 2430·2021-09-13 10:27
閱讀 2165·2019-08-30 15:55
閱讀 3095·2019-08-30 15:54
閱讀 3139·2019-08-29 16:34
閱讀 1833·2019-08-29 12:41
閱讀 1075·2019-08-29 11:33