摘要:寫基于和開發(fā)的失蹤兒童信息平臺。團(tuán)圓系統(tǒng)的全稱應(yīng)該是公安部兒童失蹤信息緊急發(fā)布平臺,在新浪微博上有一個官方的微博賬號,通過這個微博賬號發(fā)布兒童失蹤信息。
這是我在sf上的第一篇文章。寫基于swoole、Mixphp和CodeIgniter開發(fā)的失蹤兒童信息平臺。
在2017年的時候,關(guān)注到有一個“團(tuán)圓系統(tǒng)”,它是公安部專門為了快速擴(kuò)散失蹤兒童消息的平臺,但是網(wǎng)上并沒有找到這個平臺的地址。當(dāng)然,偶然在淘寶平臺上找到一個接口,這個接口可以取得失蹤兒童的數(shù)據(jù),后來這個接口提示不能訪問了。那么如果我想去做這樣的一個失蹤兒童信息平臺的話,就要從另外的地方獲取數(shù)據(jù)了。
團(tuán)圓系統(tǒng)的全稱應(yīng)該是公安部兒童失蹤信息緊急發(fā)布平臺,在新浪微博上有一個官方的微博賬號,通過這個微博賬號發(fā)布兒童失蹤信息。因此在實(shí)現(xiàn)“失蹤兒童信息平臺”的第一步就是從微博上去獲取數(shù)據(jù),并且這個獲取數(shù)據(jù)的程序最后能在后臺程序自動運(yùn)行,這樣就不用人工干預(yù)了。
從微博頁面抓取數(shù)據(jù)我對php語言要熟悉一些,因此在打算自己動手實(shí)現(xiàn)這個想法的時候,就選擇了php,另外之前也關(guān)注到swoole,swoole拓展了PHPer的能力范圍,不再局限于Web開發(fā)。進(jìn)而找了一個比較容易上手的基于swoole的框架MixPHP,因此,在從微博上抓取數(shù)據(jù)的程序是基于Mixphp寫的,工程結(jié)構(gòu)如下:
在apps/daemon/commands目錄下新建一個控制器IndexController.php,控制器部分代碼如下:
processName}" is running, PID : {$pid}." . PHP_EOL; } // 啟動提示 echo "mix-daemon "{$this->processName}" start successed." . PHP_EOL; // 蛻變?yōu)槭刈o(hù)進(jìn)程 if ($this->d) { Process::daemon(); } // 寫入 PID 文件 Process::writePid(self::PID_FILE); // 修改進(jìn)程名稱 Process::setName("mix-daemon: {$this->processName}"); // 開始工作 $this->startWork(); } public function startWork() { try { while (true) { //實(shí)時采集一次 $sql = "select `itemid` from items where status=:status"; $rows = mix::app()->rdb->createCommand($sql)->bindParams([ "status" => "失蹤" ])->queryAll(); if (!empty($rows)) { foreach ($rows as $row) { //采集一次失蹤的, $this->actionDetail($row["itemid"]); sleep(5); //再增量采集一次 $this->actionIncrementOnce(); } } } } catch (Exception $e) { Mix::app()->error->exception($e); sleep(10); // 休息一會,避免 cpu 出現(xiàn) 100% $this->startWork(); } } }
哦,需要提醒的是,Mixphp需要一些準(zhǔn)備條件,在官方文檔中寫的非常詳細(xì)。安裝好Mixphp之后就可以直接運(yùn)行上面的后臺程序,命令如:
./mix-daemon index/start -d
-d 表示這個進(jìn)程將在后臺運(yùn)行。
數(shù)據(jù)的抓取分為幾個部分,
批量抓取,在程序第一次運(yùn)行時會給定一些url進(jìn)行批量初始化抓取
增量抓取,會根據(jù)抓取回來的頁面內(nèi)容分析新的url,再進(jìn)行抓取新的url
補(bǔ)充抓取,意思是部分兒童的狀態(tài)為失蹤,隔一段時間之后找回來了,那么狀態(tài)也會發(fā)生變化,因此要對這些url進(jìn)行補(bǔ)充抓取。
前臺展示頁面前臺展示,相當(dāng)于做一個網(wǎng)站,使用的是CodeIgniter框架,這個框架用來做網(wǎng)站,很方便,因此我也一直在用。
整個網(wǎng)站只顯示那些仍然處于失蹤狀態(tài)的兒童的信息。頁面的效果大致是這樣的:
我在微博開發(fā)平臺注冊了一個應(yīng)用,可以調(diào)用微博的api,因此在數(shù)據(jù)抓取的程序里,在數(shù)據(jù)存到數(shù)據(jù)庫中的同時會發(fā)一條微博。調(diào)用的是share接口。使用微博的api的過程是這樣的,先使用oauth獲取到access_token,另外從微博開發(fā)平臺找到key和secret,部分代碼如下:
$c = new SaeTClientV2(WB_AKEY, WB_SKEY, $access_token); $sus = mix::app()->rdb->insert("items", $dataArray)->execute(); $insertId = Mix::app()->rdb->getLastInsertId(); $affectedRowss = Mix::app()->rdb->getRowCount(); if ($affectedRowss > 0) { $texts = "" . $dataArray["name"] . "," . $dataArray["agesex"] . "," . mb_substr($dataArray["detail"], 0, 110, "utf-8") . "..." . "如有線索,請迅速與警方聯(lián)系:" . $dataArray["policetel"] . "http://www.anman.org/index/baobei/" . $containerid; if ($weibopic) { $weibopic = $this->get_img($weibopic, mix::app()->getRuntimePath()); } $weiboRep = $c->share($texts, $weibopic); if (isset($weiboRep["id"])){ $sinaweibos = array("itemid"=>$containerid,"weiboid"=>$weiboRep["id"]); mix::app()->rdb->insert("sinaweibos",$sinaweibos)->execute(); } if ($weibopic){ unlink($weibopic); } echo date("Y-m-d H:i:s") . " " . $containerid . "微博發(fā)送成功!" . PHP_EOL; echo date("Y-m-d H:i:s") . " " . $containerid . "插入數(shù)據(jù)操作成功" . PHP_EOL; mix::app()->log->info(date("Y-m-d H:i:s") . " " . $containerid . "插入數(shù)據(jù)操作成功"); } else { mix::app()->log->error(date("Y-m-d H:i:s") . " " . $containerid . "插入操作出錯"); }
微博的效果如下:
整個實(shí)現(xiàn)過程中使用到了swoole,codeigniter框架,微博開發(fā)平臺,mysql。
后臺程序從微博中抓取數(shù)據(jù)到本地,然后根據(jù)規(guī)則通過微博api在發(fā)送微博。
有一個專門的網(wǎng)站去展示這些信息。
后面我打算試著去對這些數(shù)據(jù)做一些分析。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/28677.html
摘要:異步隊列消費(fèi)者開發(fā)只提供了模式下運(yùn)行控制器方法,并未提供主進(jìn)程多子進(jìn)程的進(jìn)程模型,并未提供多線程處理。多線程異步隊列服務(wù)只需寫好控制器方法,然后在配置文件中配置下路由命名空間進(jìn)程線程數(shù)量,就可在模式中啟動多進(jìn)程多線程模型的異步隊列處理程序。 最近業(yè)余時間一直在開發(fā)ExpressPHP的第二個版本 MixPHP,今天下班想起之前一個面試官的問題:你為什么還要再造一個輪子呢?仔細(xì)回想,第一...
摘要:由于是基于的傳統(tǒng)框架,如果使用的正常部署方式來對比,顯得有些不公平,由于同時支持在中運(yùn)行,所以此次測試的是部署在之中。你也來測試一下吧, MixPHP 是一個基于 Swoole 的高性能框架,CodeIgniter 是一個元老級的輕量級框架,Yii 是一個非常流行的框架,以下是三個框架的對比。 由于 Yii/CodeIgniter 是基于 Apache/PHP-FPM 的傳統(tǒng)框架,如果...
摘要:框架最新源代碼行數(shù)行,因此可以很容易的改造它,成為你們公司的專屬框架。也不同于其他基于的微服務(wù)框架,只聚焦于微服務(wù)治理,定位于開發(fā)的更多領(lǐng)域,覆蓋從初創(chuàng)到億元級體量的技術(shù)訴求。的授權(quán)全靠用戶自愿購買,詳情 MixPHP是什么 MixPHP 是秉承 普及 PHP 常駐內(nèi)存型解決方案,促進(jìn) PHP 往更后端發(fā)展 的理念而創(chuàng)造,采用 Swoole 擴(kuò)展作為底層引擎,圍繞常駐內(nèi)存的方式而設(shè)計,...
摘要:在多種環(huán)境中遷移,代碼無需修改,是無縫遷移的。由于大部分用戶開發(fā)是在中進(jìn)行,因此開發(fā)階段我們推薦使用部署方案,因?yàn)楦唵慰焖?,下面整體演示一下的環(huán)境搭建。安裝解壓至指定安裝目錄。先不要啟動,這會啟動會報錯,沒加環(huán)境變量。 MixPHP 是一款基于 Swoole 的常駐內(nèi)存型 PHP 高性能框架。 MixPHP 同時支持多種環(huán)境中執(zhí)行: Nginx + mix-httpd (使用到 S...
摘要:在多種環(huán)境中遷移,代碼無需修改,是無縫遷移的。由于大部分用戶開發(fā)是在中進(jìn)行,因此開發(fā)階段我們推薦使用部署方案,因?yàn)楦唵慰焖?,下面整體演示一下的環(huán)境搭建。安裝解壓至指定安裝目錄。先不要啟動,這會啟動會報錯,沒加環(huán)境變量。 MixPHP 是一款基于 Swoole 的常駐內(nèi)存型 PHP 高性能框架。 MixPHP 同時支持多種環(huán)境中執(zhí)行: Nginx + mix-httpd (使用到 S...
閱讀 1981·2023-04-25 15:45
閱讀 1218·2021-09-29 09:34
閱讀 2508·2021-09-03 10:30
閱讀 2015·2019-08-30 15:56
閱讀 1470·2019-08-29 15:31
閱讀 1275·2019-08-29 15:29
閱讀 3207·2019-08-29 11:24
閱讀 3065·2019-08-26 13:45