摘要:安裝配置文件內(nèi)容如下守護進程,用這個的原因?qū)嵲谑且驗樘嗳趿?,一看不住就掛了安裝配置導(dǎo)入默認配置鏈接管理設(shè)置管理進程啟動創(chuàng)建文件內(nèi)容如下啟動查看如一切正常常用命令查看狀態(tài)重新載入重啟任務(wù)可以更新配置檢查日志爬蟲部署部署項目目錄
scrapyd 安裝:
sudo pip install scrapyd配置:
#文件~/.scrapyd.conf #內(nèi)容如下: [scrapyd] eggs_dir = /home/sirius/scrapyd/eggs logs_dir = /home/sirius/scrapyd/logs items_dir = /home/sirius/scrapyd/items jobs_to_keep = 5 dbs_dir = /home/sirius/scrapyd/dbs max_proc = 0 max_proc_per_cpu = 4 finished_to_keep = 50 poll_interval = 5 bind_address = 0.0.0.0 http_port = 6800 debug = off runner = scrapyd.runner application = scrapyd.app.application launcher = scrapyd.launcher.Launcher webroot = scrapyd.website.Root [services] schedule.json = scrapyd.webservice.Schedule cancel.json = scrapyd.webservice.Cancel addversion.json = scrapyd.webservice.AddVersion listprojects.json = scrapyd.webservice.ListProjects listversions.json = scrapyd.webservice.ListVersions listspiders.json = scrapyd.webservice.ListSpiders delproject.json = scrapyd.webservice.DeleteProject delversion.json = scrapyd.webservice.DeleteVersion listjobs.json = scrapyd.webservice.ListJobs #daemonstatus.json = scrapyd.webservice.DaemonStatussupervisor
安裝:守護進程,用這個的原因?qū)嵲谑且驗閟crapyd太脆弱了,一看不住就掛了
sudo pip install supervisor配置:
sudo mkdir -p /etc/supervisor/ #導(dǎo)入默認配置 sudo su - root -c "echo_supervisord_conf > /etc/supervisor/supervisord.conf" #鏈接管理 [inet_http_server] ; inet (TCP) server disabled by default port=127.0.0.1:9001 ; (ip_address:port specifier, *:port for all iface) ;username=user ; (default is no username (open server)) ;password=123 ; (default is no password (open server)) [supervisorctl] ;serverurl=unix:///tmp/supervisor.sock ; use a unix:// URL for a unix socket serverurl=http://127.0.0.1:9001 ; use an http:// url to specify an inet socket ;username=chris ; should be same as http_username if set ;password=123 ; should be same as http_password if set ;prompt=mysupervisor ; cmd line prompt (default "supervisor") ;history_file=~/.sc_history ; use readline history if available #設(shè)置管理進程 [program:scrapyd] command=scrapyd autostart=true autorestart=unexpected啟動
`創(chuàng)建文件/usr/lib/systemd/system/supervisord.service內(nèi)容如下: [Unit] Description=supervisord - Supervisor process control system for UNIX Documentation=http://supervisord.org After=network.target [Service] Type=forking ExecStart=/usr/bin/supervisord -c /etc/supervisor/supervisord.conf ExecReload=/usr/bin/supervisorctl reload ExecStop=/usr/bin/supervisorctl shutdown User=[Install] WantedBy=multi-user.target #啟動 sudo systemctl enable supervisord sudo systemctl start supervisord #查看 supervisorctl #如一切正常 |>$ scrapyd RUNNING pid 8059, uptime 0:02:02
#常用命令 status #查看狀態(tài) reload #重新載入 restart scrapyd #重啟任務(wù) update #可以更新 supervisor 配置 tail -f scrapyd stderr #檢查日志爬蟲部署: 部署:
cd <項目目錄> scrapyd-deployAPI控制:
curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/18841.html
摘要:安裝配置文件內(nèi)容如下守護進程,用這個的原因?qū)嵲谑且驗樘嗳趿?,一看不住就掛了安裝配置導(dǎo)入默認配置鏈接管理設(shè)置管理進程啟動創(chuàng)建文件內(nèi)容如下啟動查看如一切正常常用命令查看狀態(tài)重新載入重啟任務(wù)可以更新配置檢查日志爬蟲部署部署項目目錄 scrapyd 安裝: sudo pip install scrapyd 配置: #文件~/.scrapyd.conf #內(nèi)容如下: [scrapyd] egg...
摘要:用途廣泛,可以用于數(shù)據(jù)挖掘監(jiān)測和自動化測試。運行下,發(fā)現(xiàn)數(shù)據(jù)全部存到了數(shù)據(jù)庫中。提供了一些接口來查看項目爬蟲情況,以及執(zhí)行或者停止執(zhí)行爬蟲。完成小程序所需要的所有接口的開發(fā),以及使用定時任務(wù)執(zhí)行爬蟲腳本。 過完年回來,業(yè)余時間一直在獨立開發(fā)一個小程序。主要數(shù)據(jù)是8000+個視頻和10000+篇文章,并且數(shù)據(jù)會每天自動更新。 我會整理下整個開發(fā)過程中遇到的問題和一些細節(jié)問題,因為內(nèi)容會比...
摘要:折騰原因之前都是遠程連接服務(wù)器,然后在命令行運行,一旦關(guān)閉遠程連接,爬蟲就會停止,很不爽,畢竟能讓一個爬蟲在服務(wù)器一直跑才是每個小白的夢想,所以開始研究如何使程序在后臺運行,剛開始看了,感覺不好用,又搜了搜,發(fā)現(xiàn)了這個進程管理程序。 折騰原因 之前都是遠程連接服務(wù)器,然后在命令行運行scrapy crawl spider,一旦關(guān)閉遠程連接,爬蟲就會停止,很不爽,畢竟能讓一個爬蟲在服務(wù)器...
摘要:以上示例代表當(dāng)發(fā)現(xiàn)條或條以上的級別的時,自動停止當(dāng)前任務(wù),如果當(dāng)前時間在郵件工作時間內(nèi),則同時發(fā)送通知郵件。 showImg(https://segmentfault.com/img/remote/1460000018052810); 一、需求分析 初級用戶: 只有一臺開發(fā)主機 能夠通過 Scrapyd-client 打包和部署 Scrapy 爬蟲項目,以及通過 Scrapyd JS...
閱讀 2499·2021-11-11 16:54
閱讀 2709·2021-09-26 09:47
閱讀 4039·2021-09-08 09:36
閱讀 2797·2021-07-25 21:37
閱讀 965·2019-08-30 15:54
閱讀 2586·2019-08-30 14:22
閱讀 3301·2019-08-30 13:57
閱讀 2783·2019-08-29 17:17