Python之celery的簡介與使用

LeexMuller 發(fā)布于2019-07-31 10:02 / 2381人閱讀

摘要：的簡介是一個基于分布式消息傳輸?shù)漠惒饺蝿贞犃校鼘Ｗ⒂趯崟r處理，同時也支持任務調(diào)度。目前支持等作為消息代理，但適用于生產(chǎn)環(huán)境的只有和官方推薦。任務處理完后保存狀態(tài)信息和結果，以供查詢。

celery的簡介

??celery是一個基于分布式消息傳輸?shù)漠惒饺蝿贞犃?，它專注于實時處理，同時也支持任務調(diào)度。它的執(zhí)行單元為任務（task），利用多線程，如Eventlet，gevent等，它們能被并發(fā)地執(zhí)行在單個或多個職程服務器（worker servers）上。任務能異步執(zhí)行（后臺運行）或同步執(zhí)行（等待任務完成）。
??在生產(chǎn)系統(tǒng)中，celery能夠一天處理上百萬的任務。它的完整架構圖如下：

組件介紹：

Producer：調(diào)用了Celery提供的API、函數(shù)或者裝飾器而產(chǎn)生任務并交給任務隊列處理的都是任務生產(chǎn)者。

Celery Beat：任務調(diào)度器，Beat進程會讀取配置文件的內(nèi)容，周期性地將配置中到期需要執(zhí)行的任務發(fā)送給任務隊列。

Broker：消息代理，又稱消息中間件，接受任務生產(chǎn)者發(fā)送過來的任務消息，存進隊列再按序分發(fā)給任務消費方（通常是消息隊列或者數(shù)據(jù)庫）。Celery目前支持RabbitMQ、Redis、MongoDB、Beanstalk、SQLAlchemy、Zookeeper等作為消息代理，但適用于生產(chǎn)環(huán)境的只有RabbitMQ和Redis, 官方推薦 RabbitMQ。

Celery Worker：執(zhí)行任務的消費者，通常會在多臺服務器運行多個消費者來提高執(zhí)行效率。

Result Backend：任務處理完后保存狀態(tài)信息和結果，以供查詢。Celery默認已支持Redis、RabbitMQ、MongoDB、Django ORM、SQLAlchemy等方式。

??在客戶端和消費者之間傳輸數(shù)據(jù)需要序列化和反序列化。 Celery 支出的序列化方案如下所示:

準備工作

??在本文中，我們使用的celery的消息代理和后端存儲數(shù)據(jù)庫都使用redis，序列化和反序列化選擇msgpack。
??首先，我們需要安裝redis數(shù)據(jù)庫，具體的安裝方法可參考：http://www.runoob.com/redis/r... 。啟動redis，我們會看到如下界面：

在redis可視化軟件rdm中，我們看到的數(shù)據(jù)庫如下：

里面沒有任何數(shù)據(jù)。
??接著，為了能夠在python中使用celery，我們需要安裝以下模塊：

celery

redis

msgpack

這樣，我們的準備工作就完畢了。

一個簡單的例子

??我們創(chuàng)建的工程名稱為proj，結構如下圖：

??首先是主程序app_test.py，代碼如下：

from celery import Celery

app = Celery("proj", include=["proj.tasks"])
app.config_from_object("proj.celeryconfig")

if __name__ == "__main__":
    app.start()

分析一下這個程序：

"from celery import Celery"是導入celery中的Celery類。

app是Celery類的實例，創(chuàng)建的時候添加了proj.tasks這個模塊，也就是包含了proj/tasks.py這個文件。

把Celery配置存放進proj/celeryconfig.py文件，使用app.config_from_object加載配置。

??接著是任務函數(shù)文件tasks.py，代碼如下：

import time
from proj.app_test import app

@app.task
def add(x, y):
    time.sleep(1)
    return x + y

tasks.py只有一個任務函數(shù)add，讓它生效的最直接的方法就是添加app.task這個裝飾器。add的功能是先休眠一秒，然后返回兩個數(shù)的和。

??接著是配置文件celeryconfig.py，代碼如下：

BROKER_URL = "redis://localhost" # 使用Redis作為消息代理

CELERY_RESULT_BACKEND = "redis://localhost:6379/0" # 把任務結果存在了Redis

CELERY_TASK_SERIALIZER = "msgpack" # 任務序列化和反序列化使用msgpack方案

CELERY_RESULT_SERIALIZER = "json" # 讀取任務結果一般性能要求不高，所以使用了可讀性更好的JSON

CELERY_TASK_RESULT_EXPIRES = 60 * 60 * 24 # 任務過期時間

CELERY_ACCEPT_CONTENT = ["json", "msgpack"] # 指定接受的內(nèi)容類型

??最后是調(diào)用文件diaoyong.py，代碼如下：

from proj.tasks import add
import time

t1 = time.time()

r1 = add.delay(1, 2)
r2 = add.delay(2, 4)
r3 = add.delay(3, 6)
r4 = add.delay(4, 8)
r5 = add.delay(5, 10)

r_list = [r1, r2, r3, r4, r5]
for r in r_list:
    while not r.ready():
        pass
    print(r.result)

t2 = time.time()

print("共耗時：%s" % str(t2-t1))

在這個程序中，我們調(diào)用了add函數(shù)五次，delay()用來調(diào)用任務。

例子的運行

??到此為止，我們已經(jīng)理解了整個項目的結構與代碼。
??接下來，我們嘗試著把這個項目運行起來。
??首先，我們需要啟動redis。接著，切換至proj項目所在目錄，并運行命令：

celery -A proj.app_test worker -l info

界面如下：

然后，我們運行diaoyong.py，輸出的結果如下：

3
6
9
12
15
共耗時：1.1370790004730225

后臺輸出如下：

接著，我們看一下rdm中的數(shù)據(jù)：

至此，我們已經(jīng)成功運行了這個項目。
??下面，我們嘗試著對這個運行結果做些分析。首先，我們一次性調(diào)用了五次add函數(shù)，但是運行的總時間才1秒多。這是celery異步運行的結果，如果是同步運行，那么，至少需要5秒多，因為每調(diào)用add函數(shù)一次，就會休眠一秒。這就是celery的強大之處。
??從后臺輸出可以看到，程序會先將任務分發(fā)出來，每個任務一個ID，在后臺統(tǒng)一處理，處理完后會有相應的結果返回，同時該結果也會儲存之后臺數(shù)據(jù)庫?？梢岳胷eady()判斷任務是否執(zhí)行完畢，再用result獲取任務的結果。
??本文項目的github地址為：https://github.com/percent4/c... 。
??本次分享到此結束，感謝閱讀~
??注意：本人現(xiàn)已開通微信公眾號： Python爬蟲與算法（微信號為：easy_web_scrape），歡迎大家關注哦~~

參考文獻

Celery 初步：http://docs.jinkan.org/docs/c...

使用Celery：https://zhuanlan.zhihu.com/p/...

異步神器celery：https://www.jianshu.com/p/9be...

GPU云服務器云服務器一之新功能簡介 Django下使用celery 異步發(fā)送使用簡介 hbase的安裝與使用

文章版權歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/43139.html

Python爬蟲之使用celery加速爬蟲

摘要：是一個基于分布式消息傳輸?shù)漠惒饺蝿贞犃校鼘Ｗ⒂趯崟r處理，同時也支持任務調(diào)度。本文將介紹如何使用來加速爬蟲。本文爬蟲的例子來自文章爬蟲的種姿勢。雖然沒有這個爬蟲框架和異步框架來的快，但這也可以作為一種爬蟲的思路。 ??celery是一個基于分布式消息傳輸?shù)漠惒饺蝿贞犃校鼘Ｗ⒂趯崟r處理，同時也支持任務調(diào)度。關于celery的更多介紹及例子，筆者可以參考文章Python之celery的簡...

baihe 2019-07-31 10:02 評論0 收藏0
一個 Reentrant Error 引發(fā)的對 Python 信號機制的探索和思考

摘要：倘若該回答是正確的，則立即有如下推論在處理信號的過程中，字節(jié)碼具有原子性。因此，除了在兩個字節(jié)碼之間，應該還有其他時機喚起了。行的是信號處理函數(shù)的最外層包裝，由系統(tǒng)調(diào)用或注冊至內(nèi)核，并在信號發(fā)生時被內(nèi)核回調(diào)，是異?？刂屏鞯娜肟凇? 寫在前面前幾天工作時遇到了一個匪夷所思的問題。經(jīng)過幾次嘗試后問題得以解決，但問題產(chǎn)生的原因卻仍令人費解。查找 SO 無果，我決定翻看 Python 的源碼。...

shiguibiao 2019-07-30 14:28 評論0 收藏0
低調(diào)奢華有內(nèi)涵 - 收藏集 - 掘金

摘要：比較的是兩個對象的內(nèi)容是并發(fā)編程之協(xié)程異步后端掘金引言隨著的盛行，相信大家今年多多少少都聽到了異步編程這個概念。使用進行并發(fā)編程篇二掘金我們今天繼續(xù)深入學習。 python 之機器學習庫 scikit-learn - 后端 - 掘金一、加載sklearn中的數(shù)據(jù)集datasets from sklearn import datasets iris = datasets.load_i...

walterrwu 2019-07-25 12:00 評論0 收藏0

發(fā)表評論

登陸后可評論

0條評論

LeexMuller

男|高級講師

我要關注我要私信

TA的文章

tensorflow.example

閱讀 3302·2023-04-26 01:31
tensorflow.examples.tutorials

閱讀 1922·2023-04-25 22:08
寶塔面板Nginx通過User-Agent禁止爬蟲采集并返回炸彈

閱讀 3512·2021-09-01 11:42
這網(wǎng)站傻了嗎？這兩天老是點擊提問，就彈回主頁....什么意思

閱讀 2857·2019-08-30 12:58
前端小姿勢

閱讀 2212·2019-08-29 18:31
【css】圣杯布局

閱讀 2462·2019-08-29 17:18
React結合webpack的具體使用

閱讀 3092·2019-08-29 13:01
前端webpack workflow（二）——Webpack基本使用

閱讀 2580·2019-08-28 18:22

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python之celery的簡介與使用

相關文章

Python爬蟲之使用celery加速爬蟲

**一個 Reentrant Error 引發(fā)的對 Python 信號機制的探索和思考**

低調(diào)奢華有內(nèi)涵 - 收藏集 - 掘金

發(fā)表評論

0條評論

LeexMuller

男|高級講師

TA的文章

tensorflow.example

tensorflow.examples.tutorials

寶塔面板Nginx通過User-Agent禁止爬蟲采集并返回炸彈

這網(wǎng)站傻了嗎？這兩天老是點擊提問，就彈回主頁....什么意思

前端小姿勢

【css】圣杯布局

React結合webpack的具體使用

前端webpack workflow（二）——Webpack基本使用

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python之celery的簡介與使用

相關文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！