摘要:概述技術(shù)棧錯誤詳情報警機器人經(jīng)常有如下警告過程確定報錯位置有日志就很好辦首先看日志在哪里打的從三個地方入手我們自己的代碼沒有的代碼從上下來沒有的代碼在容器中執(zhí)行
bug概述 技術(shù)棧
nginx
uwsgi
bottle
錯誤詳情報警機器人經(jīng)常有如下警告:
<27>1 2018-xx-xxT06:59:03.038Z 660ece0ebaad admin/admin 14 - - Socket Error: 104 <31>1 2018-xx-xxT06:59:03.038Z 660ece0ebaad admin/admin 14 - - Removing timeout for next heartbeat interval <28>1 2018-xx-xxT06:59:03.039Z 660ece0ebaad admin/admin 14 - - Socket closed when connection was open <31>1 2018-xx-xxT06:59:03.039Z 660ece0ebaad admin/admin 14 - - Added: {"callback":debug過程 確定報錯位置>, "only": None, "one_shot": True, "arguments": None, "calls": 1} <28>1 2018-xx-xxT06:59:03.039Z 660ece0ebaad admin/admin 14 - - Disconnected from RabbitMQ at xx_host:5672 (0): Not specified <31>1 2018-xx-xxT06:59:03.039Z 660ece0ebaad admin/admin 14 - - Processing 0:_on_connection_closed <31>1 2018-xx-xxT06:59:03.040Z 660ece0ebaad admin/admin 14 - - Calling > for "0:_on_connection_closed"
有日志就很好辦, 首先看日志在哪里打的. 從三個地方入手.
我們自己的代碼沒有.
uwsgi的代碼root@660ece0ebaad:/# uwsgi --version
2.0.14
從github上co下來, 沒有.
在容器中執(zhí)行
>>> import sys >>> sys.path ["", "/usr/lib/python2.7", "/usr/lib/python2.7/plat-x86_64-linux-gnu", "/usr/lib/python2.7/lib-tk", "/usr/lib/python2.7/lib-old", "/usr/lib/python2.7/lib-dynload", "/usr/local/lib/python2.7/dist-packages", "/usr/lib/python2.7/dist-packages", "/usr/lib/python2.7/dist-packages/PILcompat", "/usr/lib/python2.7/dist-packages/gtk-2.0"]
在這些目錄下grep, 在pika中找到
root@660ece0ebaad:/usr/local/lib/python2.7# grep "Socket Error" -R . Binary file ./dist-packages/pika/adapters/base_connection.pyc matches ./dist-packages/pika/adapters/base_connection.py: LOGGER.error("Fatal Socket Error: %r", error_value) ./dist-packages/pika/adapters/base_connection.py: LOGGER.error("Socket Error: %s", error_code)
確定pika版本.
>>> import pika >>> pika.__version__ "0.10.0"確定錯誤邏輯
通過代碼可以看到, Socket Error是errno的錯誤碼, 確定錯誤碼含義是對端發(fā)送了RST.
>>> import errno >>> errno.errorcode[104] "ECONNRESET"
懷疑rabbitmq server地址錯誤, 一個未listen的端口是會返回RST的, 驗證后發(fā)現(xiàn)不是.
接著懷疑鏈接超時斷開未通知客戶端之類. 看rabbitmq server日志, 發(fā)現(xiàn)大量:
=ERROR REPORT==== 7-Dec-2018::20:43:18 === closing AMQP connection <0.9753.18> (172.17.0.19:27542 -> 192.168.44.112:5672): missed heartbeats from client, timeout: 60s -- =ERROR REPORT==== 7-Dec-2018::20:43:18 === closing AMQP connection <0.9768.18> (172.17.0.19:27544 -> 192.168.44.112:5672): missed heartbeats from client, timeout: 60s
發(fā)現(xiàn)rabbitmq server和 admin docker的鏈接已經(jīng)全部斷開
root@xxxxxxx:/home/dingxinglong# netstat -nap | grep 5672 | grep "172.17.0.19"
那么, 為什么rabbitmq server會踢掉 pika建立的鏈接呢? 看pika代碼注釋:
:param int heartbeat_interval: How often to send heartbeats. Min between this value and server"s proposal will be used. Use 0 to deactivate heartbeats and None to accept server"s proposal.
我們沒有傳入心跳間隔, 理論上應(yīng)該使用服務(wù)端默認的60S. 實際上, 客戶端從來沒有發(fā)出過心跳包. 于是繼續(xù)看代碼:
通過打印, 確認了HeartbeatChecker對象成功創(chuàng)建, 也成功地創(chuàng)建了timer, 但是timer從來沒有回調(diào)過.
從代碼一路跟下去, 我們用的是blocking_connections, 在其add_timeout注釋中看到:
def add_timeout(self, deadline, callback_method): """Create a single-shot timer to fire after deadline seconds. Do not confuse with Tornado"s timeout where you pass in the time you want to have your callback called. Only pass in the seconds until it"s to be called. NOTE: the timer callbacks are dispatched only in the scope of specially-designated methods: see `BlockingConnection.process_data_events` and `BlockingChannel.start_consuming`. :param float deadline: The number of seconds to wait to call callback :param callable callback_method: The callback method with the signature callback_method()
timer的觸發(fā)要靠process_data_events, 而我們沒有調(diào)用. 所以客戶端的heartbeat從來沒被觸發(fā). 簡單地將heartbeat關(guān)掉以解決這個問題.
具體觸發(fā)點調(diào)用代碼如下: 沒有跑main_loop, 故, 沒處理 rabbitmq_server的FIN包, 無法跟蹤鏈接狀態(tài).
一路跟蹤basic_publish接口的代碼.
在發(fā)送時, 收到RST, 最終跑到 base_connection.py:452, _handle_error函數(shù)中打印socket_error.
def connect_mq(): mq_conf = xxxxx connection = pika.BlockingConnection( pika.ConnectionParameters(mq_conf["host"], int(mq_conf["port"]), mq_conf["path"], pika.PlainCredentials(mq_conf["user"], mq_conf["pwd"]), heartbeat_interval=0)) channel = connection.channel() channel.exchange_declare(exchange=xxxxx, type="direct", durable=True) return channel channel = connect_mq() def notify_xxxxx(): global channel def _publish(product): channel.basic_publish(exchange=xxxxx, routing_key="xxxxx", body=json.dumps({"msg": "xxxxx"}))
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/42991.html
摘要:默認情況下,它是。它也是一個安全度量,所以調(diào)整為你的應(yīng)用需要,而不是最大輸出。在運行的時候會把中的靜態(tài)文件拷貝到這個目錄中達到從開發(fā)環(huán)境到生產(chǎn)環(huán)節(jié)過程中移植靜態(tài)文件的作用。 本文由云+社區(qū)發(fā)表本文主要講述了如何一步步在生產(chǎn)環(huán)境上部署django和vue,操作系統(tǒng)默認為centos 說明:后文中出現(xiàn)的以下字符串均表示具體的路徑或者名稱,含義如下: DJANGO_DIR----表示dj...
摘要:默認情況下,它是。它也是一個安全度量,所以調(diào)整為你的應(yīng)用需要,而不是最大輸出。在運行的時候會把中的靜態(tài)文件拷貝到這個目錄中達到從開發(fā)環(huán)境到生產(chǎn)環(huán)節(jié)過程中移植靜態(tài)文件的作用。 本文由云+社區(qū)發(fā)表本文主要講述了如何一步步在生產(chǎn)環(huán)境上部署django和vue,操作系統(tǒng)默認為centos 說明:后文中出現(xiàn)的以下字符串均表示具體的路徑或者名稱,含義如下: DJANGO_DIR----表示dj...
摘要:開始重現(xiàn)客戶端指令其實這次請求的一些貓膩很容易就能發(fā)現(xiàn)在中有空格。而在函數(shù)中,做的主要事情就是來解析數(shù)據(jù)包,在解析完成后執(zhí)行一下回調(diào)函數(shù)。具體的一些回調(diào)函數(shù)就不細講了,有興趣的童鞋可自行翻閱。如代碼片段所示,前文中所對應(yīng)的函數(shù)就是了。 本文首發(fā)于知乎專欄螞蟻金服體驗科技。 首先聲明,我在Bug字眼上加了引號,自然是為了說明它并非一個真 Bug。 問題拋出 昨天有個童鞋在看后臺監(jiān)控的時候...
摘要:停掉一臺,查看負載均衡健康檢查是否正常搭建集群創(chuàng)建需使用的數(shù)據(jù)庫啟動訪問增加訪問控制。給配置負載均衡,增加配置重啟訪問添加主機,添加容器,測試是否正常,惡意掉容器或者關(guān)閉機器,查看整個集群是否正常。 rancher高可用集群搭建 一、搭建環(huán)境 1.安裝系統(tǒng) 下載centos最新版, http://mirrors.sohu.com/centos/7/isos/x86_64/CentOS...
閱讀 2444·2021-10-09 09:44
閱讀 3817·2021-09-22 15:43
閱讀 2934·2021-09-02 09:47
閱讀 2556·2021-08-12 13:29
閱讀 3879·2019-08-30 15:43
閱讀 1689·2019-08-30 13:06
閱讀 2195·2019-08-29 16:07
閱讀 2756·2019-08-29 15:23