摘要:對應(yīng)的,服務(wù)端返回第六個請求為方式的請求,用來獲取服務(wù)端對第五個請求的響應(yīng)。但是,官方的解決方案是每個進(jìn)程的服務(wù)器創(chuàng)建不同端口的服務(wù)器,專注用于握手和升級,由做握手請求的代理。
可以收藏我的博客
socket.io與cluster在線上系統(tǒng)中,需要使用node的多進(jìn)程模型,我們可以自己實現(xiàn)簡易的基于cluster模式的socket分發(fā)模型,也可以使用比較穩(wěn)定的pm2這樣進(jìn)程管理工具。在常規(guī)的http服務(wù)中,這套模式一切正常,可是一旦server中集成了socket.io服務(wù)就會導(dǎo)致ws通道建立失敗,即使通過backup的polling方式仍會出現(xiàn)時斷時連的現(xiàn)象,因此我們需要解決這種問題,讓socket.io充分利用多核。
場景重現(xiàn)在這里之所以提到socket.io而未說websocket服務(wù),是因為socket.io在封裝websocket基礎(chǔ)上又保證了可用性。在客戶端未提供websocket功能的基礎(chǔ)上使用xhr polling、jsonp或forever iframe的方式進(jìn)行兼容,同時在建立ws連接前往往通過幾次http輪訓(xùn)確保ws服務(wù)可用,因此socket.io并不等于websocket。再往底層深入研究,socket.io其實并沒有做真正的websocket兼容,而是提供了上層的接口以及namespace服務(wù),真正的邏輯則是在“engine.io”模塊。該模塊實現(xiàn)握手的http代理、連接升級、心跳、傳輸方式等,因此研究engine.io模塊才能清楚的了解socket.io實現(xiàn)機(jī)制。
服務(wù)端采用express+socket.io的組合方案,搭配pm2的cluster模式,實現(xiàn)一個簡易的b/s通信demo:
app.js
var path = require("path"); var app = require("express")(), server = require("http").createServer(app), io = require("socket.io")(server); io .on("connection", function(socket) { socket.on("disconnect", function() { console.log("/: disconnect-------->") }); socket.on("b:message", function() { socket.emit("s:message", "/: "+port); console.log("/: "+port) }); }); io.of("/ws") .on("connection", function(socket) { socket.on("disconnect", function() { console.log("/ws: disconnect-------->") }); socket.on("b:message", function() { socket.emit("/ws: message", port); }); }); app.get("/page",function(req,res){ res.sendFile(path.join(process.cwd(),"./index.html")); }); server.listen(8080);
index.html
pm2.json
{ "apps": [ { "name": "ws", "script": "./app.js", "env": { "NODE_ENV": "development" }, "env_production": { "NODE_ENV": "production" }, "instances": 4, "exec_mode": "cluster", "max_restarts" : 3, "restart_delay" : 5000, "log_date_format" : "YYYY-MM-DD HH:mm Z", "combine_logs" : true } ] }
這樣,執(zhí)行命令pm2 start pm2.json即可開啟服務(wù),訪問127.0.0.1:8080/page,點擊按鈕發(fā)起ws連接,觀察控制臺即可。
下圖清晰顯示了socket.io握手的錯誤:
可見在websocket連接建立之前多出了3個xhr請求,而websocket連接建立失敗后又多出了幾個xhr請求,同時最后兩個xhr請求失敗了。
socket.io沒有采用直接建立websocket連接的粗暴方式,而是首先通過http請求(xhr)訪問服務(wù)端的相關(guān)輪訓(xùn)配置信息以及sid。此處sid類似sessionID,但是它唯一標(biāo)識連接,可理解為socketId,以后每次http請求cookie中都必須攜帶sid(httponly);
第二、三個請求用于確認(rèn)連接,在socket.io中,post請求是客戶端發(fā)送消息給服務(wù)端的唯一形式,而且post響應(yīng)一定是“ok”,它的“content-length”一定為2;而get請求主要用于輪訓(xùn),同時獲取服務(wù)端的相關(guān)消息,這會在下文中有體現(xiàn);
第四個websocket連接請求失敗,這主要是由于與后端http握手失敗造成的;
第五個請求為xhr方式的post請求,它是作為websocket通道建立失敗后的一種兼容性處理,上文講述了socket.io的post請求只在客戶端需要發(fā)送消息給服務(wù)端時才會使用,因此,為了證實我們查看消息體:
可見,它攜帶了客戶端發(fā)出的消息類型b:message,同時包含消息體{}空對象。對應(yīng)的,服務(wù)端返回“OK”;
第六個請求為xhr方式的get請求,用來獲取服務(wù)端對第五個請求的響應(yīng)。
至此,大致分析了socket.io建立連接的大致過程以及連接建立失敗后如何兜底的方案,下面分析為何出現(xiàn)握手失敗的問題。
原因何在實例中pm2主進(jìn)程開啟了4個工作進(jìn)程,由主進(jìn)程偵聽8080端口并分發(fā)請求給工作進(jìn)程。pm2進(jìn)程在分發(fā)請求的階段采用了某種算法的均衡,如round-robin或者其他hash方式(但不是iphash),因此在socket.io客戶端連接建立階段發(fā)送的多個xhr請求,會被pm2定位到不同的worker進(jìn)程中。前文中提到每個xhr請求都會攜帶sid字段標(biāo)識當(dāng)前連接,因此當(dāng)一個攜帶sid字段的請求被pm2定位到另一個與該連接無關(guān)的worker時,就會造成請求失敗,返回{"code":1,"message":"Session ID unknown"}錯誤;即使前三次xhr握手成功,進(jìn)入websocket連接升級階段,負(fù)責(zé)偵聽update事件的worker也往往不是之前的那個worder,因此導(dǎo)致websocket連接建立失敗。
一言以蔽之,客戶端多次請求的服務(wù)端進(jìn)程不是同一個進(jìn)程才導(dǎo)致的ws連接無法成功建立。
那么如何才能解決呢?最簡單的方案就是確??蛻舳说拿看握埱蠖伎梢远ㄎ坏酵粋€服務(wù)進(jìn)程即可。當(dāng)然,分布式session同樣可以解決問題,依托第三方緩存類似redis并配合一致性hash算法,確保所有服務(wù)進(jìn)程都可以獲取到連接信息,相互配合完成連接建立。但這也僅僅是作者在理論上分析的一種實現(xiàn)方式,并沒有測試通過,因為這種分布式架構(gòu)不僅實現(xiàn)繁雜而且引入了相關(guān)依賴redis,不太可取。
那么下文主要針對確??蛻舳说拿看握埱蠖伎梢远ㄎ坏酵粋€服務(wù)進(jìn)程這一點實現(xiàn)解決方案。
多種實現(xiàn) 官方實現(xiàn)官方提供了一種比較輕便的架構(gòu):nginx反向代理+iphash
我們的示例demo中的http服務(wù)器只偵聽8080端口,因此必須由pm2分發(fā)請求,否則會出現(xiàn)端口占用的錯誤發(fā)生。但是,官方的解決方案是每個進(jìn)程的socket.io服務(wù)器創(chuàng)建不同端口的http服務(wù)器,專注用于http握手和升級,由nginx做握手請求的代理。而且針對nginx必須設(shè)置iphash,保證同一個客戶端的多次請求定位到后端同一個服務(wù)進(jìn)程。
這樣,示例demo中會占用5個端口,其中8080端口為公用的http服務(wù)器使用,其他四個端口則只用于ws連接握手。但是這四個端口卻如何選取呢?為了保證擴(kuò)展性以及順序性,采用與pm2相兼容的方案。pm2會為每個worker進(jìn)程分配一個id,并且將該id綁定到進(jìn)程的環(huán)境變量中,那么我們就可以利用該worker id生成4個不同的端口號。
app.js
var path = require("path"); var app = require("express")(), server = require("http").createServer(app), port = 3131 + parseInt(process.env.NODE_APP_INSTANCE), io = require("socket.io")(port); io .on("connection", function(socket) { socket.on("disconnect", function() { console.log("/: disconnect-------->") }); socket.on("b:message", function() { socket.emit("s:message", "/: "+port); console.log("/: "+port) }); }); io.of("/ws") .on("connection", function(socket) { socket.on("disconnect", function() { console.log("disconnect-------->") }); socket.on("b:message", function() { socket.emit("s:message", port); }); }); app.get("/abc",function(req,res){ res.sendFile(path.join(process.cwd(),"./index.html")); }); server.listen(8080);
index.html
nginx.conf
upstream io_nodes { ip_hash; server 127.0.0.1:3131; server 127.0.0.1:3132; server 127.0.0.1:3133; server 127.0.0.1:3134; } server { listen 80; server_name ws.vd.net; location / { proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header Host $host; proxy_http_version 1.1; proxy_pass http://io_nodes; } }
在本機(jī)綁定hosts地址后開啟nginx服務(wù),同時開啟服務(wù)器,點擊按鈕建立ws連接成功。
服務(wù)端路由服務(wù)端路由,意義在于“服務(wù)端做worker的負(fù)載均衡,并將選擇的worker ip和端口渲染在頁面,之后瀏覽器的所有ws連接默認(rèn)連接到對應(yīng) ip:port的服務(wù)器中”。這樣只要是服務(wù)端渲染的頁面都可以采用這種方式實現(xiàn)。
如果頁面采用前端異步渲染,仍可以采用這種方式,不過首先通過xhr請求向服務(wù)端獲取需要握手的http服務(wù)器的ip和端口,然后在進(jìn)行ws連接。
服務(wù)端路由的前提仍然是需要針對每個ws服務(wù)器分配一個端口,只不過去掉nginx由服務(wù)端做ip hash。采用服務(wù)端路由架構(gòu)清晰,而且實現(xiàn)容易,兼容性好。
上帝進(jìn)程路由此處的上帝進(jìn)程即為主進(jìn)程,類似pm2進(jìn)程。上帝進(jìn)程路由則是在上帝進(jìn)程層面上做請求的定向分發(fā),保證請求主機(jī)和進(jìn)程的一致性。在上帝進(jìn)程中,針對每個請求的ip做hash,并對每一個ws服務(wù)器創(chuàng)建多帶帶的http服務(wù)器用于握手升級。
簡易代碼:
var express = require("express"), cluster = require("cluster"), net = require("net"), sio = require("socket.io"); var port = 3000, num_processes = require("os").cpus().length; if (cluster.isMaster) { var workers = []; var spawn = function(i) { workers[i] = cluster.fork(); workers[i].on("exit", function(code, signal) { console.log("respawning worker", i); spawn(i); }); }; for (var i = 0; i < num_processes; i++) { spawn(i); } // ip hash var worker_index = function(ip, len) { var s = ""; for (var i = 0, _len = ip.length; i < _len; i++) { if (!isNaN(ip[i])) { s += ip[i]; } } return Number(s) % len; }; var server = net.createServer({ pauseOnConnect: true }, function(connection) { var worker = workers[worker_index(connection.remoteAddress, num_processes)]; worker.send("sticky-session:connection", connection); }).listen(port); } else { // worker var app = new express(); // handshake server. var server = app.listen(0, "localhost"), io = sio(server); process.on("message", function(message, connection) { if (message !== "sticky-session:connection") { return; } server.emit("connection", connection); connection.resume(); }); }總結(jié)
本文實現(xiàn)了三種解決方案,歸根到底就是“ip hash”,不同點在于在請求處理的不同階段做ip hash。
可以在請求處理最前端做iphash,即nginx方式,這也就是第一種方案;
可以在請求處理的第二層分發(fā)處做iphash,即上帝進(jìn)程路由的方式,即第三種;
也可以在請求處理的終端做iphash,即服務(wù)端路由的方式,也就是第二種;
同時共享session也同樣可以實現(xiàn),借助socket.io-redis模塊也可以實現(xiàn)。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/83275.html
摘要:的重連機(jī)制會嘗試重連至其他伺服器并重新建立起對應(yīng)關(guān)系。使用進(jìn)行中文分詞曹操在操場操美女對分詞后的名詞和動詞轉(zhuǎn)換為簡體中文并查詢命中則替換。返回替換后的字符串得到曹操在操場美女打包部署本身是單線程的雖然本身提供模塊但需要修改代碼。 本篇是一個Node新手做完實際項目后的心得總結(jié)。Node高手完全可以略過本文。 摘要 如果BOSS要求你在短期內(nèi)快速實現(xiàn)一套聊天云服務(wù)平臺, 你的第一反應(yīng)是什...
摘要:代理最近在做長連接消息通道的方案與實現(xiàn),目前的方案主要有。后端的是一個服務(wù)的集群,上圖有個組成的連接管理服務(wù)??傮w來看,數(shù)據(jù)經(jīng)過兩次代理,內(nèi)部代理很簡單,配置簡單,只要配置和就可以。經(jīng)測試,可以測試通過。這樣就可以成功代理集群了。 envoy 代理 socket.io 最近在做web 長連接消息通道的方案與實現(xiàn), 目前web 的方案主要有websocket。 后來經(jīng)過調(diào)研發(fā)現(xiàn)sock...
摘要:為了解決這個問題,可以在主進(jìn)程部署事件和事件的監(jiān)聽函數(shù)。屬性返回一個布爾值,表示當(dāng)前進(jìn)程是否為進(jìn)程。主進(jìn)程會連續(xù)兩次新建一個進(jìn)程,然后關(guān)閉所有其他進(jìn)程,顯示如下。一旦收到這個消息,進(jìn)行完畢收尾清理工作再關(guān)閉。概述 基本用法 Node.js默認(rèn)單進(jìn)程運行,對于32位系統(tǒng)最高可以使用512MB內(nèi)存,對于64位最高可以使用1GB內(nèi)存。對于多核CPU的計算機(jī)來說,這樣做效率很低,因為只有一個核在運...
摘要:事件分派器會根據(jù)每個當(dāng)前產(chǎn)生的事件,來選擇對應(yīng)的事件處理器來處理。核心是基于非阻塞的多路復(fù)用機(jī)制單線程避免了多線程上下文切換的開銷。 1.memcached和redis有什么區(qū)別? (1)Redis支持服務(wù)器端的數(shù)據(jù)操作 redis和memcached相比,redis擁有更多的 數(shù)據(jù)結(jié)構(gòu)并且支持更豐富的數(shù)據(jù)操作 ,通常在memcached里面,你需要將數(shù)據(jù)拿到客戶端來進(jìn)行類型的修改然后在se...
摘要:一是什么是可以用于生產(chǎn)環(huán)境的的進(jìn)程管理工具,并且它內(nèi)置一個負(fù)載均衡。嗯嗯,最好的用處就是監(jiān)控我們的生產(chǎn)環(huán)境下的程序運行狀態(tài),讓它給我們?nèi)找岳^日的處于工作狀態(tài)。部署自動部署,避免逐個在所有服務(wù)器中進(jìn)行。 一、PM2是什么 是可以用于生產(chǎn)環(huán)境的Nodejs的進(jìn)程管理工具,并且它內(nèi)置一個負(fù)載均衡。它不僅可以保證服務(wù)不會中斷一直在線,并且提供0秒reload功能,還有其他一系列進(jìn)程管理、監(jiān)控...
閱讀 3670·2021-09-02 15:11
閱讀 4612·2021-08-16 10:47
閱讀 1571·2019-08-29 18:35
閱讀 3046·2019-08-28 17:54
閱讀 2857·2019-08-26 11:37
閱讀 1511·2019-08-23 16:51
閱讀 1819·2019-08-23 14:36
閱讀 1814·2019-08-23 14:21