摘要:前兩種的方式畢竟會(huì)多幾跳中轉(zhuǎn),但在路由的靈活性和通訊語義的提供更豐富的選擇,而且在大數(shù)據(jù)量的處理上,吞吐量和平均延時(shí)并不會(huì)比直連差很多??鐧C(jī)房的通信和本機(jī)房的通信有所不同本地機(jī)房的通信講究高吞吐量,類訪問會(huì)要求低延時(shí)。
(圖片源自網(wǎng)絡(luò))
2 架構(gòu)描述 簡(jiǎn)單架構(gòu)從之前的描述,已經(jīng)可以看出我們會(huì)采用RPC over MQ的方式做底層實(shí)現(xiàn),類似方法調(diào)用的通信語義會(huì)在client和server兩端的庫(kù)中作封裝。
從后端實(shí)現(xiàn)來說,我們用三套后端來滿足不同的場(chǎng)景:
1、對(duì)大中型分布式系統(tǒng)環(huán)境,rabbitmq是非常非常好的支撐。本來以為需要自己做很多工作,但深入了解rabbitmq,尤其是其支持的amqp協(xié)議,發(fā)現(xiàn)其實(shí)前人在很多思路方面已經(jīng)栽好樹了,比如一致性hash和跨機(jī)房等功能,都有相應(yīng)的插件支撐。
所以,rabbitmq成為babel的第一選擇,可以實(shí)現(xiàn)我們規(guī)劃功能的全集,我們的SAAS平臺(tái)都是使用的rabbitmq。
2、對(duì)少量機(jī)器而言,redis提供了非常輕量級(jí)的隊(duì)列支持,可以提供有限但必要的功能。
redis沒有類似amqp這樣的協(xié)議,需要手動(dòng)作些封裝。我們?cè)趩螜C(jī)環(huán)境使用redis,盡可能減少部署和運(yùn)維的開銷。
3、對(duì)性能有苛刻要求的可以用zeromq后端去做tcp直連。前兩種mq的方式畢竟會(huì)多幾跳中轉(zhuǎn),但在路由的靈活性和通訊語義的提供更豐富的選擇,而且在大數(shù)據(jù)量的處理上,吞吐量和平均延時(shí)并不會(huì)比直連差很多。
但為了滿足特殊環(huán)境的需要,我們預(yù)留了zeromq的實(shí)現(xiàn)選擇,最近由于新的需求,正在準(zhǔn)備完成這塊拼圖。zeromq的缺點(diǎn)在于需要中央配置系統(tǒng)來幫忙完成路由功能。
每種后臺(tái)實(shí)現(xiàn)對(duì)使用者透明,可以通過配置進(jìn)行透明切換,但是有些高級(jí)通信語義redis和zeromq不支持。
如果對(duì)應(yīng)到web service 三要素:
UDDI:傳統(tǒng)的rpc或者SOA都是去注冊(cè)中心發(fā)現(xiàn)遠(yuǎn)端對(duì)象,然后客戶端主動(dòng)推送數(shù)據(jù)到服務(wù)端。mq的方式幫我們省卻了自注冊(cè)(訂閱實(shí)現(xiàn))和服務(wù)發(fā)現(xiàn)(mq自己路由)的問題。
WSDL:目前我們通過json的方式來描述rpc的service端,包括機(jī)房所在地,持久化,超時(shí)等等。
SOAP:目前使用json的方式,我們定義了一個(gè)統(tǒng)一的Event對(duì)象來封裝一些固定屬性,其他都在一個(gè)map中。由業(yè)務(wù)代碼自己去打包拆包。當(dāng)然這種方式在大團(tuán)隊(duì)中不適合。
通訊語義封裝大量的工作可以利用mq來實(shí)現(xiàn),我們的工作主要體現(xiàn)在通訊語義的封裝。
? client端訪問模式語義
queue語義(消息有去無回):傳統(tǒng)的數(shù)據(jù)輸送。
簡(jiǎn)單rpc(消息一去一回):傳統(tǒng)的rpc和soa都適用于此場(chǎng)景。
輪詢r(jià)pc(消息一去多回):一個(gè)request出去,多個(gè)response回來,適合于輪詢下游節(jié)點(diǎn)的場(chǎng)景。
分布式存儲(chǔ)rpc(一個(gè)request消息,只要有最小條件的response消息就返回):適合于分布式場(chǎng)景下的讀寫。例如三個(gè)拷貝,需要至少兩份讀成功或者至少兩份寫成功,等等。目前此方式我們還沒有用到。
? 消息分發(fā)語義(實(shí)際上這里的行為參考了storm的部分功能)
Shuffle:一個(gè)消息,會(huì)有多個(gè)接收者,這些接收者根據(jù)自己的資源情況去搶占同一來源的消息,達(dá)到load balance的目的。實(shí)際上我們通過shuffle來做集群功能,省掉了LB的引入。而且性能強(qiáng)的拉多點(diǎn),性能弱的拉少點(diǎn),變相的實(shí)現(xiàn)了根據(jù)消費(fèi)者的性能來做分發(fā)。
Sharding:與shuffle類似,也是多個(gè)consumer來分享消息,不過根據(jù)消息的key,保證在拓?fù)洵h(huán)境不發(fā)生改變的情況下,同一個(gè)key始終指向同一個(gè)消費(fèi)者,為后續(xù)分布式系統(tǒng)的搭建打下基礎(chǔ)
topic語義:所有消費(fèi)者都會(huì)得到消息的一個(gè)拷貝。常見的mq語義
topic+shffule:一組消費(fèi)者作為一個(gè)整體來訂閱topic,得到所有的消息,每個(gè)訂閱團(tuán)體內(nèi)部通過shuffle的形式去分?jǐn)?。這種非常適合用大數(shù)據(jù)環(huán)境下,有不同類型的數(shù)據(jù)消費(fèi)者,每一個(gè)類型的消費(fèi)者有各自的實(shí)例數(shù)。
topic+sharding:一組消費(fèi)者作為一個(gè)整體來訂閱topic,得到所有的消息,每個(gè)訂閱團(tuán)體內(nèi)部通過sharding的形式去分?jǐn)?。類似于topic shuffle,只是換用了sharding這種更嚴(yán)格的語義。
? 數(shù)據(jù)的封裝語義。用于指定babel上承載數(shù)據(jù)的特征,例如:
batch operation:用于指定是否進(jìn)行批處理傳遞。
Security:暫無使用。
Compressing:指定payload壓縮方法,目前只做了gzip。
機(jī)房:指定了機(jī)房所在地,框架會(huì)根據(jù)生產(chǎn)者和消費(fèi)者的不同自動(dòng)做跨機(jī)房的處理。
持久化:指定在無消費(fèi)者的情況下,是否需要持久化存儲(chǔ),以及最大大小。
超時(shí):指定消息的最大有效時(shí)間,超過的消息將會(huì)被丟棄。
其他。
對(duì)于以上的通訊語義,首先需要去底層的mq基礎(chǔ)里面找到相對(duì)應(yīng)的設(shè)施來做封裝,比如對(duì)于queue語義作個(gè)簡(jiǎn)單舉例:
而對(duì)于像rpc,輪詢,以及其他功能,則需要相應(yīng)的代碼來支撐,比如:
response的返回可以通過client監(jiān)聽queue來實(shí)現(xiàn)
response和request的串聯(lián)可以通過自定義的requestid來實(shí)現(xiàn)
輪詢可以通過client 端等待多個(gè)消息返回,可以用condition來做同步
……
這里有不少細(xì)節(jié),暫不在本文中進(jìn)行展開了。
跨語言由于幾種mq都有python和java的客戶端,所以我們工作會(huì)輕松很多,只是同樣的邏輯需要寫兩份,好處還是很明顯的,使得我們的系統(tǒng)語言無關(guān),方便根據(jù)當(dāng)前人員的技能情況來分配開發(fā)任務(wù)。
不過這里不得不吐槽python的并發(fā),雖然有心理準(zhǔn)備,沒想到是如此之差。當(dāng)使用多線程的時(shí)候,性能下降的厲害,比java要差兩個(gè)數(shù)量級(jí),所以我們python版做了同步(多線程),異步(協(xié)程)兩個(gè)版本。異步版本的性能尚可接受;我們已經(jīng)準(zhǔn)備在build自己的異步python框架,來覆蓋我們的應(yīng)用程序。
Babel的一大特色是跨機(jī)房通信,來幫助我們解決不同數(shù)據(jù)中心的通信問題,使得業(yè)務(wù)開發(fā)人員只用關(guān)心其所負(fù)責(zé)的業(yè)務(wù)即可??鐧C(jī)房的通信和本機(jī)房的通信有所不同:
本地機(jī)房的通信講究高吞吐量,rpc類訪問會(huì)要求低延時(shí)。
跨機(jī)房通信必須應(yīng)對(duì)復(fù)雜的網(wǎng)絡(luò)情況,要求數(shù)據(jù)不丟,rpc類通信可以接受相對(duì)較高的延時(shí)。
實(shí)現(xiàn)上,我們利用了federation插件,當(dāng)rpc框架發(fā)現(xiàn)存在跨機(jī)房訪問時(shí),會(huì)自動(dòng)啟用相應(yīng)的路由,下圖是同事畫的兩種情況下的路由,綠線是本地調(diào)用,紅線是跨機(jī)房調(diào)用。
對(duì)于業(yè)務(wù)應(yīng)用而言,使用上是基本透明的,借助于mq的中轉(zhuǎn),在多機(jī)房環(huán)境下它也可以玩轉(zhuǎn)除數(shù)據(jù)推送外的RPC類訪問語義。
3 實(shí)戰(zhàn)舉例 實(shí)例1 分布式數(shù)據(jù)計(jì)算平臺(tái)
首先是我們的私有化大數(shù)據(jù)平臺(tái)warden。warden集數(shù)據(jù)采集、轉(zhuǎn)換、分發(fā)、實(shí)時(shí)分析和展示等功能于一體,希望從客戶的原始網(wǎng)絡(luò)流量中找出異常點(diǎn)和風(fēng)險(xiǎn)事件。
此圖是一個(gè)warden分布式版本的草圖:
采集的數(shù)據(jù)通過topic sharding類分配給不同類型的消費(fèi)者,比如ES writer,Mysql writer,實(shí)時(shí)分析引擎;每種消費(fèi)者可以有不同的實(shí)例數(shù)。
實(shí)時(shí)計(jì)算引擎通過sharding來分?jǐn)偭髁?,達(dá)到scale out的效果。
rule引擎需要數(shù)據(jù)的時(shí)候同樣通過簡(jiǎn)單的sharding的rpc就可以獲得相應(yīng)的數(shù)據(jù)了。
規(guī)則引擎的結(jié)果可以通過topic來進(jìn)行再分發(fā)。
目前只有實(shí)時(shí)引擎是java的,因?yàn)樾阅芤罂量?,其他模塊采用python開發(fā)。
上圖只是個(gè)例子,來簡(jiǎn)要說明babel是如何支撐一個(gè)分布式數(shù)據(jù)計(jì)算系統(tǒng)的。實(shí)際的系統(tǒng)使用了更多的語義,也更加的復(fù)雜。不過借助于Babel的協(xié)助,整個(gè)系統(tǒng)在實(shí)現(xiàn)和運(yùn)維上已經(jīng)很大程度上減輕了復(fù)雜程度。
2 水平擴(kuò)展的web系統(tǒng)
第二個(gè)例子是我們?cè)?jīng)做過的SAAS平臺(tái)私有化案例,是我們?cè)缙赟AAS平臺(tái)的極簡(jiǎn)版本。
圖畫的略凌亂了些:
系統(tǒng)主架構(gòu)是用haproxy做負(fù)載均衡,發(fā)到我們的兩臺(tái)主機(jī)上。
兩臺(tái)主機(jī)內(nèi)部完全相同,右邊主機(jī)內(nèi)部組件沒有畫全。
每臺(tái)主機(jī)有內(nèi)部的nginx,load balance到本機(jī)器內(nèi)部的諸多python web server 上。
python web server直接讀取本地的nosql數(shù)據(jù)庫(kù)。
寫數(shù)據(jù)時(shí),由于寫請(qǐng)求sharding到兩臺(tái)機(jī)器上,所以我們有個(gè)topic的service來處理nosql數(shù)據(jù)寫入,保證每個(gè)寫入操作都寫到兩臺(tái)機(jī)器上,每臺(tái)機(jī)器的nosql始終存有全量的最新數(shù)據(jù)。
由于客戶要求落地關(guān)系型數(shù)據(jù)庫(kù),所以通過shuffle再將寫請(qǐng)求分散開,統(tǒng)一寫入mysql中。
在這個(gè)系統(tǒng)中,我們成功的利用babel建立了自己的一致性框架,從而避免了去使用db做數(shù)據(jù)一致性;同時(shí)由于對(duì)等的服務(wù)器架構(gòu),在部署維護(hù)上省掉了很多事情。
框架運(yùn)維整個(gè)框架,我們都準(zhǔn)備了統(tǒng)一的metrics體系去做監(jiān)控和報(bào)警(實(shí)際上metrics系統(tǒng)本身的跨機(jī)房屬性反而是通過babel來實(shí)現(xiàn)),詳盡的監(jiān)視了RPC的某個(gè)環(huán)節(jié),之前有過我們監(jiān)控的文章,這里就不重復(fù)了。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/45549.html
摘要:研發(fā)通訊框架,以及其支撐的其他框架,比如監(jiān)控報(bào)警等。這個(gè)是最重要的角色。目前的配置與分發(fā)還不能做到自動(dòng)化,有手工工作量。完成自動(dòng)化發(fā)布部署,將整個(gè)系統(tǒng)做一個(gè)統(tǒng)一的整體。研究彈性伸縮方面的非功能性擴(kuò)展??紤]增加熔斷等自我保護(hù)機(jī)制。 showImg(https://segmentfault.com/img/bVQ2BQ?w=400&h=277); (圖片源自網(wǎng)絡(luò)) 4框架生態(tài) 實(shí)際上,在做...
摘要:概述在簡(jiǎn)易框架需求與設(shè)計(jì)這篇文章中已經(jīng)給出了協(xié)議的具體細(xì)節(jié),協(xié)議類型為二進(jìn)制協(xié)議,如下協(xié)議的解碼我們稱為,編碼我們成為,下文我們將直接使用和術(shù)語。直接貼代碼,參考前文提到的協(xié)議格式閱讀以下代碼協(xié)議編碼器 概述 在《簡(jiǎn)易R(shí)PC框架:需求與設(shè)計(jì)》這篇文章中已經(jīng)給出了協(xié)議的具體細(xì)節(jié),協(xié)議類型為二進(jìn)制協(xié)議,如下: ---------------------------------------...
閱讀 3467·2023-04-25 23:25
閱讀 2110·2021-11-12 10:36
閱讀 2825·2019-08-30 12:47
閱讀 2049·2019-08-29 18:45
閱讀 447·2019-08-29 17:28
閱讀 1792·2019-08-29 17:15
閱讀 1717·2019-08-29 16:05
閱讀 1419·2019-08-29 14:17