成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

容器時(shí)代的分布式日志架構(gòu)-【譯文】

羅志環(huán) / 1234人閱讀

摘要:由于容器是無法改變和一次性的,所以存儲(chǔ)在容器中的日志會(huì)隨著容器的失效而刪除。收集節(jié)點(diǎn)存在于容器中,同時(shí)將結(jié)構(gòu)化好的日志數(shù)據(jù)實(shí)時(shí)或者小批量的傳輸?shù)胶喜⒐?jié)點(diǎn)。

微服務(wù)與大問題

容器服務(wù)和微服務(wù)已經(jīng)越來越多的被現(xiàn)代科技公司所采用。當(dāng)你需要提供支持跨平臺(tái)和多應(yīng)用的服務(wù)時(shí),采用微服務(wù)的服務(wù)架構(gòu)是非常重要的。.像Docker一樣的容器服務(wù),因?yàn)榭梢蕴峁└咝У慕y(tǒng)一資源管理和讓服務(wù)保持更好的獨(dú)立性,并且有比虛擬機(jī)(Virtual Machines)更好的便攜性(portability),所以更適合微服務(wù)的開發(fā)。

但是引入微服務(wù)和容器服務(wù)的同時(shí)也帶來了各種問題。下圖我們來看一下微服務(wù)架構(gòu)和現(xiàn)在并不怎么流行的前輩,“統(tǒng)一型架構(gòu)”(monolithic architecture)

。

統(tǒng)一型架構(gòu)雖然沒有足夠的靈活性和可擴(kuò)展性,但是,它是一個(gè)整體(unity)。為了了解它的重要性,我們來從業(yè)務(wù)需求的角度了解一下我們需要收集(collect)和整合(aggeregate)多少種不同的日志。你可能想知道你的用戶最常訪問的網(wǎng)頁有哪些,或者哪個(gè)按鈕和廣告最容易被點(diǎn)擊。你也可能想對比從移動(dòng)應(yīng)用端獲取的銷售數(shù)據(jù),或者作為一個(gè)游戲開發(fā)者,你想了解用戶玩兒游戲時(shí)候的數(shù)據(jù)。你也可能需要收集用戶手機(jī)上的操作日志。假設(shè)你的團(tuán)隊(duì)在做流式分析或者事件影響力分析,這時(shí)就需要對比計(jì)算結(jié)果和歷史數(shù)據(jù)。IoT數(shù)據(jù),SaaS數(shù)據(jù),公共開放數(shù)據(jù)……等等等等。

統(tǒng)一型架構(gòu)產(chǎn)生的數(shù)據(jù),理論上來說,是很容易被跟蹤和收集的。由于系統(tǒng)在定義的時(shí)候就是中心化的,它所產(chǎn)生的日志可以通過定義相同的格式規(guī)則來定義。相反,微服務(wù)卻不是這樣。日志又不同的服務(wù)產(chǎn)生,它們都有著各自的格式,或者有些根本沒有格式!由于這些原因,收集并“消化”這些來自于不同服務(wù)的日志,并轉(zhuǎn)換成一個(gè)可讀的格式,是一個(gè)非常復(fù)雜并且難以解決的數(shù)據(jù)工程問題。

容器時(shí)代,我們必須重新考慮如何記日志

“如何記日志?“ ,這是我們開始討論容器服務(wù)必須先講的。 “容器化(Containerization)”,是一項(xiàng)可以使基于微服務(wù)架構(gòu)開發(fā)的服務(wù)更高效的利器。容器會(huì)使用比虛擬機(jī)(VM)更少的資源,更不用說實(shí)體機(jī)了。容器可以是使我們的服務(wù)更接近我們的客戶,提高操作速度。并且由于容器之間相互獨(dú)立,各服務(wù)之間的依賴問題也減少了(并沒有完全消除)。

但是,這些使容器服務(wù)更適合微服務(wù)架構(gòu)的有點(diǎn)卻在記日志和數(shù)據(jù)整合的過程中帶來了更多的麻煩。通常來說,日志都會(huì)有標(biāo)記IP地址,來表明它來自于哪臺(tái)服務(wù)器。這種情況在容器服務(wù)中并不存在,容器服務(wù)切斷了服務(wù)器和用戶之間的固定映射關(guān)系。另外一個(gè)問題是日志的存儲(chǔ)問題。由于容器是無法改變(immutable)和一次性(disposable)的,所以存儲(chǔ)在容器中的日志會(huì)隨著容器的失效而刪除。你可以選擇把日志都存在主機(jī)端而不是在容器里,但是你可能會(huì)同時(shí)啟動(dòng)多個(gè)容器和服務(wù)。如果服務(wù)器存儲(chǔ)空間滿了怎么辦?那么我們該如何獲取這些日志?用控制臺(tái)直接看?太棒了,又得安裝一個(gè)新組件(翻白眼)?;蛘呶覀兺ㄟ^rsync、ssh或者tail來查看日志。那么我們要確定我們這些常用的工具是在容器里都安裝過的……

突破日志瓶頸:智能數(shù)據(jù)架構(gòu)

這個(gè)問題是沒辦法繞開的。在容器化微服務(wù)的世界里,我們必須重新思考如何記日志

日志必須要以下特征:

在源頭就完成標(biāo)記(labeled)和解析(parsed)

以最快的速度推到目標(biāo)存儲(chǔ)落地

讓我們來看看智能數(shù)據(jù)架構(gòu)是如何工作的。

像我們之前提到的,來自于不同地方的日志可能都有著不同的日志結(jié)構(gòu)和格式。對于數(shù)據(jù)分析來講,處理原始日志就是一場噩夢。收集節(jié)點(diǎn)(Collector Nodes)通過將原始日志轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)來解決這個(gè)問題。例如:JSON中的KV數(shù)據(jù),信息包(MessagePack)或者其他標(biāo)準(zhǔn)的數(shù)據(jù)格式。

收集節(jié)點(diǎn)存在于容器中,同時(shí)將結(jié)構(gòu)化好的日志數(shù)據(jù)實(shí)時(shí)(或者小批量)的傳輸?shù)?strong>合并節(jié)點(diǎn)(Aggregator Nodes)。合并節(jié)點(diǎn)的工作是將小量的數(shù)據(jù)合并成一個(gè)容易被處理的數(shù)據(jù)流到存儲(chǔ)層(Store),在存儲(chǔ)層的數(shù)據(jù)是被持久化存儲(chǔ)的。

如上所述的是一種數(shù)據(jù)架構(gòu),不是所有人都清楚他們的數(shù)據(jù)也需要一個(gè)架構(gòu),但是在容器微服務(wù)的角度,我們必須這樣做。

如果想要你的數(shù)據(jù)架構(gòu)有更好的彈性擴(kuò)展能力(scalable and resilient),下面幾點(diǎn)是必須要考慮的:

網(wǎng)絡(luò)情況。當(dāng)我們有這么大量的數(shù)據(jù)在網(wǎng)絡(luò)中進(jìn)行交換的時(shí)候,我們需要一個(gè)虛擬的“網(wǎng)絡(luò)交警”來保證我們的網(wǎng)絡(luò)不會(huì)超載,不會(huì)丟失數(shù)據(jù)。

CPU負(fù)載。在源頭解析數(shù)據(jù)和在合并節(jié)點(diǎn)格式化數(shù)據(jù)是一項(xiàng)CPU密集型工作。再次強(qiáng)調(diào),我們需要一個(gè)穩(wěn)定的系統(tǒng)來管理這些資源,來保證我們的CPU不會(huì)超載。

冗余性。彈性擴(kuò)展意味著冗余儲(chǔ)備。我們需要保證我們的合并節(jié)點(diǎn)是冗余的(多余實(shí)際需求的),從而能保證我們遇到節(jié)點(diǎn)失敗時(shí)可以快速切換避免數(shù)據(jù)丟失。

控制延遲。我們沒辦法避免系統(tǒng)可能產(chǎn)生的延遲。如果我們沒法逃避這個(gè)問題,我們必須嘗試把潛在的延遲放在可控的范圍。

現(xiàn)在我們了解了我們應(yīng)該做什么了,那我們來看看不一樣合并方式對于服務(wù)架構(gòu)的影響。

數(shù)據(jù)源側(cè)合并模式(Source-Side Aggregation Pattern)

首先我們要問的問題時(shí),我們?nèi)绾螕?jù)定是在服務(wù)端做數(shù)據(jù)合并還是在數(shù)據(jù)源做數(shù)據(jù)合并?答案是,視情況而定(譯者注:廢話)。

服務(wù)端數(shù)據(jù)合并框架帶來的好處是簡潔,但同時(shí)也付出了很大的代價(jià)。

數(shù)據(jù)合并位置固定。如果你改變了你合并節(jié)點(diǎn)的位置,你必須重新調(diào)整所有的獨(dú)立收集節(jié)點(diǎn)的配置。

無法控制的網(wǎng)絡(luò)連接數(shù)量。還記得我們提到要謹(jǐn)慎控制網(wǎng)絡(luò)流量不要超載么?這種架構(gòu)就會(huì)導(dǎo)致網(wǎng)絡(luò)超載。我們在數(shù)據(jù)源側(cè)做合并是網(wǎng)絡(luò)效率更優(yōu)的選擇,因?yàn)闇p少了大量的網(wǎng)絡(luò)通訊和數(shù)據(jù)傳輸。

合并節(jié)點(diǎn)高負(fù)載。不僅僅網(wǎng)絡(luò)會(huì)超載,這種架構(gòu)也會(huì)導(dǎo)致合并節(jié)點(diǎn)CPU超負(fù)荷,導(dǎo)致宕機(jī)造成數(shù)據(jù)丟失。

現(xiàn)在我們來看看另一種方案。

源頭聚合的方式有一個(gè)缺陷:就是會(huì)導(dǎo)致資源緊張。它需要在每個(gè)主機(jī)上都存在一個(gè)額外的容器,但是這個(gè)額外的資源也有很多好處:

更少的鏈接數(shù)。意味著更少的網(wǎng)絡(luò)傳輸。

更低的合并節(jié)點(diǎn)負(fù)載。由于資源消耗被發(fā)散到了你的整個(gè)的數(shù)據(jù)架構(gòu)上,你遇到多帶帶合并節(jié)點(diǎn)超載的幾率大大減少,也會(huì)帶來更多的數(shù)據(jù)穩(wěn)定性。

更少的配置項(xiàng)。由于每個(gè)合并節(jié)點(diǎn)的地址對于每個(gè)采集節(jié)點(diǎn)來說都是“l(fā)ocalhost”,配置起來就變得非常簡單。目標(biāo)地址只需要在本地合并容器聲明一次就夠了。

高度靈活配置項(xiàng)。簡化的配置項(xiàng)讓你的數(shù)據(jù)架構(gòu)高度“模塊化”。你可以隨意改變你架構(gòu)中的核心內(nèi)容。

目標(biāo)側(cè)合并模式(Destination-Side Aggregation Pattern)

我們來換種思路,不僅僅選擇在源頭側(cè)做數(shù)據(jù)合并,還可以選擇在目標(biāo)側(cè)做同樣的事情。為什么要這么做呢?就是在實(shí)際業(yè)務(wù)中的一種權(quán)衡之舉。

僅源頭側(cè)合并

就像在源頭端做合并一樣,會(huì)有以下幾點(diǎn)問題:

目標(biāo)端做的改變會(huì)同時(shí)影響到源頭段。這里同樣會(huì)遇到我們之前的問題,當(dāng)我們在源頭段沒有合并節(jié)點(diǎn)的時(shí)候,配置項(xiàng)就會(huì)變的非常復(fù)雜。如果目標(biāo)端IP地址變化,所有的配置都需要重新生成。

更差的性能。在目標(biāo)側(cè)沒有合并節(jié)點(diǎn)會(huì)導(dǎo)致我們的存儲(chǔ)系統(tǒng)有很多鏈接并發(fā)的問題。

源頭側(cè)和目標(biāo)側(cè)合并

最優(yōu)化的配置方式是同時(shí)在源頭側(cè)和目標(biāo)側(cè)都存在合并節(jié)點(diǎn)。再次重申,我們的妥協(xié)會(huì)導(dǎo)致需要復(fù)雜的配置來控制多個(gè)節(jié)點(diǎn),但是有點(diǎn)也是顯而易見的:

目標(biāo)側(cè)和源頭側(cè)分離,沒有互相影響。

更好的性能。當(dāng)把源頭側(cè)的合并節(jié)點(diǎn)分離,我們可以更好的調(diào)試合并節(jié)點(diǎn)并且減少對于存儲(chǔ)層的請求量,使我們在使用標(biāo)準(zhǔn)的數(shù)據(jù)庫的時(shí)候避免遇到性能和擴(kuò)展的問題。

冗余性

源頭側(cè)聚合帶來的最大一點(diǎn)的好處就是容錯(cuò)性。在真實(shí)業(yè)務(wù)場景中,服務(wù)器會(huì)時(shí)不時(shí)的宕機(jī)。導(dǎo)致宕機(jī)的原因就是,大量持續(xù)的處理由微服務(wù)架構(gòu)構(gòu)成的大型系統(tǒng)的日志。當(dāng)遇到這種情況的時(shí)候,在宕機(jī)時(shí)產(chǎn)生的數(shù)據(jù)會(huì)被永久的丟失。如果你的服務(wù)很久沒有恢復(fù),即使你在源頭端留有緩存(大部分日志平臺(tái)都會(huì)在源頭側(cè)留有至少一分鐘的緩存),這些緩存也會(huì)溢出并造成永久的數(shù)據(jù)丟失。

目標(biāo)側(cè)合并由于增加了冗余性從而提高了容錯(cuò)性。因?yàn)樵谌萜骱蛿?shù)據(jù)庫之間增加了一層,多次拷貝的數(shù)據(jù)可以發(fā)送給多個(gè)合并節(jié)點(diǎn),從而減少了并發(fā)鏈接導(dǎo)致數(shù)據(jù)庫過載的可能性。

擴(kuò)展模式

負(fù)載均衡是數(shù)據(jù)架構(gòu)需要認(rèn)真考慮的一個(gè)重要特性。處理負(fù)載均衡的方法有很多種,但是我們在這里需要關(guān)注的是如何判斷我們是該向上擴(kuò)展(scaling up),比如,使用單一的HTTP/TCP的負(fù)載均衡器的時(shí)候,它通過控制大量的worker和一個(gè)超長隊(duì)列來做負(fù)載均衡。還是該橫向擴(kuò)展(scaling out)當(dāng)處理多個(gè)客戶端合并節(jié)點(diǎn)做負(fù)載均衡的時(shí)候,只能簡單的增加節(jié)點(diǎn)來控制規(guī)模。

那種負(fù)載平衡的方式更好?再次強(qiáng)調(diào),要視情況而定。需要根據(jù)你的系統(tǒng)規(guī)模來確定該使用哪種方法。至少從概念上來說,向上擴(kuò)展比橫向擴(kuò)展要簡單的多。因?yàn)槿绱?,很多?chuàng)業(yè)公司都會(huì)這樣做。但是向上擴(kuò)展的在業(yè)務(wù)量急劇上升的時(shí)期,會(huì)更加頻繁的在GC階段出問題?(your service scales to 5 billion events per day and suddenly starts crashing every time it has to do garbage collection?)。

橫向擴(kuò)展更加復(fù)雜,但是理論上講提供了無限的存儲(chǔ)空間,你可以一直增加合并節(jié)點(diǎn)。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/28005.html

相關(guān)文章

  • 雜貨 - 收藏集 - 掘金

    摘要:消息隊(duì)列技術(shù)介紹后端掘金一消息隊(duì)列概述消息隊(duì)列中間件是分布式系統(tǒng)中重要的組件,主要解決應(yīng)用耦合異步消息流量削鋒等問題。的內(nèi)存優(yōu)化后端掘金聲明本文內(nèi)容來自開發(fā)與運(yùn)維一書第八章,如轉(zhuǎn)載請聲明。 消息隊(duì)列技術(shù)介紹 - 后端 - 掘金一、 消息隊(duì)列概述 消息隊(duì)列中間件是分布式系統(tǒng)中重要的組件,主要解決應(yīng)用耦合、異步消息、流量削鋒等問題。實(shí)現(xiàn)高性能、高可用、可伸縮和最終一致性架構(gòu)。是大型分布式系...

    loostudy 評論0 收藏0
  • 從應(yīng)用到平臺(tái) - 云服務(wù)架構(gòu)演進(jìn)過程

    摘要:應(yīng)用的研發(fā)上線運(yùn)維運(yùn)營形成閉環(huán),順利完成從對內(nèi)服務(wù)到公共平臺(tái)的升級。從功能角度,只能支持靜態(tài)方式設(shè)置反向代理,然后,而平臺(tái)有服務(wù)對應(yīng)的后端服務(wù)和端口是有動(dòng)態(tài)調(diào)整需求。架構(gòu)上是基礎(chǔ)組件需要進(jìn)行升級,數(shù)據(jù)訪問層日志監(jiān)控系統(tǒng)等。 介紹 ? ? ? ?MaxLeap早期是一家研發(fā)、運(yùn)營移動(dòng)應(yīng)用和手機(jī)游戲公司,發(fā)展過程中積累了很多通用組件。這些組件很大程度幫公司在移動(dòng)研發(fā)過程中節(jié)省了時(shí)間和成本,...

    LiangJ 評論0 收藏0
  • 阿里云 APM 解決方案地圖

    摘要:阿里云上領(lǐng)域各個(gè)產(chǎn)品最終目標(biāo)是為了對以上各個(gè)組件進(jìn)行有效監(jiān)控。阿里云的解決方案地圖基于今天的云上的應(yīng)用架構(gòu),阿里云的解決方案地圖如下所示。其他阿里云服務(wù)包括緩存,等。阿里云解決方案地圖以下表格對阿里云解決方案進(jìn)行總結(jié)。 摘要: PM是近5年來伴隨著云技術(shù)、微服務(wù)架構(gòu)發(fā)展起來的一個(gè)新興監(jiān)控領(lǐng)域。在國內(nèi)外,無論是云廠商(如AWS, Azure,等)還是獨(dú)立的公司(Dynatrace, Ap...

    tainzhi 評論0 收藏0
  • k8s與caas--容器云caas平臺(tái)落地實(shí)踐

    摘要:容器云將支持應(yīng)用的一鍵式部署交付,提供負(fù)載均衡,私有域名綁定,性能監(jiān)控等應(yīng)用生命周期管理服務(wù)。本容器云平臺(tái),對接持續(xù)集成發(fā)布系統(tǒng)。 前言 在移動(dòng)互聯(lián)網(wǎng)時(shí)代,新的技術(shù)需要新技術(shù)支持環(huán)境、新的軟件交付流程和IT架構(gòu),從而實(shí)現(xiàn)架構(gòu)平臺(tái)化,交付持續(xù)化,業(yè)務(wù)服務(wù)化。容器將成為新一代應(yīng)用的標(biāo)準(zhǔn)交付件,容器云將幫助企業(yè)用戶構(gòu)建研發(fā)流程和云平臺(tái)基礎(chǔ)設(shè)施??s短應(yīng)用向云端交付的周期,降低運(yùn)營門檻。加速向互...

    h9911 評論0 收藏0
  • k8s與caas--容器云caas平臺(tái)落地實(shí)踐

    摘要:容器云將支持應(yīng)用的一鍵式部署交付,提供負(fù)載均衡,私有域名綁定,性能監(jiān)控等應(yīng)用生命周期管理服務(wù)。本容器云平臺(tái),對接持續(xù)集成發(fā)布系統(tǒng)。 前言 在移動(dòng)互聯(lián)網(wǎng)時(shí)代,新的技術(shù)需要新技術(shù)支持環(huán)境、新的軟件交付流程和IT架構(gòu),從而實(shí)現(xiàn)架構(gòu)平臺(tái)化,交付持續(xù)化,業(yè)務(wù)服務(wù)化。容器將成為新一代應(yīng)用的標(biāo)準(zhǔn)交付件,容器云將幫助企業(yè)用戶構(gòu)建研發(fā)流程和云平臺(tái)基礎(chǔ)設(shè)施。縮短應(yīng)用向云端交付的周期,降低運(yùn)營門檻。加速向互...

    KaltZK 評論0 收藏0

發(fā)表評論

0條評論

最新活動(dòng)
閱讀需要支付1元查看
<