成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

Prometheus監(jiān)控的最佳實(shí)踐——關(guān)于監(jiān)控的3項(xiàng)關(guān)鍵指標(biāo)

tuantuan / 475人閱讀

摘要:本文將分享是為何以及如何開發(fā)出最佳實(shí)踐方法來使用在中監(jiān)控應(yīng)用程序的。什么是監(jiān)控最近有很多關(guān)于的消息,尤其是在中監(jiān)控應(yīng)用程序這方面。方法遵循中提及的原則,聚焦于檢測最終用戶在使用服務(wù)時關(guān)心的東西。

本文來自Weaveworks的工程師Anita Burhrle在Rancher Labs與Weaveworks聯(lián)合舉辦的Online Meetup上的技術(shù)分享。在此次分享中,嘉賓們討論了如何使用Rancher、Weave Cloud和Prometheus來輕松部署、管理與監(jiān)控Kubernetes。本文將分享Weave是為何以及如何開發(fā)出RED最佳實(shí)踐方法來使用Prometheus在Kubernetes中監(jiān)控應(yīng)用程序的。

什么是Prometheus監(jiān)控?

最近有很多關(guān)于Prometheus的消息,尤其是在Kubernetes中監(jiān)控應(yīng)用程序這方面。深入RED方法之前,我們先了解一些背景內(nèi)容。應(yīng)用程序運(yùn)行在容器上并由Kubernetes負(fù)責(zé)調(diào)度,在此環(huán)境中它們是高度自動化并且動態(tài)的。傳統(tǒng)的監(jiān)控工具一般是基于服務(wù)器,只監(jiān)控靜態(tài)的服務(wù),所以當(dāng)要在這種動態(tài)環(huán)境監(jiān)控應(yīng)用程序時,傳統(tǒng)的監(jiān)控工具往往很難滿足這一需求。

這時就需要Prometheus出馬了。

Prometheus是一個開源項(xiàng)目,最初由SoundCloud的工程師開發(fā)。它專門用于監(jiān)控那些運(yùn)行在容器中的微服務(wù)。每經(jīng)過一個時間間隔,數(shù)據(jù)都會從運(yùn)行的服務(wù)中流出,存儲到一個時間序列數(shù)據(jù)庫中,這個數(shù)據(jù)庫之后可以通過PromQL語言查詢。另外,因?yàn)閿?shù)據(jù)是以時間序列存儲的,當(dāng)出現(xiàn)問題時,可以根據(jù)這些時間間隔進(jìn)行診斷,另外還可以預(yù)測基礎(chǔ)設(shè)施的長期監(jiān)控趨勢----這是Prometheus的兩大功能。

在Weaveworks,我們把服務(wù)搭建在Prometheus的開源分布上,并且創(chuàng)建了一個可擴(kuò)展、多租戶的版本,這是我們軟件即服務(wù)概念的一部分,稱為Weave Cloud。

現(xiàn)在,該服務(wù)已經(jīng)運(yùn)行了幾個月,同時也使用Weave Cloud監(jiān)控自己本身,在這個過程中我們積累到了一些有關(guān)監(jiān)控云本機(jī)應(yīng)用程序的經(jīng)驗(yàn),并根據(jù)這些經(jīng)驗(yàn)設(shè)計了一個系統(tǒng)來確定在檢測代碼前需要測量什么。

該檢測什么?

在搭建Prometheus監(jiān)控時,確定需要收集的指標(biāo)類型十分重要,這些指標(biāo)和應(yīng)用程序相關(guān)。選擇的指標(biāo)可以簡化故障發(fā)生時排除故障的流程,并且還可以在服務(wù)和基礎(chǔ)設(shè)施上保持很高的穩(wěn)定性。為幫助理解instrument的重要性,我們定義了一個稱之為RED方法的系統(tǒng)。

RED方法遵循Four Golden Signals中提及的原則,聚焦于檢測最終用戶在使用web服務(wù)時關(guān)心的東西。

在RED方法中,我們通過監(jiān)控三項(xiàng)關(guān)鍵指標(biāo)來管理架構(gòu)中的每個微服務(wù):

(Request)Rate – 你的服務(wù)所服務(wù)的每秒的請求數(shù)

(Request)Errors – 每秒失敗的請求數(shù)

(Request)Duration – 每個請求所花費(fèi)的時間,用時間間隔表示

RED方法希望由Rate、Errors、Duration三項(xiàng)指標(biāo)涵蓋最典型的Web服務(wù)問題。同時這些指標(biāo)還能夠反映出請求的錯誤率。通過這三項(xiàng)指標(biāo),我們就能監(jiān)測到通常情況下會影響客戶體驗(yàn)的問題。

如果想要獲得更細(xì)節(jié)的信息,還需要用到Saturation指標(biāo)。Saturation指標(biāo)用在USE(Utilization Saturation and Errors)方法中,它指的是一種帶有額外作業(yè)的資源,而該資源不能夠提供服務(wù),因此必須添加到隊列中以備后續(xù)處理。

USE vs. RED方法

對比兩種方法,USE方法更側(cè)重于監(jiān)控的性能,并以此為出發(fā)點(diǎn)尋找影響性能問題的根本原因以及其他系統(tǒng)的瓶頸。

在理想狀態(tài)下,我們可以在監(jiān)控應(yīng)用程序時同時使用USE和RED方法。

為什么要對每個服務(wù)衡量相同的指標(biāo)

從監(jiān)控的角度來看,如果能處理好每項(xiàng)服務(wù),你的運(yùn)營團(tuán)隊就可以在此基礎(chǔ)上繼續(xù)擴(kuò)展服務(wù)。

擴(kuò)展性對運(yùn)營團(tuán)隊意味著什么?
我們從這個角度看待問題,一個團(tuán)隊可以支持多少個服務(wù)。在理想狀態(tài)下,一個團(tuán)隊可以支持的服務(wù)數(shù)量和團(tuán)隊規(guī)模無關(guān),而取決于其他因素,比如SLA協(xié)議的響應(yīng)類型以及是否需要全天候覆蓋等等。

如何將可支持的服務(wù)數(shù)量與團(tuán)隊規(guī)模去藕化?
辦法是讓每一個服務(wù)都變得一樣。這既減少了團(tuán)隊針對特定的服務(wù)進(jìn)行培訓(xùn)的數(shù)量,還減少了在高壓事件響應(yīng)場景或者所謂“認(rèn)知負(fù)載”這些針對特定服務(wù)的特殊情況發(fā)生時,呼叫者需要記錄的內(nèi)容。

容量規(guī)劃:
考慮QPS(每秒查詢次數(shù))和延遲

自動化任務(wù)以及發(fā)出警報:
RED方法的優(yōu)點(diǎn)在于它可以幫助你考慮如何在儀表板中顯示信息。通過這三個指標(biāo),你可以對儀表板的布局進(jìn)行調(diào)整,讓它更易于閱讀,并在問題發(fā)生時發(fā)出警報。例如,一個布局可能意味著 --- 每個服務(wù)都有一個不同的Weave Cloud記事本,包含了PromQL查詢的請求&錯誤,以及每個服務(wù)的延遲。

毫無疑問,如果把所有的服務(wù)都視為一樣的,那么將會更加易于自動化執(zhí)行重復(fù)任務(wù)。

PromQL查詢

在Weave Cloud上監(jiān)控RED方法中的指標(biāo)

局限性

事實(shí)上,這種方法(RED)僅適用于請求驅(qū)動的服務(wù)——比如,它在處理面向批處理的服務(wù)或者流服務(wù)時會發(fā)生錯誤。對于請求驅(qū)動它也不是完全適用,當(dāng)需要監(jiān)控其他東西——比如主機(jī)CPU&內(nèi)存或者緩存資源時,USE方法表現(xiàn)的更好。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/27060.html

相關(guān)文章

  • 容器監(jiān)控實(shí)踐Prometheus基本架構(gòu)

    摘要:根據(jù)配置文件,對接收到的警報進(jìn)行處理,發(fā)出告警。在默認(rèn)情況下,用戶只需要部署多套,采集相同的即可實(shí)現(xiàn)基本的。通過將監(jiān)控與數(shù)據(jù)分離,能夠更好地進(jìn)行彈性擴(kuò)展。參考文檔本文為容器監(jiān)控實(shí)踐系列文章,完整內(nèi)容見 系統(tǒng)架構(gòu)圖 1.x版本的Prometheus的架構(gòu)圖為:showImg(https://segmentfault.com/img/remote/1460000018372350?w=14...

    gghyoo 評論0 收藏0
  • 容器監(jiān)控實(shí)踐Prometheus基本架構(gòu)

    摘要:根據(jù)配置文件,對接收到的警報進(jìn)行處理,發(fā)出告警。在默認(rèn)情況下,用戶只需要部署多套,采集相同的即可實(shí)現(xiàn)基本的。通過將監(jiān)控與數(shù)據(jù)分離,能夠更好地進(jìn)行彈性擴(kuò)展。參考文檔本文為容器監(jiān)控實(shí)踐系列文章,完整內(nèi)容見 系統(tǒng)架構(gòu)圖 1.x版本的Prometheus的架構(gòu)圖為:showImg(https://segmentfault.com/img/remote/1460000018372350?w=14...

    elina 評論0 收藏0
  • 容器監(jiān)控實(shí)踐—node-exporter

    摘要:比如定義了基礎(chǔ)的數(shù)據(jù)類型以及對應(yīng)的方法收集事件次數(shù)等單調(diào)遞增的數(shù)據(jù)收集當(dāng)前的狀態(tài),比如數(shù)據(jù)庫連接數(shù)收集隨機(jī)正態(tài)分布數(shù)據(jù),比如響應(yīng)延遲收集隨機(jī)正態(tài)分布數(shù)據(jù),和是類似的庫的詳細(xì)解析可以參考本文為容器監(jiān)控實(shí)踐系列文章,完整內(nèi)容見 概述 Prometheus從2016年加入CNCF,到2018年8月畢業(yè),現(xiàn)在已經(jīng)成為Kubernetes的官方監(jiān)控方案,接下來的幾篇文章將詳細(xì)解讀Promethu...

    Pink 評論0 收藏0
  • 容器監(jiān)控實(shí)踐—node-exporter

    摘要:比如定義了基礎(chǔ)的數(shù)據(jù)類型以及對應(yīng)的方法收集事件次數(shù)等單調(diào)遞增的數(shù)據(jù)收集當(dāng)前的狀態(tài),比如數(shù)據(jù)庫連接數(shù)收集隨機(jī)正態(tài)分布數(shù)據(jù),比如響應(yīng)延遲收集隨機(jī)正態(tài)分布數(shù)據(jù),和是類似的庫的詳細(xì)解析可以參考本文為容器監(jiān)控實(shí)踐系列文章,完整內(nèi)容見 概述 Prometheus從2016年加入CNCF,到2018年8月畢業(yè),現(xiàn)在已經(jīng)成為Kubernetes的官方監(jiān)控方案,接下來的幾篇文章將詳細(xì)解讀Promethu...

    VPointer 評論0 收藏0
  • Kubernetes集群監(jiān)控詳解

    摘要:儀表板是一個附加組件,它能提供集群上運(yùn)行的資源的概述信息。可以很容易地創(chuàng)建圖形,并且把它們合并稱儀表板,而這些儀表板由一個強(qiáng)大的身份驗(yàn)證和授權(quán)層保護(hù),它們還可以和其他儀表板進(jìn)行共享而不需要訪問服務(wù)器本身。 介 紹 Kubernetes在Github上擁有超過4萬顆星,7萬以上的commits,以及像Google這樣的主要貢獻(xiàn)者。Kubernetes可以說已經(jīng)快速地接管了容器生態(tài)系統(tǒng),成...

    A Loity 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<