摘要:添加接收人監(jiān)控中心支持添加郵箱及微信兩種告警,需要注意的是,添加郵箱告警的話,需要預(yù)先配置發(fā)件服務(wù)器。由于監(jiān)控中心配置了一條告警規(guī)則,只要企業(yè)微信的信息填寫(xiě)正確,一般分鐘以內(nèi)均可從企業(yè)微信中獲取到告警信息。
監(jiān)控中心是UK8S提供的產(chǎn)品化監(jiān)控方案,提供基于Prometheus的產(chǎn)品解決方案,涵蓋Prometheus集群的全生命周期管理,以及告警規(guī)則配置、報(bào)警設(shè)置等功能,省去了自行搭建監(jiān)控服務(wù)的學(xué)習(xí)成本及運(yùn)維成本。
監(jiān)控中心基于CoreOS 開(kāi)源的Prometheus Operator實(shí)現(xiàn),部署在UK8S集群中,包含三大監(jiān)控模塊,分別是Prometheus、Alertmanager、Grafana,高可用模式下,Prometheus及Alertmanager分別部署2個(gè)和3個(gè)副本,也支持單節(jié)點(diǎn)模式。
同時(shí),為了簡(jiǎn)化監(jiān)控服務(wù)部署的負(fù)擔(dān),監(jiān)控中心啟動(dòng)后,會(huì)默認(rèn)安裝NodeExporter以抓取Node節(jié)點(diǎn)的監(jiān)控?cái)?shù)據(jù),并添加了Scheduler、Controller Manager、etcd、kubelet等Target,零配置即可實(shí)現(xiàn)UK8S的健康狀態(tài)監(jiān)控。
功能點(diǎn) | 功能說(shuō)明 |
---|---|
創(chuàng)建集群 | 一鍵創(chuàng)建Prometheus集群 |
銷毀集群 | 銷毀已創(chuàng)建的Prometheus集群 |
創(chuàng)建告警規(guī)則 | 創(chuàng)建一條告警規(guī)則,即Prometheus Rule |
刪除告警規(guī)則 | 刪除Prometheus Rule |
添加監(jiān)控目標(biāo) | 添加監(jiān)控目標(biāo),即Target |
刪除監(jiān)控目標(biāo) | 刪除監(jiān)控目標(biāo),不再抓取其監(jiān)控?cái)?shù)據(jù) |
添加接收人 | 在Alertmanager中配置郵件及微信接受人 |
監(jiān)控中心支持單節(jié)點(diǎn)模式和高可用兩種模式,需要注意的是,開(kāi)啟監(jiān)控需要消耗一定的CPU、內(nèi)存資源,因此,如果開(kāi)啟勾選了高可用模式,請(qǐng)注意:
建議參數(shù)配置如下:
一個(gè)監(jiān)控目標(biāo)可理解為Prometheus中的一個(gè)Target或Job. 原生Prometheus既支持靜態(tài)配置監(jiān)控目標(biāo),也支持動(dòng)態(tài)服務(wù)發(fā)現(xiàn)。
由于K8S的Pod被設(shè)置非永久性的資源,為了正確地抓取到每個(gè)應(yīng)用對(duì)應(yīng)的Pod監(jiān)控?cái)?shù)據(jù),Prometheus Operator引入了Service Monitor機(jī)制,通過(guò)監(jiān)聽(tīng)Service后面的EP(可認(rèn)為是健康的Pod)來(lái)實(shí)現(xiàn)監(jiān)控?cái)?shù)據(jù)的采集。
因此,為了抓取一組Pod的監(jiān)控?cái)?shù)據(jù),我們必須為這組Pod創(chuàng)建一個(gè)對(duì)應(yīng)的Service,并暴露對(duì)應(yīng)的Metrics端口。
! 這里需要強(qiáng)調(diào)的是,Service必須暴露Metrics端口,而非業(yè)務(wù)端口。如我們有一個(gè)應(yīng)用,其應(yīng)用端口為80,Metrics端口為9200,則供Prometheus抓取數(shù)據(jù)的Service端口必須是9200,如果設(shè)置為80,則不能抓取到任何監(jiān)控?cái)?shù)據(jù)。
在下面這個(gè)例子中,我們部署了一個(gè)示例應(yīng)用,該應(yīng)用為一個(gè)web應(yīng)用程序,其容器對(duì)外暴露了兩個(gè)端口,一個(gè)是業(yè)務(wù)端口80,另一個(gè)是Metrics端口8080. 并且創(chuàng)建了一個(gè)Service,暴露的端口與容器端口一致。
apiVersion: apps/v1
kind: Deployment
metadata:
name: example-app
spec:
replicas: 2
selector:
matchLabels:
app: example-app
template:
metadata:
labels:
app: example-app
spec:
containers:
- name: example-app
image: uhub.service.ucloud.cn/uk8s_public/instrumented_app:latest
ports:
- name: metrics
containerPort: 8080
- name: web
containerPort: 80
---
kind: Service
apiVersion: v1
metadata:
name: example-app
labels:
app: example-app
spec:
selector:
app: example-app
ports:
- name: metrics
port: 8080
- name: web
port: 80
我們?cè)赨K8S的監(jiān)控中心-->監(jiān)控目標(biāo)頁(yè)面,直接選中該Service,端口名稱選擇“metrics”,抓取路徑一般默認(rèn)填寫(xiě)“/metrics”,如果監(jiān)控指標(biāo)的路徑是自定義請(qǐng)咨詢業(yè)務(wù)方。
添加完畢后,我們可以打開(kāi)Prometheus 控制臺(tái),查看該監(jiān)控目標(biāo)是否已添加成功。
監(jiān)控中心支持添加郵箱及微信兩種告警,需要注意的是,添加郵箱告警的話,需要預(yù)先配置發(fā)件服務(wù)器。
不同的郵件服務(wù)提供商對(duì)于發(fā)件服務(wù)器的配置都有較為詳細(xì)的說(shuō)明,這里強(qiáng)調(diào)兩點(diǎn):
支持添加多個(gè)郵件接收人
在使用微信接收人之前,我們必須在微信管理后臺(tái)創(chuàng)建一個(gè)應(yīng)用并獲取應(yīng)用ID、企業(yè)ID、應(yīng)用秘鑰、部門(mén)ID、企業(yè)微信用戶ID等信息,需要咨詢你的企業(yè)微信負(fù)責(zé)人方可獲取到此信息。
在使用微信接收人之前,我們必須在微信管理后臺(tái)創(chuàng)建一個(gè)應(yīng)用并獲取應(yīng)用ID、企業(yè)ID、應(yīng)用秘鑰、部門(mén)ID、企業(yè)微信用戶ID等信息,需要咨詢你的企業(yè)微信負(fù)責(zé)人方可獲取到此信息。
由于監(jiān)控中心配置了一條watchdog告警規(guī)則,只要企業(yè)微信的信息填寫(xiě)正確,一般10分鐘以內(nèi)均可從企業(yè)微信中獲取到告警信息。
實(shí)時(shí)文檔歡迎訪問(wèn)https://docs.ucloud.cn/uk8s/monitor/prometheusplugin/intro
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/126278.html
摘要:宋體自年被開(kāi)源以來(lái),很快便成為了容器編排領(lǐng)域的標(biāo)準(zhǔn)。宋體年月,樂(lè)心醫(yī)療的第一個(gè)生產(chǎn)用集群正式上線。所以于年推出后,樂(lè)心醫(yī)療的運(yùn)維團(tuán)隊(duì)在開(kāi)會(huì)討論之后一致決定盡快遷移到。Kubernetes 自 2014 年被 Google 開(kāi)源以來(lái),很快便成為了容器編排領(lǐng)域的標(biāo)準(zhǔn)。因其支持自動(dòng)化部署、大規(guī)??缮炜s和容器化管理等天然優(yōu)勢(shì),已經(jīng)被廣泛接納。但由于 Kubernetes 本身的復(fù)雜性,也讓很多企業(yè)的...
摘要:宋體本文從拉勾網(wǎng)的業(yè)務(wù)架構(gòu)日志采集監(jiān)控服務(wù)暴露調(diào)用等方面介紹了其基于的容器化改造實(shí)踐。宋體此外,拉勾網(wǎng)還有一套自研的環(huán)境的業(yè)務(wù)發(fā)布系統(tǒng),不過(guò)這套發(fā)布系統(tǒng)未適配容器環(huán)境。寫(xiě)在前面 拉勾網(wǎng)于 2019 年 3 月份開(kāi)始嘗試將生產(chǎn)環(huán)境的業(yè)務(wù)從 UHost 遷移到 UK8S,截至 2019 年 9 月份,QA 環(huán)境的大部分業(yè)務(wù)模塊已經(jīng)完成容器化改造,生產(chǎn)環(huán)境中,后臺(tái)管理服務(wù)已全部遷移到 UK8...
摘要:開(kāi)啟監(jiān)控中心開(kāi)啟監(jiān)控中心開(kāi)啟監(jiān)控中心監(jiān)控中心支持單節(jié)點(diǎn)模式和高可用兩種模式,需要注意的是,開(kāi)啟監(jiān)控需要消耗一定的內(nèi)存資源,因此,如果開(kāi)啟勾選了高可用模式,請(qǐng)注意至少有個(gè)節(jié)點(diǎn)的可用資源大于的容器配置。其中為塊,為塊。 開(kāi)啟監(jiān)控中心監(jiān)控中心支持單節(jié)點(diǎn)模式和高可用兩種模式,需要注意的是,開(kāi)啟監(jiān)控需要消耗一定的CPU、內(nèi)存資源,因此,如果開(kāi)啟勾選了高可用模式,請(qǐng)注意:至少有2個(gè)Node節(jié)點(diǎn)的可用資源...
摘要:概述之前講過(guò)容器的可視化監(jiān)控,即監(jiān)控容器的運(yùn)行情況,包括使用率內(nèi)存占用網(wǎng)絡(luò)狀況以及磁盤(pán)空間等等一系列信息。實(shí)戰(zhàn)一下中添加依賴啟動(dòng)應(yīng)用程序之后,只要在瀏覽器中輸入端點(diǎn)信息就能獲得應(yīng)用的一些狀態(tài)信息。 showImg(https://segmentfault.com/img/remote/1460000014684947); 概述 之前講過(guò)Docker容器的可視化監(jiān)控,即監(jiān)控容器的運(yùn)行情...
摘要:綜上所述,容器化性能上接近物理機(jī),在多測(cè)試場(chǎng)景下,表現(xiàn)相對(duì)穩(wěn)定可靠。和實(shí)現(xiàn)了云服務(wù)器節(jié)點(diǎn)從物理機(jī)到宿主機(jī)的轉(zhuǎn)變。 2018年數(shù)人云Meetup第一站,聯(lián)合vivo在深圳舉辦 Building Microservice 系列活動(dòng)第一期。本次技術(shù)沙龍vivo、中興通訊、華為、數(shù)人云共同派出技術(shù)大咖,為開(kāi)發(fā)者們帶來(lái)有關(guān)微服務(wù)、容器化、配置中心、服務(wù)網(wǎng)格等領(lǐng)域的實(shí)戰(zhàn)與干貨分享。 數(shù)人云Meet...
閱讀 3538·2023-04-25 20:09
閱讀 3739·2022-06-28 19:00
閱讀 3060·2022-06-28 19:00
閱讀 3081·2022-06-28 19:00
閱讀 3175·2022-06-28 19:00
閱讀 2880·2022-06-28 19:00
閱讀 3047·2022-06-28 19:00
閱讀 2638·2022-06-28 19:00