背 景
在白盒監(jiān)控中我們需要將export程序安裝到被監(jiān)控的主機(jī)上從而實(shí)現(xiàn)對(duì)主機(jī)各種資源及其狀態(tài)的數(shù)據(jù)采集工作。
但某些情況下操作技術(shù)以及其他原因,不是所有的export都能部署到被監(jiān)控的主機(jī)環(huán)境中,針對(duì)這樣的場(chǎng)景Prometheus提供了黑盒解決方案,blackbox無(wú)需安裝到被監(jiān)控的主機(jī)目標(biāo)中,只需要將其安裝在proethus和被監(jiān)控目標(biāo)互通的環(huán)境中,通過(guò)HTTP、HTTPS、DNS、TCP、ICMP等方式對(duì)網(wǎng)絡(luò)進(jìn)行探測(cè)監(jiān)控還可以探測(cè)SSL證書(shū)過(guò)期時(shí)間,主要用來(lái)關(guān)注現(xiàn)象,重點(diǎn)在于對(duì)正在發(fā)生的故障進(jìn)行告警。
應(yīng)用場(chǎng)景
業(yè)務(wù)組件端口狀態(tài)監(jiān)聽(tīng);
應(yīng)用層協(xié)議定義與監(jiān)聽(tīng)。
主機(jī)探活機(jī)制。
接口聯(lián)通性。
安裝部署
# cd /app/software/
# tar -zxvf blackbox_export-0.17.0.linux-amd64.tar.gz -C /app/
# cd /app/
# mv blackbox-export-0.17.0.linux-amd64 blackbox-export
# ln -sv ./blackbox-export /app/blackbox
# cd /app/blackbox
# nohup ./blackbox_export --config.file blackbox.yml --web.listen-address ":9155" &
# ss -nutlp | grep 9155
tcp LISTEN 0 128 *:9155 *:* users:(("blackbox_export",pid=2053,fd=3))
檢 查
http://192.168.XX.*:9155
Prometheus集成
第一個(gè)重新標(biāo)記relabel通過(guò)將address標(biāo)簽即當(dāng)前目標(biāo)地址寫(xiě)入_param_target標(biāo)簽來(lái)創(chuàng)建參數(shù)。
第二個(gè)relabel將獲取的_param_target的值,覆蓋寫(xiě)道instance標(biāo)簽中。
labels:
group: blackbox_exporter
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: 192.168.xx.15:9115
- job_name: "blackbox_exporter_192.168.xx.19:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.19:9115
- job_name: "blackbox_exporter_192.168.xx.16:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.16:9115
- job_name: "blackbox_exporter_192.168.xx.18:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.18:9115
- job_name: "blackbox_exporter_192.168.xx.15:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.15:9115
- job_name: "blackbox_exporter_192.168.xx.17:9115_icmp"
scrape_interval: 6s
metrics_path: /probe
params:
module: [icmp]
static_configs:
- targets:
- 192.168.xx.19
- 192.168.xx.16
- 192.168.xx.18
- 192.168.xx.15
- 192.168.xx.17
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:xx)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: ping
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 192.168.xx.17:9115
通過(guò)在grafana官網(wǎng)下載blackbox的監(jiān)控json導(dǎo)入。
總 結(jié)
黑盒監(jiān)控相較于白盒監(jiān)控最大的不同在于黑盒監(jiān)控是以故障為導(dǎo)向當(dāng)故障發(fā)生時(shí),黑盒監(jiān)控能快速發(fā)現(xiàn)故障,所以我們監(jiān)控時(shí)候以粒度比較細(xì)的,如端口、接口、線(xiàn)路等進(jìn)行監(jiān)控可以快速實(shí)現(xiàn)和定制化我們需要的相關(guān)監(jiān)控策略。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/129454.html
摘要:京東云監(jiān)控響應(yīng)實(shí)踐京東云運(yùn)維平臺(tái)為數(shù)萬(wàn)臺(tái)機(jī)器提供監(jiān)控,部署,機(jī)器管理,權(quán)限管理,安全管理,審計(jì)和運(yùn)營(yíng)分析等功能,為京東云所有的業(yè)務(wù)在各類(lèi)異構(gòu)網(wǎng)絡(luò)環(huán)境下提供標(biāo)準(zhǔn)和統(tǒng)一的運(yùn)維支撐能力。 showImg(https://segmentfault.com/img/bVbsKlQ); 微服務(wù)本身并沒(méi)有一個(gè)嚴(yán)格的定義,不過(guò)從很多人的反饋來(lái)看,大家都達(dá)成了這樣一個(gè)共識(shí):微服務(wù)是一種簡(jiǎn)單的應(yīng)用,大概有...
摘要:本文已經(jīng)收錄在合集都可以采集那些指標(biāo)常用合集中。允許通過(guò)和對(duì)接口進(jìn)行黑盒探測(cè)監(jiān)控。我們來(lái)看這個(gè)示例文件,其他是經(jīng)常搭配服務(wù)發(fā)現(xiàn)來(lái)進(jìn)行工作的,比如搭配基于的服務(wù)發(fā)現(xiàn)來(lái)進(jìn)行。小結(jié)其實(shí)在監(jiān)控系統(tǒng)中非常實(shí)用,尤其是監(jiān)控和監(jiān)控。 本文已經(jīng)收錄在 Prometheus 合集 Prometheus 都可以采集那些指標(biāo)?-- ...
摘要:結(jié)合的日志發(fā)現(xiàn)就算是發(fā)生了老年代也已經(jīng)回收不了,內(nèi)存已經(jīng)到頂。定位由于生產(chǎn)上的內(nèi)存文件非常大,達(dá)到了幾十。也是由于我們的內(nèi)存設(shè)置太大有關(guān)。同時(shí)后臺(tái)也開(kāi)始打印內(nèi)存溢出了,這樣便復(fù)現(xiàn)出問(wèn)題。結(jié)果發(fā)現(xiàn)類(lèi)型的對(duì)象占用了將近的內(nèi)存。 showImg(https://segmentfault.com/img/remote/1460000016186784?w=2048&h=1365); 前言 Ou...
摘要:也就是說(shuō)整個(gè)監(jiān)控系統(tǒng)不是部署在中。非的怎么監(jiān)控是今天需要討論的問(wèn)題。官方給出的配置聯(lián)邦機(jī)制也實(shí)現(xiàn)了的擴(kuò)展。我們的集群外監(jiān)控的方案就基于此。在同一個(gè)數(shù)據(jù)中心,每個(gè)監(jiān)控其他的。上一級(jí)的監(jiān)控?cái)?shù)據(jù)中心級(jí)別的。 前言 有時(shí)候?qū)τ谝粋€(gè)公司,k8s集群或是所謂的caas只是整個(gè)技術(shù)體系的一部分,往往這個(gè)時(shí)候監(jiān)控系統(tǒng)不僅僅要k8s集群以及k8s中部署的應(yīng)用,而且要監(jiān)控傳統(tǒng)部署的項(xiàng)目。也就是說(shuō)整個(gè)監(jiān)控系...
摘要:也就是說(shuō)整個(gè)監(jiān)控系統(tǒng)不是部署在中。非的怎么監(jiān)控是今天需要討論的問(wèn)題。官方給出的配置聯(lián)邦機(jī)制也實(shí)現(xiàn)了的擴(kuò)展。我們的集群外監(jiān)控的方案就基于此。在同一個(gè)數(shù)據(jù)中心,每個(gè)監(jiān)控其他的。上一級(jí)的監(jiān)控?cái)?shù)據(jù)中心級(jí)別的。 前言 有時(shí)候?qū)τ谝粋€(gè)公司,k8s集群或是所謂的caas只是整個(gè)技術(shù)體系的一部分,往往這個(gè)時(shí)候監(jiān)控系統(tǒng)不僅僅要k8s集群以及k8s中部署的應(yīng)用,而且要監(jiān)控傳統(tǒng)部署的項(xiàng)目。也就是說(shuō)整個(gè)監(jiān)控系...
閱讀 1357·2023-01-11 13:20
閱讀 1707·2023-01-11 13:20
閱讀 1215·2023-01-11 13:20
閱讀 1907·2023-01-11 13:20
閱讀 4165·2023-01-11 13:20
閱讀 2758·2023-01-11 13:20
閱讀 1402·2023-01-11 13:20
閱讀 3673·2023-01-11 13:20