摘要:集群三步安裝概述應(yīng)當(dāng)是使用監(jiān)控系統(tǒng)的最佳實踐了,首先它一鍵構(gòu)建整個監(jiān)控系統(tǒng),通過一些無侵入的手段去配置如監(jiān)控數(shù)據(jù)源等故障自動恢復(fù),高可用的告警等。。
kubernetes集群三步安裝 概述
prometheus operator應(yīng)當(dāng)是使用監(jiān)控系統(tǒng)的最佳實踐了,首先它一鍵構(gòu)建整個監(jiān)控系統(tǒng),通過一些無侵入的手段去配置如監(jiān)控數(shù)據(jù)源等
故障自動恢復(fù),高可用的告警等。。
不過對于新手使用上還是有一丟丟小門檻,本文就結(jié)合如何給envoy做監(jiān)控這個例子來分享使用prometheus operator的正確姿勢
至于如何寫告警規(guī)則,如何配置prometheus查詢語句不是本文探討的重點,會在后續(xù)文章中給大家分享,本文著重探討如何使用prometheus operator
prometheus operator安裝sealyun離線安裝包內(nèi)已經(jīng)包含prometheus operator,安裝完直接使用即可
配置監(jiān)控數(shù)據(jù)源原理:通過operator的CRD發(fā)現(xiàn)監(jiān)控數(shù)據(jù)源service
apiVersion: apps/v1 kind: Deployment metadata: name: envoy labels: app: envoy spec: replicas: 1 selector: matchLabels: app: envoy template: metadata: labels: app: envoy spec: volumes: - hostPath: # 為了配置方便把envory配置文件掛載出來了 path: /root/envoy type: DirectoryOrCreate name: envoy containers: - name: envoy volumeMounts: - mountPath: /etc/envoy name: envoy readOnly: true image: envoyproxy/envoy:latest ports: - containerPort: 10000 # 數(shù)據(jù)端口 - containerPort: 9901 # 管理端口,metric是通過此端口暴露 --- kind: Service apiVersion: v1 metadata: name: envoy labels: app: envoy # 給service貼上標(biāo)簽,operator會去找這個service spec: selector: app: envoy ports: - protocol: TCP port: 80 targetPort: 10000 name: user - protocol: TCP # service暴露metric的端口 port: 81 targetPort: 9901 name: metrics # 名字很重要,ServiceMonitor 會找端口名
envoy配置文件:
監(jiān)聽的地址一定需要修改成0.0.0.0,否則通過service獲取不到metric
/root/envoy/envoy.yaml
admin: access_log_path: /tmp/admin_access.log address: socket_address: protocol: TCP address: 0.0.0.0 # 這里一定要改成0.0.0.0,而不能是127.0.0.1 port_value: 9901 static_resources: listeners: - name: listener_0 address: socket_address: protocol: TCP address: 0.0.0.0 port_value: 10000 filter_chains: - filters: - name: envoy.http_connection_manager config: stat_prefix: ingress_http route_config: name: local_route virtual_hosts: - name: local_service domains: ["*"] routes: - match: prefix: "/" route: host_rewrite: sealyun.com cluster: service_google http_filters: - name: envoy.router clusters: - name: service_sealyun connect_timeout: 0.25s type: LOGICAL_DNS # Comment out the following line to test on v6 networks dns_lookup_family: V4_ONLY lb_policy: ROUND_ROBIN hosts: - socket_address: address: sealyun.com port_value: 443 tls_context: { sni: sealyun.com }使用ServiceMonitor
envoyServiceMonitor.yaml:
apiVersion: monitoring.coreos.com/v1 kind: ServiceMonitor metadata: labels: app: envoy name: envoy namespace: monitoring # 這個可以與service不在一個namespace中 spec: endpoints: - interval: 15s port: metrics # envoy service的端口名 path: /stats/prometheus # 數(shù)據(jù)源path namespaceSelector: matchNames: # envoy service所在namespace - default selector: matchLabels: app: envoy # 選擇envoy service
create成功后我們就可以看到envoy的數(shù)據(jù)源了:
然后就可以看到metric了:
然后就可以在grafana上進(jìn)行一些配置了,promethues相關(guān)使用不是本文討論的對象
告警配置 alert manager配置[root@dev-86-201 envoy]# kubectl get secret -n monitoring NAME TYPE DATA AGE alertmanager-main Opaque 1 27d
我們可以看到這個secrect,看下里面具體內(nèi)容:
[root@dev-86-201 envoy]# kubectl get secret alertmanager-main -o yaml -n monitoring apiVersion: v1 data: alertmanager.yaml: Imdsb2JhbCI6IAogICJyZXNvbHZlX3RpbWVvdXQiOiAiNW0iCiJyZWNlaXZlcnMiOiAKLSAibmFtZSI6ICJudWxsIgoicm91dGUiOiAKICAiZ3JvdXBfYnkiOiAKICAtICJqb2IiCiAgImdyb3VwX2ludGVydmFsIjogIjVtIgogICJncm91cF93YWl0IjogIjMwcyIKICAicmVjZWl2ZXIiOiAibnVsbCIKICAicmVwZWF0X2ludGVydmFsIjogIjEyaCIKICAicm91dGVzIjogCiAgLSAibWF0Y2giOiAKICAgICAgImFsZXJ0bmFtZSI6ICJEZWFkTWFuc1N3aXRjaCIKICAgICJyZWNlaXZlciI6ICJudWxsIg== kind: Secret
base64解碼一下:
"global": "resolve_timeout": "5m" "receivers": - "name": "null" "route": "group_by": - "job" "group_interval": "5m" "group_wait": "30s" "receiver": "null" "repeat_interval": "12h" "routes": - "match": "alertname": "DeadMansSwitch" "receiver": "null"
所以配置alertmanager就非常簡單了,就是創(chuàng)建一個secrect即可
如alertmanager.yaml:
global: smtp_smarthost: "smtp.qq.com:465" smtp_from: "[email protected]" smtp_auth_username: "[email protected]" smtp_auth_password: "xxx" # 這個密碼是開啟smtp授權(quán)后生成的,下文有說怎么配置 smtp_require_tls: false route: group_by: ["alertmanager","cluster","service"] group_wait: 30s group_interval: 5m repeat_interval: 3h receiver: "fanux" routes: - receiver: "fanux" receivers: - name: "fanux" email_configs: - to: "[email protected]" send_resolved: true
delete掉老的secret,根據(jù)自己的配置重新生成secret即可
kubectl delete secret alertmanager-main -n monitoring kubectl create secret generic alertmanager-main --from-file=alertmanager.yaml -n monitoring郵箱配置,以QQ郵箱為例
開啟smtp pop3服務(wù)
照著操作即可,后面會彈框一個授權(quán)碼,配置到上面的配置文件中
然后就可以收到告警了:
prometheus operator自定義PrometheusRule crd去描述告警規(guī)則
[root@dev-86-202 shell]# kubectl get PrometheusRule -n monitoring NAME AGE prometheus-k8s-rules 6m
直接edit這個rule即可,也可以再自己去創(chuàng)建個PrometheusRule
kubectl edit PrometheusRule prometheus-k8s-rules -n monitoring
如我們在group里加一個告警:
spec: groups: - name: ./example.rules rules: - alert: ExampleAlert expr: vector(1) - name: k8s.rules rules:
重啟prometheuspod:
kubectl delete pod prometheus-k8s-0 prometheus-k8s-1 -n monitoring
然后在界面上就可以看到新加的規(guī)則:
探討可加QQ群:98488045
公眾號:文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/32814.html
摘要:集群三步安裝概述應(yīng)當(dāng)是使用監(jiān)控系統(tǒng)的最佳實踐了,首先它一鍵構(gòu)建整個監(jiān)控系統(tǒng),通過一些無侵入的手段去配置如監(jiān)控數(shù)據(jù)源等故障自動恢復(fù),高可用的告警等。。 kubernetes集群三步安裝 概述 prometheus operator應(yīng)當(dāng)是使用監(jiān)控系統(tǒng)的最佳實踐了,首先它一鍵構(gòu)建整個監(jiān)控系統(tǒng),通過一些無侵入的手段去配置如監(jiān)控數(shù)據(jù)源等故障自動恢復(fù),高可用的告警等。。 不過對于新手使用上還是有一...
摘要:,托管于騰訊云容器平臺容器編排工具。適配我們目前的服務(wù)部署在騰訊云托管,節(jié)點使用核的網(wǎng)絡(luò)增強(qiáng)型機(jī)器,所有的后端服務(wù)都以部署,集群外部署高可用支持集群內(nèi)服務(wù)發(fā)現(xiàn),數(shù)據(jù)庫以為主,消息隊列采用。 距離2017年的見聞技術(shù)架構(gòu)調(diào)整接近2年,隨著業(yè)務(wù)線的發(fā)展,見聞技術(shù)部的項目數(shù)量、項目架構(gòu)類型、基礎(chǔ)設(shè)施規(guī)模、服務(wù)變更頻率都在不斷地增長,帶給SRE的挑戰(zhàn)是如何能更快地助力于開發(fā)人員更快更穩(wěn)定地部署...
摘要:同時有權(quán)限控制日志審計整體配置過期時間等功能。將成為趨勢前置條件要求的版本應(yīng)該是因為和支持的限制的核心思想是將的部署與它監(jiān)控的對象的配置分離,做到部署與監(jiān)控對象的配置分離之后,就可以輕松實現(xiàn)動態(tài)配置。 一.單獨部署 二進(jìn)制安裝各版本下載地址:https://prometheus.io/download/ Docker運(yùn)行 運(yùn)行命令:docker run --name promet...
摘要:在第三部分中,我們將了解如何在服務(wù)網(wǎng)格中啟用分布式跟蹤。在此部署模型中,被部署為服務(wù)的在本例中為客戶端。會在服務(wù)調(diào)用之間添加一些追蹤,并發(fā)送到或您的跟蹤提供商目前支持和。這些示例的上游服務(wù)是。 本博客是深入研究Envoy Proxy和Istio.io 以及它如何實現(xiàn)更優(yōu)雅的方式來連接和管理微服務(wù)系列文章的一部分。 這是接下來幾個部分的想法(將在發(fā)布時更新鏈接): 斷路器(第一部分) ...
摘要:如果你是學(xué)生,計劃參加,現(xiàn)在是審查項目構(gòu)想,并與導(dǎo)師開始討論的最佳時機(jī)。和大會日期會議日程通告日期年月日會議活動舉辦日期年月至日和贊助方案和多元化獎學(xué)金現(xiàn)正接受申請和即將首次合體落地中國和購票窗口,立即購票 showImg(https://segmentfault.com/img/bVbpnJA?w=1280&h=545); Google Summer of Code(GSoC)是面向...
閱讀 2159·2021-11-22 15:22
閱讀 1299·2021-11-11 16:54
閱讀 1829·2021-09-23 11:32
閱讀 3021·2021-09-22 10:02
閱讀 1781·2019-08-30 12:59
閱讀 1095·2019-08-29 16:27
閱讀 630·2019-08-29 13:21
閱讀 2470·2019-08-28 17:57