摘要:前言告警將重要信息發(fā)送給運(yùn)維或者其他相關(guān)人,及時(shí)發(fā)現(xiàn)并且處理問題。在所有開源監(jiān)控軟件里面,的告警方式無疑是最棒的。在發(fā)生告警之后立即發(fā)送郵件和微信消息給用戶,分鐘后還未確認(rèn),那么發(fā)送短信,分鐘還未確認(rèn)則打電話給用戶。
1. 前言
告警將重要信息發(fā)送給運(yùn)維「或者其他相關(guān)人」,及時(shí)發(fā)現(xiàn)并且處理問題。在所有開源監(jiān)控軟件里面,Zabbix 的告警方式無疑是最棒的。告警的方式各式各樣,從 Email 告警到飛信、139/189郵箱、最后到微信甚至電話告警,接入存在各種問題以及困難,有沒有什么軟件能夠?qū)⑺麄傾ll In one呢?OneAlert
2. Zabbix傳統(tǒng)告警方法Email:調(diào)用 sendmail 、sendEmail 等腳本通過 SMTP 發(fā)送郵件
飛信:飛信已經(jīng)退出歷史舞臺(tái),不再有人使用
189/139:發(fā)送郵箱郵件至郵箱,郵箱將短信轉(zhuǎn)到用戶手機(jī)短信,存在一定的延遲
微信:需要申請(qǐng)一個(gè)微信公眾號(hào),并接入API,整個(gè)流程比較復(fù)雜,而且存在會(huì)話時(shí)間限制
短信:眾多短信網(wǎng)關(guān)收費(fèi)不同、穩(wěn)定性也不確定,需要通過API接入
3.傳統(tǒng)告警 VS OneAlert在整個(gè)使用過程中,得出了傳統(tǒng)告警方式的不足以及給個(gè)了 OneAlert 告警的功能,具體如下:
3.1 傳統(tǒng)告警方式的不足Zabbix 郵件告警經(jīng)常發(fā)不出去
如需短信告警,要么購(gòu)買短信貓要么購(gòu)買短信 API,整個(gè)流程太麻煩
微信告警需要申請(qǐng)公眾號(hào)以及 API 接入,而且會(huì)話有時(shí)間限制
夜間的告警基本成為一個(gè)擺設(shè),試問誰能被微弱的短信聲叫醒
阿里云、騰訊云、Zabbix 各種系統(tǒng)告警都需要多帶帶配置,工作繁瑣
普遍缺少告警分析
139/189 發(fā)送告警存在明顯的延遲
3.2 OneAlert告警功能告警 All In One,支持微信、郵箱、短信、APP、電話告警
支持接入 Zabbix、Nagios、阿里云、騰訊云、監(jiān)控寶等等告警信息
靈活的分配策略,可靈活的分配告警信息發(fā)送給相關(guān)人員
微信、郵箱、app 等告警方式全部免費(fèi)
4.接入準(zhǔn)備由于 Zabbix 官方已經(jīng)升級(jí)到zabbix-3.0.0alpha,考慮到未來的趨勢(shì),我也迫不及待的升級(jí)到了 3.0,除了 Web 風(fēng)格變化,大部分都差不多。所以本文適用于 Zabbix2.x 與 Zabbix3.x 版本。接下來跟著涼白開將 OneAlert 接入 Zabbix,如有任何疑問或者不足,歡迎加群或者在 ttlsa.com 留言一起交流!
5. OneAlert 后臺(tái)操作 5.1 設(shè)置提醒郵件,短信,微信,電話提醒,多策略提醒,如下圖,靈活的定義告警規(guī)則。在發(fā)生告警之后立即發(fā)送郵件和微信消息給用戶,10分鐘后還未確認(rèn),那么發(fā)送短信,30分鐘還未確認(rèn)則打電話給用戶。
5.2 設(shè)置分派策略可以設(shè)定做種分派策略,在告警第一時(shí)間發(fā)送通知給哪些人,如果在 30 分鐘還未處理好,可以將消息發(fā)送給上級(jí)主管人員,如下圖
5.3 創(chuàng)建應(yīng)用登陸 OneAlert 后臺(tái),點(diǎn)擊告警 -> 應(yīng)用 -> 新增應(yīng)用,集成類型包含阿里、Nagios、騰訊云等多種,我們選擇 Zabbix 最后保存即可。將會(huì)生成應(yīng)用 KEY,Key 在后面將會(huì)被用到!
6.安裝onealert agent#cd /usr/local/src/ # wget http://cdn.110monitor.com/open/download/alert-agent-4.0.1-RC2.tar.gz # tar –xvf alert-agent-4.0.1-RC2.tar.gz(注意:參數(shù)為-xvf,不是-xzvf) # cp -rp alert-agent /usr/local/zabbix-3.0.0/alertscripts # cd /usr/local/zabbix-3.0.0/alertscripts # cp alert-agent/plugin/zabbix-plugin/110monitor . # chmod +x ./110monitor7. Zabbix 集成OneAlert
以下操作均在 Zabbix Web 后臺(tái)完成
7.1 創(chuàng)建 OneAlert 媒介administration->Media Types->create media type,如下圖
7.2 Admin 用戶添加 OneAlert 媒介Administration->Users->Admin->點(diǎn)擊media->Add,輸入如下:send to 為 OneAlert 后臺(tái)生成的 key
點(diǎn)擊Configuration->Action->create action
主題為trigger和resolve,意味著告警觸發(fā)和恢復(fù)都會(huì)同步到 110monitor
設(shè)置告警內(nèi)容,注意冒號(hào)「:」前的內(nèi)容不可變更,冒號(hào)「:」后的內(nèi)容可以自行編輯,只能使用以下7調(diào)告警信息,否則告警無法發(fā)送至 OneAlert 接口
`alarmName:{TRIGGER.NAME}` `entityName:{HOSTNAME}` ` entityId:{IPADDRESS}` `value:{TRIGGER.VALUE}` ` eventId:{EVENT.ID}` `priority:{TRIGGER.SEVERITY}` `alarmContent:{IPADDRESS} ` `{ITEM.NAME}:{ITEM.VALUE}`8. Zabbix + OneAlert 集成測(cè)試
來制造一個(gè)故障,選定一臺(tái) Zabbix 客戶端,執(zhí)行如下命令:
# killall zabbix_agentd
等候五分鐘,OneAlert 后臺(tái)有如下告警
并且也收到了微信(需要關(guān)注公眾號(hào),并且綁定賬號(hào))和短信告警
9. OneAlert 告警分析提供了一份 Zabbix 等開源監(jiān)控都沒有的告警信息分析,運(yùn)維能清晰的掌握最近服務(wù)器狀態(tài)
10. 總結(jié)OneAlert與Zabbix的集成就說到這,如有任何疑問或者不足,歡迎加群或者在 ttlsa.com 留言一起交流!
作者:涼白開 網(wǎng)址:http://www.ttlsa.com
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/7926.html
摘要:也有幸和全球說運(yùn)維負(fù)責(zé)人李云偉先生進(jìn)行一次深入溝通。面臨挑戰(zhàn)全球說的應(yīng)用主要是在線系統(tǒng)和移動(dòng)為主。是北京科技有限公司旗下產(chǎn)品,中國(guó)首個(gè)模式的,集成國(guó)內(nèi)外主流監(jiān)控支撐系統(tǒng),實(shí)現(xiàn)一個(gè)平臺(tái)上集中處理所有事件,提升可靠性。 客戶背景 「全球說」 Talkmate,是北京酷語時(shí)代教育科技有限公司(酷語科技)旗下產(chǎn)品,酷語科技是一家誕生于中國(guó)的語言技術(shù)公司,致力于為全球用戶提供一個(gè)全新的多語言學(xué)習(xí)...
摘要:告警關(guān)聯(lián)唯一使監(jiān)控和報(bào)警都步入正軌的好辦法,就是通過告警關(guān)聯(lián)。企業(yè)如果適應(yīng)了告警關(guān)聯(lián),信息告警的圖表盤上確實(shí)能減少很多壓力。 上節(jié)回顧 對(duì)于許多 IT 和運(yùn)維團(tuán)隊(duì)來說,Nagios 既是一個(gè)福音也是一個(gè)詛咒。一方面,Naigos 在 IT 應(yīng)用的工作領(lǐng)域中,給予了你可以實(shí)時(shí)查看告警數(shù)據(jù)的可能性;但是另一方面,Nagios 也能夠生成超級(jí)多的告警,對(duì)于任何一個(gè)運(yùn)維人員或是運(yùn)維團(tuán)隊(duì)來說都是...
摘要:如何有效處理緊急事件驅(qū)動(dòng)的工作,成為特別是運(yùn)維主管運(yùn)維工作的關(guān)鍵。通知到位和及時(shí)響應(yīng)。機(jī)器學(xué)習(xí)領(lǐng)域是未來的重要發(fā)展方向,目前我們還在摸索中。機(jī)器學(xué)習(xí)告警合并事件單的處理如果告警量很大,告警后續(xù)處理和跟蹤往往會(huì)依賴于外部團(tuán)隊(duì)部門外或公司外。 編者按]本文作者為陳伯龍,云告警平臺(tái)[OneAlert創(chuàng)始人,著《云計(jì)算與OpenStack》,在IT運(yùn)營(yíng)管理、云計(jì)算方面從業(yè)10多年。 正文 互聯(lián)...
摘要:如何有效處理緊急事件驅(qū)動(dòng)的工作,成為特別是運(yùn)維主管運(yùn)維工作的關(guān)鍵。通知到位和及時(shí)響應(yīng)。機(jī)器學(xué)習(xí)領(lǐng)域是未來的重要發(fā)展方向,目前我們還在摸索中。機(jī)器學(xué)習(xí)告警合并事件單的處理如果告警量很大,告警后續(xù)處理和跟蹤往往會(huì)依賴于外部團(tuán)隊(duì)部門外或公司外。 編者按]本文作者為陳伯龍,云告警平臺(tái)[OneAlert創(chuàng)始人,著《云計(jì)算與OpenStack》,在IT運(yùn)營(yíng)管理、云計(jì)算方面從業(yè)10多年。 正文 互聯(lián)...
摘要:作為骨灰級(jí)粉絲,一直以來對(duì)第三方監(jiān)控都是拒絕的。例如白屏?xí)r間首屏?xí)r間腳本錯(cuò)誤網(wǎng)頁加載就緒時(shí)間各種瀏覽器的訪問情況,甚至能了解不同瀏覽器運(yùn)營(yíng)商地區(qū)用戶的訪問狀況。腳本錯(cuò)誤在所難免,錯(cuò)誤進(jìn)一步導(dǎo)致網(wǎng)站部分功能無法使用。 作為 Zabbix 骨灰級(jí)粉絲,一直以來對(duì)第三方監(jiān)控(APM)都是拒絕的。一來覺得收費(fèi),二來擔(dān)心數(shù)據(jù)被人所知,三來覺得 Zabbix 牛逼到無可取代。但是,隨著 APM 市...
閱讀 3044·2021-11-02 14:40
閱讀 854·2019-08-30 15:53
閱讀 1273·2019-08-30 15:53
閱讀 3269·2019-08-30 13:53
閱讀 3313·2019-08-29 12:50
閱讀 1142·2019-08-26 13:49
閱讀 1874·2019-08-26 12:20
閱讀 3672·2019-08-26 11:33