成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

日常巡檢自動化

IT那活兒 / 1898人閱讀
日常巡檢自動化



主題



作為運維人員,其中最基本一項職能職責(zé)針對網(wǎng)絡(luò)、服務(wù)器等進行服務(wù)周期內(nèi)的維護。
維護過程中,巡檢是一項必不可缺少的工作。看似簡單的巡檢動作,在日常工作中尤為重要。
“日常巡檢”是對相關(guān)設(shè)備進行日常的巡視和檢查,發(fā)現(xiàn)隱患及時盡可能的去進行安全處理,盡可能的將該隱患處理在萌芽狀態(tài),就可以最大限度的減少該隱患帶來不必要的損失。



背景



本文主要介紹基于智慧運維平臺(AMP)將日常巡檢以及簡單故障恢復(fù)實現(xiàn)自動化處理,并可在流程圖上直觀地看到是哪一步流程出錯,從而進一步快速精準定位問題。



實際場景



日常巡檢之微服務(wù)和組件狀態(tài)巡檢以及故障恢復(fù)

日常巡檢自動化前:

對于平臺的各個微服務(wù)狀態(tài)進行巡檢需要登錄服務(wù)器,進入指定目錄,執(zhí)行命令,查看各個微服務(wù)狀態(tài):
如果發(fā)現(xiàn)有服務(wù)狀態(tài)時 No running狀態(tài)還需要人工執(zhí)行重啟腳本進行針對性啟動。
對于平臺使用的組件狀態(tài)進行巡檢,例如kafka:
平臺的kafka部署在三臺服務(wù)器中,如果想要巡檢三個kafka的狀態(tài)時,最基礎(chǔ)的方法是登錄到每一個服務(wù)器上查看kafka的進程是否存在:
另外方法可以通過查看kafka組件信息和消費信息來確認三臺kafka是否都屬于正常狀態(tài):

1. 查看kafka組信息

./bin/kafka-consumer-groups.sh --bootstrap-server ip:prot --list

2. 查看消費信息

./bin/kafka-consumer-groups.sh --describe --bootstrap-server ip:prot --group 7a4f66af-a983-4a10-9a0c-19424ffcab3d

如果發(fā)現(xiàn)某一個kafka進程掛掉,需要登錄到該服務(wù)器上執(zhí)行重啟腳本進行進程啟動。
同時平臺部署依賴的組件還有zookeeper、redis、Elasticsearch、nginx等。他們巡檢的操作都和kafka 的巡檢步驟相同或者類似。
如果按照最原始的巡檢步驟進行巡檢,那么將上述的所有微服務(wù)、組件巡檢完成,費時費力。且是由于人工操作,會出現(xiàn)巡檢漏掉、或者未注意等等問題。
所以為了減輕人工巡檢時間,提高巡檢效率,減少由人工巡檢帶來的問題。于是使用到了平臺的調(diào)度功能來實現(xiàn)自動化巡檢。
自動巡檢結(jié)果流程圖:
需要做到上述的流程圖的過程為:
  1. 將微服務(wù)、組件所在服務(wù)器安裝Agent并且納入運維由平臺進行管理;
  2. 將各個微服務(wù)、組件的啟動、查看狀態(tài)等腳本分別配置在平臺的操作中,即將服務(wù)器上的腳本復(fù)制到平臺上一份,由平臺來進行執(zhí)行腳本;
  3. 通過平臺的調(diào)度功能進行將各個操作,通過邏輯關(guān)系串聯(lián)在一起,即可形成上圖的結(jié)構(gòu)。
從該流程圖上可以很明確清晰的看到在巡檢過程中Elasticsearch、nginx兩個組件進程異常,并通過了人工審核的步驟,再執(zhí)行重啟,重啟完畢之后再次執(zhí)行集群巡檢,指導(dǎo)正常才通過。


日常巡檢自動化后:

在巡檢過程中不需要人工登陸服務(wù)器,完全在平臺進行操作,避免巡檢人員巡檢不到位、誤操作等問題,解決了傳統(tǒng)巡檢方式的弊端,在此優(yōu)勢之上,自動化巡檢更能將每次巡檢記錄進行導(dǎo)出,為巡檢人員制作巡檢報告提供了可視化數(shù)據(jù),使巡檢報告脫離了繁瑣單一的文字描述的層次。


END


更多精彩干貨分享

點擊下方名片關(guān)注

IT那活兒

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/129796.html

相關(guān)文章

  • 超帥!無人機巡檢上海1.3萬座玻璃幕墻的背后

    摘要:而其中執(zhí)行玻璃幕墻自動巡檢工作的正是合作伙伴獅尾智能研發(fā)的無人機。萬座玻璃幕墻建筑自動巡檢的背后目前,上海有近萬座玻璃幕墻建筑,是世界上玻璃幕墻建筑數(shù)量最大的大都市之一。說到無人機第一個想到的會是什么?大多數(shù)人的回答可能是:航拍玩具但,無人機還能做些什么呢?來看看下邊這個視頻視頻中,無人機正應(yīng)用于上海玻璃幕墻建筑的日常自動巡檢作業(yè),幫助上海住建委完成玻璃幕墻高空風(fēng)險的預(yù)警工作。而其中執(zhí)行玻璃...

    Tecode 評論0 收藏0
  • 數(shù)據(jù)庫管理平臺NetopGO簡介

    摘要:原文出自聽云技術(shù)博客斷斷續(xù)續(xù)寫了將近一個月,聽云第一版數(shù)據(jù)庫管理平臺終于寫完了,期間來來回回的改了好多次小毛病,現(xiàn)在已經(jīng)部署到生產(chǎn)環(huán)境上去了。主機管理這里主要是主機列表管理和業(yè)務(wù)組列表管理。 原文出自【聽云技術(shù)博客】:http://blog.tingyun.com/web/article/detail/600 斷斷續(xù)續(xù)寫了將近一個月,聽云第一版數(shù)據(jù)庫管理平臺終于寫完了,期間來來回回的改...

    YacaToy 評論0 收藏0
  • 智慧園區(qū)三維可視化系統(tǒng)(附方案+源碼)

    摘要:一,智慧園區(qū)建設(shè)的核心價值,三維可視化應(yīng)用,未來智慧園區(qū)管理發(fā)展方向。,應(yīng)急指揮預(yù)案可視化通過對應(yīng)急預(yù)案的資源流程事件預(yù)案進行可視化管理,為園區(qū)重大危險事故提供高效調(diào)度指揮管理手段。獲取智慧園區(qū)三維可視化系統(tǒng)源碼 一,智慧園區(qū)建設(shè)的核心價值 1,三維可視化應(yīng)用,未來智慧園區(qū)管理發(fā)展方向。 ?...

    tanglijun 評論0 收藏0
  • 云計算的運維管理問題

    摘要:運行監(jiān)控云計算的運維管理應(yīng)從數(shù)據(jù)中心的日常監(jiān)控人手,對日常維護管理事件管理變更管理以及應(yīng)急預(yù)案管理等進行全方位的日常監(jiān)控,以提前發(fā)現(xiàn)問題并消除隱患。自動化管理已然成為了當(dāng)前云計算運維管理的一個必然發(fā)展趨勢。從而有效實現(xiàn)云計算運維管理的改進。云計算在企業(yè)運營中的基本工作原理是將計算分布在大量分布式計算機中,從而使企業(yè)數(shù)據(jù)中心的運行和互聯(lián)網(wǎng)更為相似。通過云計算的運維管理,企業(yè)不僅能夠?qū)崿F(xiàn)對IT資...

    CoderBear 評論0 收藏0

發(fā)表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<