成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

「技術(shù)大牛」是如何縮短事件平均解決時間的?

KavenFan / 2987人閱讀

摘要:總故障時間是關(guān)于告警事件數(shù)量與各告警事件時長的函數(shù)。一個月的告警數(shù)據(jù)顯示平均響應(yīng)時間為分鐘平均解決時間為分鐘。確定團(tuán)隊(duì)領(lǐng)導(dǎo)人此人將在解決故障期間帶領(lǐng)團(tuán)隊(duì)工作。找到并解決問題事件解決時間大部分花在確定告警問題的過程中。

前不久,我們討論了運(yùn)維不容錯過的 4個關(guān)鍵指標(biāo),其中平均解決時間(MTTR)被認(rèn)為是衡量業(yè)務(wù)的最佳標(biāo)準(zhǔn),隨后也分析了「告警等級」對MTTR的重要性。

正確看待 MTTR

MTTR 為從故障發(fā)生到故障修復(fù)所經(jīng)歷的時間??偣收蠒r間是關(guān)于告警事件數(shù)量與各告警事件時長的函數(shù)。經(jīng)過仔細(xì)地探討這兩項(xiàng)因素及其優(yōu)先級,結(jié)合具體情況,總結(jié)以下策略用來縮短MTTR:

1)加快工作速度 = 然并卵

如果想通過加快工作速度降低 MTTR,理論上是完美的,但是骨感的現(xiàn)實(shí)根本不按我們的劇本走!為了對 MTTR 進(jìn)行持續(xù)的、可衡量的改進(jìn),應(yīng)該對故障事件進(jìn)行深入的調(diào)查,分析事件的復(fù)雜程度及重要程度,然后從人與系統(tǒng)的協(xié)作上,實(shí)現(xiàn)對流程進(jìn)行優(yōu)化。

2)檢驗(yàn)告警響應(yīng)時間

一旦事件發(fā)生,「MTTR」時鐘便開始計(jì)時。通過調(diào)整通知流程,或許就能速戰(zhàn)速決。下圖為常見故障處理過程:

還不夠直觀?數(shù)據(jù)來說話。 OneAlert 一個月的告警數(shù)據(jù)顯示:平均響應(yīng)時間為 2.8 分鐘;平均解決時間為 27 分鐘。(不要問我為什么你們的響應(yīng)時間要好幾個小時?。?/p>

如果你的響應(yīng)時間較長,建議檢查一下團(tuán)隊(duì)值班響應(yīng)機(jī)制,告警是否可有效傳達(dá)給了正確的人?如果一線排版人員無響應(yīng),告警能否自動升級?升級時間閾值是多少?通過設(shè)定接近平均響應(yīng)時間的適當(dāng)期望值和目標(biāo),能確保所有成員盡快對告警作出響應(yīng)。

3)建立故障解決流程

告警響應(yīng)時間過長,說明告警響應(yīng)機(jī)制存在問題,故需建立有效的故障解決流程,即需確保以下內(nèi)容:

建立有效溝通協(xié)議——明確每個人的任務(wù)分工,確立有效溝通方式。以 OneAlert 為例,團(tuán)隊(duì)的溝通方式主要有 QQ 群聊、WeChat 聊天室、釘釘?shù)取?/p>

確定團(tuán)隊(duì)領(lǐng)導(dǎo)人——此人將在解決故障期間帶領(lǐng)團(tuán)隊(duì)工作。需要做好記錄并合理安排工作。

做好記錄——應(yīng)當(dāng)詳細(xì)記錄故障期間發(fā)生的一切。這些記錄在你事后回顧之時將會非常有用。OneAlert 團(tuán)隊(duì)領(lǐng)導(dǎo)人還會定期總結(jié)告警事件。

熟能生巧——確保團(tuán)隊(duì)中每一個人都不是告警響應(yīng)的新手。

4)找到并解決問題

事件解決時間大部分花在確定告警問題的過程中。所以,如何更快的明確問題的關(guān)鍵,是目前各大監(jiān)控工具搶占市場的核心武器。但是未來可以肯定的是,找到問題還不夠,自動化處理才是發(fā)展的出路。這部分內(nèi)容將在后期的文章中深入探討。

OneAlert 是應(yīng)用性能管理領(lǐng)軍企業(yè) OneAPM 公司旗下產(chǎn)品,也是國內(nèi)首個 SaaS 模式的云告警平臺,集成國內(nèi)外主流監(jiān)控/支撐系統(tǒng),實(shí)現(xiàn)一個平臺上集中處理所有 IT 事件,提升 IT 可靠性。想了解更多信息,請?jiān)L問 OneAlert 官網(wǎng) 。

本文轉(zhuǎn)自 OneAPM 官方博客

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/7963.html

相關(guān)文章

  • vivo統(tǒng)一告警平臺設(shè)計(jì)與實(shí)踐

    摘要:告警當(dāng)一個問題通過告警系統(tǒng)將消息以短信電話郵件等方式告知給用戶時,我們稱之為一條告警。圖統(tǒng)一告警系統(tǒng)結(jié)構(gòu)圖告警收斂對于告警平臺每天會產(chǎn)生數(shù)以萬計(jì)的告警,這些告警對于運(yùn)維或開發(fā)人員都需要去分析甄別優(yōu)先級并處理故障。 一、背景一套監(jiān)控系統(tǒng)檢測和告警是密不可分的,檢測用來發(fā)現(xiàn)異常,告警用來將問題信息發(fā)送給相應(yīng)的人。v...

    Rocko 評論0 收藏0
  • 架構(gòu)師必備技能:阿里大牛教你畫出一張合格技術(shù)架構(gòu)圖

    摘要:術(shù)作者三畫,阿里巴巴技術(shù)專家,梓敬鵬升和余樂對此文亦有貢獻(xiàn)。接下來,阿里巴巴技術(shù)專家三畫,將分享自己和團(tuán)隊(duì)在畫好架構(gòu)圖方面的理念和經(jīng)驗(yàn),希望對你有所幫助。架構(gòu)是結(jié)構(gòu)和愿景。架構(gòu)圖的作用一圖勝千言。 showImg(https://segmentfault.com/img/bVbrpzm?w=1000&h=739);術(shù) 作者 | 三畫,阿里巴巴技術(shù)專家,梓敬、鵬升和余樂對此文亦有貢獻(xiàn)。...

    jokester 評論0 收藏0
  • 區(qū)塊鏈共識算法

    摘要:沒有哪種共識機(jī)制是完美的,各共識機(jī)制都有其優(yōu)缺點(diǎn),有些共識機(jī)制就是為了解決一些特定問題而生區(qū)塊鏈中的共識算法分為驗(yàn)證池,工作證明。網(wǎng)絡(luò)延遲有可能使某些代表沒能及時廣播他們的區(qū)塊,而這將導(dǎo)致區(qū)塊鏈分叉。 沒有哪種共識機(jī)制是完美的,各共識機(jī)制都有其優(yōu)缺點(diǎn),有些共識機(jī)制就是為了解決一些特定問題而生 區(qū)塊鏈中的共識算法分為:POW、POS、DPOS、PBFT、POOL驗(yàn)證池 1、POW:Pro...

    Jrain 評論0 收藏0
  • 對抗告警疲勞8種方法

    摘要:編者按本文作者為,主要介紹告警疲勞的產(chǎn)生原因與對抗告警疲勞的種方法。告警疲勞不僅會影響團(tuán)隊(duì)成員的工作情緒,而且會阻礙軟件交付鏈的成長。利用工具事件管理工具對抵抗告警疲勞大有幫助。 【編者按】本文作者為 Chris Riley,主要介紹告警疲勞的產(chǎn)生原因與對抗告警疲勞的8種方法。文章系國內(nèi) ITOM 管理平臺 OneAPM 編譯呈現(xiàn)。 各司其職、孤軍作戰(zhàn)非常不利于團(tuán)隊(duì)溝通,一旦發(fā)生重大事...

    Julylovin 評論0 收藏0
  • 如何學(xué)習(xí)小程序

    摘要:行勝于言,理論結(jié)合實(shí)踐才是王道,所以本文我將基于前面的學(xué)習(xí)方法,分享我是如何學(xué)習(xí)微信小程序的。第二個目標(biāo)則需要學(xué)習(xí)小程序的插件相關(guān)接口調(diào)用,以及蟬知建站系統(tǒng)這邊的微信模塊代碼。 前段時間和大家一起分享了一篇關(guān)于學(xué)習(xí)方法內(nèi)容《大牛與搬運(yùn)工的差距——學(xué)習(xí)方法的力量》。我們將學(xué)習(xí)過程分成八步,并借鑒了敏捷開發(fā)的迭代思想,以達(dá)到自我迭代學(xué)習(xí)的效果。行勝于言,理論結(jié)合實(shí)踐才是王道,所以本文我將基...

    XGBCCC 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<