摘要:但作為阿里云的用戶,您仍有可能會收到這樣的消息通知,提醒您的實例由于所在物理服務(wù)器存在故障風險需要維護,阿里云設(shè)定了一個實例重啟的系統(tǒng)計劃事件,將在天后重啟該實例并遷移至安全的物理機運行。
摘要: 阿里云會針對ECS實例發(fā)布系統(tǒng)事件,當您收到阿里云計劃維護的通知時,可以利用ECS系統(tǒng)計劃事件了解與實例相關(guān)的計劃維護操作,并根據(jù)您的業(yè)務(wù)特性選擇合適的時間安排運維操作進行故障轉(zhuǎn)移,減少對系統(tǒng)可靠性和業(yè)務(wù)連續(xù)性的影響。
阿里云作為領(lǐng)先和值得信賴的云計算服務(wù)提供商,提供和保障計算、存儲、網(wǎng)絡(luò)資源以及底層基礎(chǔ)設(shè)施的可用性、穩(wěn)定性、安全性。根據(jù)自身戰(zhàn)略發(fā)展和業(yè)務(wù)需求,您可以設(shè)計高可用的云上IT架構(gòu),在阿里云上選擇合適的產(chǎn)品、服務(wù)來搭建部署業(yè)務(wù)系統(tǒng),并管理其中的數(shù)據(jù)。在此基礎(chǔ)上,通過阿里云提供的API、監(jiān)控、編排等多樣化手段實現(xiàn)快速配置資源,搭建多套環(huán)境,自動化部署等IT運維能力。
相較于普通的IDC機房以及服務(wù)器廠商,阿里云會使用更嚴格的IDC標準、服務(wù)器準入標準以及運維標準,以保證云計算整個基礎(chǔ)框架的高可用性、數(shù)據(jù)的可靠性以及云服務(wù)器的高可用性。在此基礎(chǔ)之上,阿里云在各地域提供多可用區(qū)服務(wù),當您需要更高的可用性時,可以利用阿里云的多可用區(qū)搭建自己的主備服務(wù)或者雙活服務(wù)。對于金融等對業(yè)務(wù)連續(xù)性有更高要求的行業(yè)領(lǐng)域,還可以通過多地域和多可用區(qū)搭建出更高的可用性服務(wù),并實現(xiàn)更高的RTO、RPO數(shù)據(jù)保障能力。對于單臺ECS實例, 阿里云承諾一個服務(wù)周期內(nèi)單臺ECS實例的服務(wù)可用性不低于99.95%;對于單地域多可用區(qū),阿里云承諾一個服務(wù)周期內(nèi)該單地域多可用區(qū)的服務(wù)可用性不低于99.99%。為了保障高水平的服務(wù)可用性,阿里云會主動對承載ECS實例運行的物理服務(wù)器做日常維護并修復(fù)潛在的軟硬件等系統(tǒng)故障,以持續(xù)提升系統(tǒng)可靠性、性能和安全防護能力,并在探測到物理服務(wù)器存在故障隱患時在線熱遷移實例至健康的服務(wù)器之上,保持ECS實例的健康運行狀態(tài)。
但作為阿里云的用戶,您仍有可能會收到這樣的消息通知,提醒您的ECS實例由于所在物理服務(wù)器存在故障風險需要維護,阿里云設(shè)定了一個實例重啟的系統(tǒng)計劃事件,將在2天后重啟該實例并遷移至安全的物理機運行。
您可能會疑惑,為什么還會受到這樣的信息呢?其實,這是由阿里云平臺主動運維自動觸發(fā)的維護通知。在主動運維過程上,某些軟硬件故障會導(dǎo)致實例無法在線遷移,這樣的情況下,阿里云會向用戶發(fā)送上述通知,提醒您系統(tǒng)即將通過重啟實例執(zhí)行遷移操作。為了提升您運維ECS實例的效率和體驗,阿里云會發(fā)布ECS實例系統(tǒng)事件功能,當您接收到通知時,可以在ECS控制臺或使用OpenAPI查看系統(tǒng)計劃事件,并根據(jù)業(yè)務(wù)的需要選擇合適的時間點執(zhí)行系統(tǒng)事件(某些情況下只能等待系統(tǒng)事件按計劃時間執(zhí)行)。這樣便免去了通過工單聯(lián)系客服人工介入的過程,減少風險的同時,也為基于系統(tǒng)事件實現(xiàn)自動化故障轉(zhuǎn)移提供了基礎(chǔ),讓運維更高效。
那么ECS實例會存在哪些類型的系統(tǒng)事件呢?阿里云會優(yōu)先發(fā)布系統(tǒng)主動運維觸發(fā)的實例重啟(Reboot)類型事件,隨后會給大家提供更豐富的事件類型來滿足多種運維場景。如果存在系統(tǒng)計劃事件,ECS 控制臺待處理事件按鈕上會出現(xiàn)顯著標示提醒您查看。點擊該按鍵后進入 待處理事件 > 系統(tǒng)計劃事件 頁面,在這里您可以看到實例 ID、地域、運行狀態(tài)等實例相關(guān)信息,計劃執(zhí)行的系統(tǒng)事件相關(guān)信息,推薦的用戶操作和可執(zhí)行操作按鍵。您也可以通過調(diào)用OpenAPI DescribeInstanceFullStatus手動查詢或自動輪詢實例的系統(tǒng)計劃事件。
可以想象,當ECS實例承載關(guān)鍵業(yè)務(wù)時,任何非預(yù)期的實例重啟都有可能對系統(tǒng)可用性和業(yè)務(wù)連續(xù)性造成威脅或嚴重影響,因此我們建議您在搭建應(yīng)用系統(tǒng)時能充分利用可用區(qū)、負載均衡等功能和服務(wù)來提升架構(gòu)和服務(wù)的整體可用性。在此基礎(chǔ)上,對于阿里云主動修復(fù)系統(tǒng)故障觸發(fā)的系統(tǒng)事件,通常系統(tǒng)會提前48小時給您發(fā)送通知,因此您可以利用事件計劃時間之前的這段用戶操作窗口期,做有準備的負載和故障轉(zhuǎn)移操作并重啟實例,比如,在集群環(huán)境中及時將負載從有計劃事件的實例上轉(zhuǎn)移到其他實例,或提前備份、轉(zhuǎn)移本地磁盤的數(shù)據(jù),或主動調(diào)整負載均衡和彈性伸縮的配置,以及基于業(yè)務(wù)邏輯做有順序的啟停實例等主動運維操作,最大限度地降低實例重啟對業(yè)務(wù)連續(xù)性的沖擊。
ECS系統(tǒng)事件的類型和場景會不斷完善和擴展,我們希望通過這樣的方式,逐步提升您在阿里云上的運維效率和體驗,提供更完備的接口和服務(wù)來支持用戶在阿里云上實現(xiàn)無憂運維和業(yè)務(wù)永續(xù)。
原文鏈接
閱讀更多干貨好文,請關(guān)注掃描以下二維碼:
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/11849.html
摘要:但作為阿里云的用戶,您仍有可能會收到這樣的消息通知,提醒您的實例由于所在物理服務(wù)器存在故障風險需要維護,阿里云設(shè)定了一個實例重啟的系統(tǒng)計劃事件,將在天后重啟該實例并遷移至安全的物理機運行。 摘要: 阿里云會針對ECS實例發(fā)布系統(tǒng)事件,當您收到阿里云計劃維護的通知時,可以利用ECS系統(tǒng)計劃事件了解與實例相關(guān)的計劃維護操作,并根據(jù)您的業(yè)務(wù)特性選擇合適的時間安排運維操作進行故障轉(zhuǎn)移,減少對系...
寶塔Linux面板支持哪些linux操作系統(tǒng)?寶塔Linux面板支持的Linux系統(tǒng)有centos、ubuntu、deepin、Alibaba Cloud Linux、debian和fedora等,今天小編來詳細說下寶塔面板支持的Linux操作系統(tǒng)版本及系統(tǒng)兼容性說明:寶塔Linux面板操作系統(tǒng)說明寶塔Linux面板操作系統(tǒng)支持:centos、ubuntu、deepin、Alibaba Cloud...
摘要:我加入了騰訊,騰訊企業(yè)文化很好,經(jīng)常會有很多小組活動部門活動什么的,但是做運維很苦。所以,年的時候我們幾個騰訊的同事一同創(chuàng)業(yè),希望把我們的想法和經(jīng)驗?zāi)軌騻鬟f出來。這里我列出了騰訊互聯(lián)網(wǎng)運維團隊所經(jīng)歷的三個階段。 本文是數(shù)人云深圳技術(shù)分享課上優(yōu)維科技聯(lián)合創(chuàng)始人彭鯉航的演講實錄,演講主題是《運維自動化實踐》。 精彩觀點搶鮮看 實現(xiàn)運維自動化閉環(huán),最主要就是配置管理、狀態(tài)管理和變更管理能力。...
摘要:靈活查詢,聚合分組并存除開單純的聚合和分組,還支持聚合和分組的復(fù)合查詢。所以,與會聚合為一條曲線,而和的關(guān)系則是分組的關(guān)系。當然,的功能在未來,還遠遠不止這些,高效運維的時代才剛剛開啟。 運維 2.0 時代 運維 2.0 是指,從技術(shù)運維升級為服務(wù)運維,向公司提供可依賴的專業(yè)服務(wù)。運維 2.0 強調(diào)服務(wù)交付能力,而不是技術(shù)能力,需求可依賴、懂業(yè)務(wù)、服務(wù)化的專業(yè)運維。 為了了解運維 2....
閱讀 2332·2023-04-26 00:28
閱讀 3079·2019-08-30 15:55
閱讀 2752·2019-08-30 12:47
閱讀 1562·2019-08-29 11:04
閱讀 3189·2019-08-28 18:14
閱讀 954·2019-08-28 18:11
閱讀 1682·2019-08-26 18:36
閱讀 3397·2019-08-23 18:21