摘要:智能調(diào)度系統(tǒng)實(shí)時(shí)監(jiān)測集群所有計(jì)算節(jié)點(diǎn)計(jì)算存儲(chǔ)網(wǎng)絡(luò)等負(fù)載信息,作為虛擬機(jī)調(diào)度和管理的數(shù)據(jù)依據(jù)。當(dāng)有新的虛擬資源需要部署時(shí),調(diào)度系統(tǒng)會(huì)優(yōu)先選擇低負(fù)荷節(jié)點(diǎn)進(jìn)行部署,確保整個(gè)集群節(jié)點(diǎn)的負(fù)載。
智能調(diào)度是 UCloudStack 平臺(tái)虛擬機(jī)資源調(diào)度管理的核心,由調(diào)度模塊負(fù)責(zé)調(diào)度任務(wù)的控制和管理,用于決策虛擬機(jī)運(yùn)行在哪一臺(tái)物理服務(wù)器上,同時(shí)管理虛擬機(jī)狀態(tài)及遷移計(jì)劃,保證虛擬機(jī)可用性和可靠性。
智能調(diào)度系統(tǒng)實(shí)時(shí)監(jiān)測集群所有計(jì)算節(jié)點(diǎn)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等負(fù)載信息,作為虛擬機(jī)調(diào)度和管理的數(shù)據(jù)依據(jù)。當(dāng)有新的虛擬資源需要部署時(shí),調(diào)度系統(tǒng)會(huì)優(yōu)先選擇低負(fù)荷節(jié)點(diǎn)進(jìn)行部署,確保整個(gè)集群節(jié)點(diǎn)的負(fù)載。如下圖所示,新創(chuàng)建的虛擬資源將會(huì)通過調(diào)度檢測,自動(dòng)部署至負(fù)載較低的 Node3 節(jié)點(diǎn)上。
調(diào)度系統(tǒng)在優(yōu)先選擇低負(fù)荷節(jié)點(diǎn)進(jìn)行虛擬資源部署的同時(shí),分別提供打散部署、在線遷移、宕機(jī)遷移等能力,整體保證云平臺(tái)的可靠性。UCloudStack 云平臺(tái)使用分布式存儲(chǔ)提供存儲(chǔ)服務(wù),如上圖所示,虛擬機(jī)均運(yùn)行于分布式存儲(chǔ)池之上,且分布式存儲(chǔ)池可跨多臺(tái)物理機(jī)構(gòu)建統(tǒng)一分布式存儲(chǔ)資源池。虛擬機(jī)的系統(tǒng)盤、鏡像文件及掛載的硬盤均存儲(chǔ)于統(tǒng)一分布式存儲(chǔ)池中,每臺(tái)計(jì)算節(jié)點(diǎn)均可通過分布式存儲(chǔ)池中的虛擬機(jī)的系統(tǒng)盤文件及配置信息注冊一個(gè)相同的虛擬機(jī)進(jìn)程,可作用于在線遷移或宕機(jī)遷移任務(wù)。
在線遷移(虛擬機(jī)熱遷移)是計(jì)劃內(nèi)的遷移操作,即虛擬機(jī)不停機(jī)的情況下,在不同的物理機(jī)之間進(jìn)行在線跨機(jī)遷移。首先是在目標(biāo)物理機(jī)注冊一個(gè)相同配置的虛擬機(jī)進(jìn)程,然后進(jìn)行虛擬機(jī)內(nèi)存數(shù)據(jù)同步,最終快速切換業(yè)務(wù)到目標(biāo)新虛擬機(jī)。整個(gè)遷移切換過程非常短暫,幾乎不影響或中斷用戶運(yùn)行在虛擬機(jī)中的業(yè)務(wù),適用于云平臺(tái)資源動(dòng)態(tài)調(diào)整、物理機(jī)停機(jī)維護(hù)、優(yōu)化服務(wù)器能源消耗等場景,進(jìn)一步增強(qiáng)云平臺(tái)可靠性。
由于采用分布式統(tǒng)一存儲(chǔ),虛擬機(jī)在線遷移時(shí)只遷移 【計(jì)算】 的運(yùn)行位置,不涉及 【存儲(chǔ)】(系統(tǒng)盤、鏡像、云硬盤)位置遷移。遷移時(shí)僅需通過統(tǒng)一存儲(chǔ)內(nèi)的源虛擬機(jī)配置文件在目的主機(jī)上注冊一個(gè)相同配置且狀態(tài)置為暫停的虛擬機(jī)進(jìn)程,然后反復(fù)遷移源虛擬機(jī)的內(nèi)存至目的虛擬機(jī),待虛擬機(jī)內(nèi)存同步一致后,關(guān)閉源虛擬機(jī)并激活目標(biāo)虛擬機(jī)進(jìn)程,最后進(jìn)行網(wǎng)絡(luò)切換并成功接管源虛擬機(jī)業(yè)務(wù)。
整個(gè)遷移任務(wù)僅在激活目標(biāo)虛擬機(jī)及網(wǎng)絡(luò)切換時(shí)業(yè)務(wù)處于短暫中斷,由于激活和切換所用時(shí)間很短,少于 TCP 超時(shí)重傳時(shí)間,因此源虛擬機(jī)業(yè)務(wù)幾乎無感知。同時(shí)由于無需遷移虛擬機(jī)磁盤及鏡像位置,虛機(jī)掛載的云盤遷移后不受影響,可為用戶提供無感知且攜帶存儲(chǔ)數(shù)據(jù)的遷移服務(wù)。具體遷移過程如下:
整個(gè)遷移過程中,從源虛擬機(jī)暫停至目標(biāo)虛擬機(jī)激活并完成網(wǎng)絡(luò)切換為停機(jī)時(shí)間,由于激活虛擬機(jī)及網(wǎng)絡(luò)切換時(shí)間非常短暫,通常小于幾百毫秒,少于 TCP 超時(shí)重傳時(shí)間,對大多數(shù)應(yīng)用服務(wù)來說可忽略不計(jì),因此虛擬機(jī)業(yè)務(wù)幾乎不會(huì)感知到遷移停機(jī)。如智能調(diào)度圖中的 VM6 默認(rèn)運(yùn)行在 Node1 上,管理員通過在線遷移功能手動(dòng)將 VM6 遷移至 Node3 的流程如下:
宕機(jī)遷移又稱離線遷移(Offline Migration)或虛擬機(jī)高可用( High Availability),指平臺(tái)底層物理機(jī)出現(xiàn)異?;蚬收隙鴮?dǎo)致宕機(jī)時(shí),調(diào)度系統(tǒng)會(huì)自動(dòng)將其所承載的虛擬資源快速遷移到健康且負(fù)載正常的物理機(jī),盡量保證業(yè)務(wù)的可用性。整體宕機(jī)遷移不涉及存儲(chǔ)及數(shù)據(jù)遷移,新虛擬機(jī)可快速在新物理機(jī)上運(yùn)行,平均遷移時(shí)間為 90 秒左右,可能會(huì)影響或中斷運(yùn)行在虛擬機(jī)中的業(yè)務(wù)。
由于采用分布式統(tǒng)一存儲(chǔ),虛擬機(jī)的系統(tǒng)盤及寫進(jìn)系統(tǒng)盤的數(shù)據(jù)均存儲(chǔ)在底層分布式存儲(chǔ)中,虛擬機(jī)宕機(jī)遷移只遷移 【計(jì)算】 的運(yùn)行位置,不涉及 【存儲(chǔ)】(系統(tǒng)盤、鏡像、云硬盤)位置遷移,僅需在新物理機(jī)上重新啟動(dòng)虛擬機(jī)并保證網(wǎng)絡(luò)通信即可。遷移機(jī)制說明如下:
整個(gè)遷移過程,從檢測到故障至遷移成功平均為 90 秒左右。虛擬機(jī)啟動(dòng)時(shí)間與源虛擬機(jī)的組件及配置有關(guān),如綁定云硬盤、外網(wǎng) IP 、彈性網(wǎng)卡及操作系統(tǒng)等;同時(shí)由于虛擬機(jī)規(guī)格過大、底層物理資源不足、底層硬件故障等原因可能會(huì)導(dǎo)致宕機(jī)遷移失敗,通常建議盡量保證底層物理資源充足。
如智能調(diào)度圖中的 Node2 節(jié)點(diǎn)故障,智能調(diào)度系統(tǒng)自動(dòng)將 VM3 和 VM4 分別遷移至 Node1 和 Node3 節(jié)點(diǎn),具體流程如下:
宕機(jī)遷移的前提是集群中至少有 2 臺(tái)以上的物理服務(wù)器,且在遷移過程中需保證健康節(jié)點(diǎn)的資源充足及網(wǎng)絡(luò)連通性。通過宕機(jī)遷移技術(shù),為業(yè)務(wù)系統(tǒng)提供高可用性,極大縮短由于各種主機(jī)物理故障或鏈路故障引起的中斷時(shí)間。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/125812.html
在互聯(lián)網(wǎng)市場的頭部效應(yīng)下,企業(yè)所面臨的競爭壓力越來越大,如何有效解決獲客成本高、用戶黏性低、變現(xiàn)能力弱等問題,正是越來越多的企業(yè)開始構(gòu)建大數(shù)據(jù)平臺(tái)的初衷。但由于大數(shù)據(jù)解決方案所涉及的組件錯(cuò)綜復(fù)雜、技術(shù)門檻較高,且初期投入的資源和后期的維護(hù)成本較大,十分考驗(yàn)企業(yè)的大數(shù)據(jù)平臺(tái)組建和運(yùn)維能力。因此,UCloud大數(shù)據(jù)團(tuán)隊(duì)于近期上線了大數(shù)據(jù)智能平臺(tái)(UCloud Smart Data Platform,下...
摘要:物理集群節(jié)點(diǎn)云平臺(tái)系統(tǒng)常見集群節(jié)點(diǎn)角色有種,分別是管理節(jié)點(diǎn)計(jì)算存儲(chǔ)融合節(jié)點(diǎn)獨(dú)立計(jì)算節(jié)點(diǎn)以及獨(dú)立存儲(chǔ)節(jié)點(diǎn)。云平臺(tái)分布式存儲(chǔ)使用所有計(jì)算節(jié)點(diǎn)的數(shù)據(jù)磁盤,每個(gè)節(jié)點(diǎn)僅支持部署一種類型的數(shù)據(jù)磁盤,如等使用作為緩存的場景除外。2.1 物理集群節(jié)點(diǎn)UCloudStack 云平臺(tái)系統(tǒng)常見集群節(jié)點(diǎn)角色有 4 種,分別是管理節(jié)點(diǎn)、計(jì)算存儲(chǔ)融合節(jié)點(diǎn)、獨(dú)立計(jì)算節(jié)點(diǎn)、以及獨(dú)立存儲(chǔ)節(jié)點(diǎn)。2.1.1 管理節(jié)點(diǎn)集群內(nèi)部...
摘要:集群默認(rèn)對所有租戶開放權(quán)限,平臺(tái)支持對存儲(chǔ)集群進(jìn)行權(quán)限控制,用于將部分物理存儲(chǔ)資源獨(dú)享給一個(gè)或部分租戶使用,適用于專屬私有云場景。支持租戶將有權(quán)限的存儲(chǔ)卷信息作為虛擬機(jī)的系統(tǒng)盤,使虛擬機(jī)直接運(yùn)行直商業(yè)存儲(chǔ)中,提升性能。4.1.1 地域地域 ( Region ) 指 UCloudStack 云平臺(tái)物理數(shù)據(jù)中心的地理區(qū)域,如上海、北京、杭州等。不同地域間完全物理隔離,云平臺(tái)資源創(chuàng)建后不能更換地域...
摘要:北京網(wǎng)絡(luò)廣播電視臺(tái)直播室樓上為運(yùn)營團(tuán)隊(duì)在實(shí)時(shí)監(jiān)測點(diǎn)擊大圖在北京網(wǎng)絡(luò)廣播電視臺(tái)的大展廳中,記者對大媒體非常驚艷。其中北京網(wǎng)絡(luò)廣播電視臺(tái)云基礎(chǔ)支撐平臺(tái)架構(gòu)圖點(diǎn)擊大圖涉及了服務(wù)器小型機(jī)網(wǎng)絡(luò)資源池存儲(chǔ)資源池操作系統(tǒng),以及在內(nèi)的虛擬化平臺(tái)。 從2013年下半年開始,媒體與新媒體的分析不絕于耳。面對借移動(dòng)互聯(lián)與社交而日益蓬勃的新媒體的攻勢,傳統(tǒng)媒體是抱殘守缺,還是勇于變革?IPTV的反擊是整個(gè)產(chǎn)業(yè)的...
閱讀 454·2024-11-07 18:25
閱讀 130760·2024-02-01 10:43
閱讀 942·2024-01-31 14:58
閱讀 904·2024-01-31 14:54
閱讀 82999·2024-01-29 17:11
閱讀 3262·2024-01-25 14:55
閱讀 2055·2023-06-02 13:36
閱讀 3164·2023-05-23 10:26