摘要:這種集成使軟件能夠檢測(cè)應(yīng)用程序級(jí)別的任何和所有停機(jī)時(shí)間,無(wú)論其原因如何,其中包括各種云計(jì)算服務(wù)等級(jí)協(xié)議未涵蓋的原因。
采用云計(jì)算的注意事項(xiàng)是一種很好的建議。云計(jì)算服務(wù)提供商(CSP)都會(huì)承諾在其基礎(chǔ)設(shè)施中提供“高可用性”,其服務(wù)水平協(xié)議(SLA)通常提供95%至99.99%的正常運(yùn)行時(shí)間,而每月服務(wù)費(fèi)退款率將達(dá)到10%到50%不等。但通常沒(méi)有達(dá)到這樣的門檻,正如IT的許多方面一樣,重要的在于細(xì)節(jié)。
而采用正確的方法,在Amazon Web Services、谷歌云平臺(tái)和微軟Azure公共云和混合云環(huán)境中可以實(shí)現(xiàn)5個(gè)9的高可用性(HA)。這需要了解服務(wù)等級(jí)協(xié)議(SLA)中的限制,以及創(chuàng)建高可用配置的選項(xiàng)。
高可用性限制
大多數(shù)云計(jì)算服務(wù)提供商都提供具有99.99%正常運(yùn)行時(shí)間保證的服務(wù)等級(jí)協(xié)議(SLA),而跨越云計(jì)算服務(wù)提供商(CSP)區(qū)域和/或區(qū)域的冗余配置增加了企業(yè)獲得滿意可用性的信心。但是這種安排存在一些嚴(yán)重問(wèn)題,因?yàn)榉?wù)等級(jí)協(xié)議(SLA)中“停機(jī)時(shí)間”和“不可用”是導(dǎo)致應(yīng)用程序失敗的原因。
不計(jì)入停機(jī)的潛在原因包括客戶的軟件,任何第三方軟件或技術(shù),計(jì)劃的硬件和軟件維護(hù),以及個(gè)別實(shí)例或卷的某些問(wèn)題,這些問(wèn)題不能歸因于某些不可用的情況。還排除了錯(cuò)誤的輸入或指令,或在需要時(shí)缺乏行動(dòng),這似乎涵蓋了“人為錯(cuò)誤”可能的原因。
云計(jì)算服務(wù)提供商(CSP)排除某些失敗原因是合理的,但系統(tǒng)管理員將這些作為借口是不負(fù)責(zé)任的。這使得有必要通過(guò)其他方式確保應(yīng)用程序的更高可用性。
實(shí)現(xiàn)更高可靠性的選項(xiàng)
通常,有三種基本選項(xiàng)可用于提高云計(jì)算的可用性:應(yīng)用程序軟件中的規(guī)定,操作系統(tǒng)中內(nèi)置的功能,以及專用的故障轉(zhuǎn)移集群。
許多應(yīng)用程序提供自己的高可用性(HA)規(guī)定。一個(gè)很好的例子是Microsoft SQL Server企業(yè)版中的運(yùn)營(yíng)商級(jí)在可用性組上始終使用的功能。這種方法的問(wèn)題在于需要針對(duì)不同的應(yīng)用程序提供不同的高可用性(HA)規(guī)定,這使得持續(xù)管理成為一項(xiàng)持續(xù)且成本高昂的工作。
第二個(gè)選項(xiàng)涉及使用集成到操作系統(tǒng)中的高可用性(HA)功能。 Windows Server具有故障轉(zhuǎn)移集群的本機(jī)功能,但其缺乏數(shù)據(jù)復(fù)制功能。私有云中的復(fù)制通常通過(guò)某種形式的共享存儲(chǔ)提供,例如存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)。但是,在公共云中,共享存儲(chǔ)不可用,因此需要多帶帶的數(shù)據(jù)復(fù)制解決方案。
在Linux操作系統(tǒng)上,由于缺少像故障轉(zhuǎn)移集群這樣的本機(jī)功能,因此需要多帶帶的高可用性(HA)規(guī)定。因此,實(shí)施高可用性(HA)需要使用像Pacemaker和Corosync這樣的開(kāi)源軟件為每個(gè)應(yīng)用程序創(chuàng)建(然后維護(hù))自定義腳本,并且只有規(guī)模非常大的組織才有能力承擔(dān)所涉及的巨大而持續(xù)努力。
第三種選擇是采用第三方故障轉(zhuǎn)移集群軟件,這是專門用于為公共云、私有云和混合云上的Windows操作系統(tǒng)或Linux操作系統(tǒng)上運(yùn)行的應(yīng)用程序提供完整的高可用性和災(zāi)難恢復(fù)解決方案。
這些解決方案至少結(jié)合了數(shù)據(jù)復(fù)制、連續(xù)應(yīng)用程序級(jí)監(jiān)控、可配置的故障轉(zhuǎn)移/故障恢復(fù)恢復(fù)策略。這種集成使軟件能夠檢測(cè)應(yīng)用程序級(jí)別的任何和所有停機(jī)時(shí)間,無(wú)論其原因如何,其中包括各種云計(jì)算服務(wù)等級(jí)協(xié)議(SLA)未涵蓋的原因。許多解決方案還提供高級(jí)功能,例如支持WAN優(yōu)化以提高性能,以及人工切換主服務(wù)器和輔助服務(wù)器分配以促進(jìn)計(jì)劃維護(hù)。
雖然這些解決方案可以在私有云中與SAN配合使用,但大多數(shù)管理員更喜歡部署無(wú)共享SANless故障轉(zhuǎn)移群集。其原因包括:消除潛在的單點(diǎn)故障、獲得在公共云中工作的能力、并最小化恢復(fù)點(diǎn)對(duì)象(RPO)、恢復(fù)時(shí)間對(duì)象(RTO)和最短恢復(fù)時(shí)間(MTTR)。
5個(gè)9的故障轉(zhuǎn)移集群配置
上圖顯示了一個(gè)三節(jié)點(diǎn)SANless故障轉(zhuǎn)移集群,可在混合云中提供5個(gè)9的高可用性以及強(qiáng)大的災(zāi)難恢復(fù)保護(hù)。該應(yīng)用程序是一個(gè)使用SQL Server標(biāo)準(zhǔn)版中的故障轉(zhuǎn)移集群實(shí)例(FCI)的數(shù)據(jù)庫(kù)。SQL1和SQL2位于公共云中具有SQL3的企業(yè)數(shù)據(jù)中心。在數(shù)據(jù)中心內(nèi),跨LAN的數(shù)據(jù)復(fù)制是同步的,以最大限度地縮短完成故障轉(zhuǎn)移所需的時(shí)間,從而最大限度地提高可用性。
這個(gè)三節(jié)點(diǎn)SANless故障轉(zhuǎn)移集群能夠以最小的停機(jī)時(shí)間和無(wú)數(shù)據(jù)丟失處理兩個(gè)并發(fā)故障。
在這個(gè)示例中,SQL1最初是主要活動(dòng)實(shí)例,它將數(shù)據(jù)連續(xù)復(fù)制到SQL2和SQL3。如果SQL1失敗,應(yīng)用程序?qū)⒆詣?dòng)將故障轉(zhuǎn)移到SQL2,然后SQL2將成為SQL3的主要復(fù)制數(shù)據(jù)。
一旦問(wèn)題得到解決,SQL1可以恢復(fù)成主要節(jié)點(diǎn),或者SQL2可以繼續(xù)在該容量中將數(shù)據(jù)復(fù)制到SQL1和SQL3。如果SQL2在SQL1返回操作之前失敗, SQL3將成為主要的節(jié)點(diǎn)。此外建議使用人工故障轉(zhuǎn)移,以防止由于到公共云的WAN鏈路中固有的較高延遲而導(dǎo)致數(shù)據(jù)丟失。
像這樣的三節(jié)點(diǎn)集群還有助于為所有三臺(tái)服務(wù)器進(jìn)行計(jì)劃的硬件和軟件維護(hù),同時(shí)為應(yīng)用程序及其數(shù)據(jù)提供持續(xù)的災(zāi)難恢復(fù)保護(hù)。通過(guò)易于實(shí)施和操作的方式有效和高效地使用所有資源,故障轉(zhuǎn)移集群軟件使得5個(gè)9的高可用性更加經(jīng)濟(jì)實(shí)惠,其中包括混合云。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/6503.html
摘要:這種集成使軟件能夠檢測(cè)應(yīng)用程序級(jí)別的任何和所有停機(jī)時(shí)間,無(wú)論其原因如何,其中包括各種云計(jì)算服務(wù)等級(jí)協(xié)議未涵蓋的原因。 采用云計(jì)算的注意事項(xiàng)是一種很好的建議。云計(jì)算服務(wù)提供商(CSP)都會(huì)承諾在其基礎(chǔ)設(shè)施中提供高可用性,其服務(wù)水平協(xié)議(SLA)通常提供95%至99.99%的正常運(yùn)行時(shí)間,而每月服務(wù)費(fèi)退款率將達(dá)到10%到50%不等。但通常沒(méi)有達(dá)到這樣的門檻,正如IT的許多方面一樣,重要的在...
摘要:隨著許多公司正在經(jīng)歷數(shù)字化轉(zhuǎn)型全球增長(zhǎng)或簡(jiǎn)單地重新投資業(yè)務(wù),公共云和成為其基礎(chǔ)設(shè)施的重要組成部分。所有其他企業(yè)唯一可用的選擇是利用應(yīng)用程序和公共云增強(qiáng)自己的私有云和內(nèi)部部署工作負(fù)載,以提供滿足最終客戶員工和開(kāi)發(fā)人員需求所需的服務(wù)。如今,多云世界已經(jīng)真正到來(lái)。很多組織采用多個(gè)公共云(如AWS、谷歌云、Microsoft Azure)、私有云、云計(jì)算基礎(chǔ)服務(wù)(如SaaS、IaaS),以及在一個(gè)或...
摘要:但是,隨著企業(yè)采用云計(jì)算,并創(chuàng)建將本地私有云與公共云服務(wù)相關(guān)聯(lián)的混合云,許多企業(yè)未能將環(huán)境的公共部分置于同樣的安全環(huán)境之下。了解他們?nèi)绾螒?yīng)對(duì)事故,并確保企業(yè)了解自己的責(zé)任。如今的IT組織通常擅長(zhǎng)評(píng)估和選擇硬件和軟件。對(duì)傳統(tǒng)數(shù)據(jù)中心部署的基礎(chǔ)設(shè)施和應(yīng)用程序的獲取遵循嚴(yán)格的過(guò)程,并檢查每個(gè)細(xì)節(jié),以確定提供什么內(nèi)容,如何適應(yīng)現(xiàn)有的計(jì)算環(huán)境,以及將如何滿足業(yè)務(wù)和技術(shù)需要等。但是,隨著企業(yè)采用云計(jì)算,...
摘要:如今,云遷移的第一波浪潮即將結(jié)束,關(guān)鍵性較低的應(yīng)用程序?qū)⑥D(zhuǎn)移到公共云供應(yīng)商。一項(xiàng)企業(yè)戰(zhàn)略小組研究發(fā)現(xiàn),遷移應(yīng)用程序或遷移到軟件即服務(wù)的組織由于性能令人失望或成本上升而將數(shù)據(jù)和或應(yīng)用程序內(nèi)部轉(zhuǎn)移。如今,云遷移的第一波浪潮(Cloud 1.0)即將結(jié)束,關(guān)鍵性較低的應(yīng)用程序?qū)⑥D(zhuǎn)移到公共云供應(yīng)商。而下一波浪潮的推動(dòng)要困難得多,這就是組織希望遷移運(yùn)營(yíng)其業(yè)務(wù)的應(yīng)用程序以獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的地方。調(diào)研機(jī)構(gòu)Ga...
摘要:為什么需要多樣化雖然亞馬遜谷歌和微軟等公共云提供商可以提供非常強(qiáng)大和可靠的服務(wù),但企業(yè)擁有多個(gè)云平臺(tái)和提供商的服務(wù)至關(guān)重要。如今,越來(lái)越多的企業(yè)接受了云計(jì)算。無(wú)論被當(dāng)作企業(yè)基礎(chǔ)設(shè)施的一部分,還是托管應(yīng)用程序,還是作為首選平臺(tái),總之公共云越來(lái)越受歡迎。調(diào)研機(jī)構(gòu)451Research公司最近開(kāi)展了一項(xiàng)調(diào)查研究,研究發(fā)現(xiàn)由于IaaS、SaaS和PaaS的使用增加,到2020年,很多企業(yè)的大部分工作...
閱讀 1685·2019-08-30 15:55
閱讀 997·2019-08-30 15:44
閱讀 892·2019-08-30 10:48
閱讀 2064·2019-08-29 13:42
閱讀 3205·2019-08-29 11:16
閱讀 1335·2019-08-29 11:09
閱讀 2079·2019-08-26 11:46
閱讀 635·2019-08-26 11:44