背景和思路
某公司隨著業(yè)務(wù)擴(kuò)張和信息化發(fā)展迅速,目前共有服務(wù)器 3000+臺(tái),存儲(chǔ)容量 50PB+, 依據(jù)未來規(guī)劃各個(gè)機(jī)房中心需同步規(guī)劃、同步擴(kuò)容、同步運(yùn)行,由集團(tuán)IT云管理平臺(tái)統(tǒng)一管理,將提供包括 X86 物理機(jī)、虛擬機(jī)、分布式塊 存儲(chǔ)、分布式文件存儲(chǔ)、FC/IP SAN 存儲(chǔ)、備份系統(tǒng)以及網(wǎng)絡(luò)設(shè)備、安全設(shè)備、負(fù)載均衡設(shè)備等基礎(chǔ)資源。屆時(shí)龐大的基礎(chǔ)設(shè)施資源的性能監(jiān)控、資源管理是信息中心重點(diǎn)工作之一。
當(dāng)前整個(gè)IT系統(tǒng)資源池的設(shè)備分布在2個(gè)物理數(shù)據(jù)中心、4個(gè)虛擬化集群、3000+多臺(tái)操作系統(tǒng)、500+數(shù)據(jù)庫/中間件,如何監(jiān)控眾多的物理設(shè)備、虛擬設(shè)備、數(shù)據(jù)庫、中間件成為維護(hù)人員繁重而困難的工作,同時(shí)資源的有效管理和利用也是每天需要挑戰(zhàn)的工作,針對(duì)虛擬化集群如何提供一個(gè)統(tǒng)一的監(jiān)控方法和統(tǒng)一可視化展示資源、性能的數(shù)據(jù)成為急需解決的問題。
智能化統(tǒng)一監(jiān)控展示方案,能夠自動(dòng)的對(duì)資源進(jìn)行持續(xù)的監(jiān)控,實(shí)時(shí)獲取資源的資源配置及性能數(shù)據(jù),通過預(yù)警閥值的配置進(jìn)行自動(dòng)告警推送;同時(shí)通過大屏的方式對(duì)資源數(shù)據(jù)和性能數(shù)據(jù)進(jìn)行直觀的可視化展示,有效的提高監(jiān)控工作的效率,同時(shí)實(shí)時(shí)、全景的展示給資源管理提供有力決策保障 。
實(shí)施方案
1)開發(fā)部署監(jiān)控代理工具
通過監(jiān)控代理工具去發(fā)現(xiàn)及監(jiān)控資源池資源信息:
上傳“環(huán)境初始化腳本/deploy”這個(gè)目錄和目錄中所有文件;
安裝執(zhí)行腳本所需的依賴包,命令行運(yùn)行:yum -y install dos2unix gcc-c++ zlib zlib-devel openssl-devel;
執(zhí)行“環(huán)境初始化腳本/deploy/deploy.sh”,如腳本執(zhí)行過程有提示缺依賴,直接通過yum安裝缺失的依賴包。
數(shù)據(jù)源列表:
說明:統(tǒng)計(jì)各種運(yùn)維資源的數(shù)量及占比情況;
說明:統(tǒng)計(jì)數(shù)據(jù)中心平臺(tái)資源層各種應(yīng)用/數(shù)據(jù)庫資源的占比情況;
說明:統(tǒng)計(jì)數(shù)據(jù)中心IT資產(chǎn)的設(shè)備數(shù)量及使用情況;
說明:按業(yè)務(wù)系統(tǒng)維度統(tǒng)計(jì)各業(yè)務(wù)系統(tǒng)資源的占比情況;
按主機(jī)維度統(tǒng)計(jì)各種應(yīng)用/數(shù)據(jù)庫資源的占比情況;
說明:排序統(tǒng)計(jì)各業(yè)務(wù)系統(tǒng)的主機(jī)數(shù)量,并展示top10;
說明:統(tǒng)計(jì)各主機(jī)的資源使用情況,并展示top10;
說明:統(tǒng)計(jì)各業(yè)務(wù)系統(tǒng)中間件和數(shù)據(jù)庫的數(shù)量,并展示top10;
說明:統(tǒng)計(jì)虛擬化集群的CPU內(nèi)存存儲(chǔ)資源剩余情況,以及剩余資源還可能創(chuàng)建的虛機(jī)數(shù)量;
系統(tǒng)主機(jī)資源占比TOP5
系統(tǒng)告警分布TOP10
系統(tǒng)平均響應(yīng)時(shí)間趨勢(shì)
撥測(cè)實(shí)時(shí)圖
系統(tǒng)總可用率
系統(tǒng)健康度
系統(tǒng)平均響應(yīng)時(shí)間
當(dāng)前用戶體驗(yàn)度
系統(tǒng)近一月健康度趨勢(shì)
系統(tǒng)近一月負(fù)載趨勢(shì)
說明:以時(shí)間趨勢(shì)展示系統(tǒng)所有主機(jī)近一個(gè)月的負(fù)載情況;
說明:以時(shí)間趨勢(shì)展示系統(tǒng)所有告警的情況。
實(shí)施技術(shù)點(diǎn)
3.1 無agent采集
通過大屏的方式展示數(shù)據(jù)中心全景的資源使用狀態(tài)及性能狀態(tài),幫助客戶在更短的時(shí)間內(nèi)掌握信息中心的資源信息,提供快速的決策能力。
應(yīng)用情況
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/129270.html
摘要:今天,阿里數(shù)據(jù)庫事業(yè)部研究員張瑞,將為你講述雙數(shù)據(jù)庫技術(shù)不為人知的故事。這十年,阿里巴巴數(shù)據(jù)庫團(tuán)隊(duì)一直有一個(gè)使命推動(dòng)中國數(shù)據(jù)庫技術(shù)變革。 第十個(gè)雙11即將來臨之際,阿里技術(shù)推出《十年牧碼記》系列,邀請(qǐng)參與歷年雙11備戰(zhàn)的核心技術(shù)大牛,一起回顧阿里技術(shù)的變遷。 今天,阿里數(shù)據(jù)庫事業(yè)部研究員張瑞,將為你講述雙11數(shù)據(jù)庫技術(shù)不為人知的故事。在零點(diǎn)交易數(shù)字一次次提升的背后,既是數(shù)據(jù)庫技術(shù)的一次...
摘要:安全態(tài)勢(shì)可視化系統(tǒng)的目的是生成網(wǎng)絡(luò)安全綜合態(tài)勢(shì)圖,以多視圖多角度多尺度的方式與用戶進(jìn)行交互??梢钥吹?,黑客攻擊是無處不在,無時(shí)不有的,世界互聯(lián)網(wǎng)的安全態(tài)勢(shì)并不如我們印象中那么隱蔽和少見。 導(dǎo)語 網(wǎng)絡(luò)態(tài)勢(shì)可視化技術(shù)作為一項(xiàng)新技術(shù),是網(wǎng)絡(luò)安全態(tài)勢(shì)感知與可視化技術(shù)的結(jié)合,將網(wǎng)絡(luò)中蘊(yùn)涵的態(tài)勢(shì)狀況通過可視化圖形方式展示給用戶,并借助于人在圖形圖像方面強(qiáng)大的處理能力,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)異常行為的分析和檢測(cè)...
摘要:明確了客服調(diào)度的核心問題,也知道了難點(diǎn),更看到了目前的現(xiàn)狀后,我們決定打造一款自動(dòng)智能的客服調(diào)度系統(tǒng)。對(duì)于社會(huì)化的云客服,我們可以做到,比如排隊(duì)數(shù)超過某值時(shí),自動(dòng)觸發(fā)云客服的應(yīng)急放班。 背景 為什么客服需要調(diào)度?阿里集團(tuán)客戶體驗(yàn)事業(yè)群(CCO)目前承接了阿里集團(tuán)以及生態(tài)體的客戶服務(wù)業(yè)務(wù),我們的客戶通過各個(gè)渠道來尋求解決各類問題,每天的進(jìn)線量巨大,而且經(jīng)常伴隨著突發(fā)性進(jìn)線,比如天貓代金券...
摘要:今天,我們邀請(qǐng)阿里高級(jí)技術(shù)專家力君,為大家分享自動(dòng)智能的客服調(diào)度系統(tǒng)。明確了客服調(diào)度的核心問題,也知道了難點(diǎn),更看到了目前的現(xiàn)狀后,我們決定打造一款自動(dòng)智能的客服調(diào)度系統(tǒng)。 小嘰導(dǎo)讀:提到調(diào)度,大家腦海中可能想起的是調(diào)度阿里云的海量機(jī)器資源,而對(duì)于阿里集團(tuán)客戶體驗(yàn)事業(yè)群(CCO)而言,我們要調(diào)度的不是機(jī)器,而是客服資源。今天,我們邀請(qǐng)阿里高級(jí)技術(shù)專家力君,為大家分享自動(dòng)、智能的客服調(diào)度...
閱讀 1358·2023-01-11 13:20
閱讀 1707·2023-01-11 13:20
閱讀 1215·2023-01-11 13:20
閱讀 1907·2023-01-11 13:20
閱讀 4165·2023-01-11 13:20
閱讀 2759·2023-01-11 13:20
閱讀 1402·2023-01-11 13:20
閱讀 3673·2023-01-11 13:20