摘要:第一次遭遇云服務(wù)器完全崩潰突然控制臺(tái)無(wú)法重啟控制臺(tái)無(wú)法強(qiáng)制關(guān)機(jī)。到目前為止,騰訊云的工程師和我本人都沒(méi)有找到具體原因。檢查日志,和騰訊云工單的工程師討論。
第一次遭遇云服務(wù)器完全崩潰:CPU 突然 100%、控制臺(tái)無(wú)法重啟、控制臺(tái)無(wú)法強(qiáng)制關(guān)機(jī)。到目前為止,騰訊云的工程師和我本人都沒(méi)有找到具體原因。
本文所示圖片使用的是 github 倉(cāng)庫(kù)圖片,網(wǎng)速過(guò)慢的朋友請(qǐng)移步原文地址或者來(lái)我的小站godbmw.com
1. 案件陳述案發(fā)地點(diǎn):騰訊學(xué)生云 ubuntu 16.04,寬帶 1M
案發(fā)時(shí)間:2018-10-09 13:40
案件陳述:
2018-10-09 12:37 左右,CPU 使用率突增到 100%,內(nèi)網(wǎng)出入寬帶、流量包、內(nèi)存使用量均無(wú)異常。
2018-10-09 13:28 正式死機(jī),控制臺(tái)無(wú)法強(qiáng)制重啟(清除緩存、更換瀏覽器依然無(wú)法重啟)、無(wú)法強(qiáng)制關(guān)機(jī)。
開始提交工單,周折很久,討論無(wú)果。遂沒(méi)有消息。
2018-10-09 14:00 重回控制臺(tái),再次強(qiáng)制重啟成功!
重新上線了自己的項(xiàng)目和公司的一些腳本,慶幸沒(méi)造成損失。
檢查日志,和騰訊云工單的工程師討論。雙方確認(rèn)日志沒(méi)有問(wèn)題,無(wú)法排查出錯(cuò)誤。
2. 災(zāi)難現(xiàn)場(chǎng)首先是,個(gè)人網(wǎng)站無(wú)法進(jìn)入,如下圖:
首先是,無(wú)法強(qiáng)制重啟和強(qiáng)制關(guān)機(jī),如下圖所示,請(qǐng)注意截圖上方的報(bào)錯(cuò)提示信息:
騰訊云的控制臺(tái)已經(jīng)說(shuō)明了,強(qiáng)制關(guān)機(jī)是強(qiáng)制切斷電源的物理操作!這都沒(méi)法進(jìn)行,我本人表示很迷。
在提交的工單的過(guò)程中,有大概 20 分鐘的時(shí)間,是沒(méi)有任何回復(fù)的。然后大概到了 2018-10-09 14:00,多次嘗試后,終于可以強(qiáng)制關(guān)機(jī)和重啟了。有圖為證:
以上情況,不得不讓我懷疑,是工程師們手動(dòng)去關(guān)的服務(wù)器電源:)
3. 如何補(bǔ)救?經(jīng)過(guò)這次服務(wù)器事件才體會(huì)到:云服務(wù)的穩(wěn)定性是多么重要! 這次事件騰訊云的工程師也沒(méi)語(yǔ)焉不詳,我只能猜測(cè)是:服務(wù)器的物理問(wèn)題。
所以,我這次果斷準(zhǔn)備了兩個(gè)服務(wù)器,開始做“負(fù)載均衡”(還要修改備案)。除此之外,日常備份數(shù)據(jù)也是非常重要。
最后,還是希望云服務(wù)商的服務(wù)盡量保持穩(wěn)定,至少在服務(wù)器崩潰的情況下,可以找出崩潰原因并且修復(fù)。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/8074.html
摘要:在未來(lái)十年,管理數(shù)據(jù)倉(cāng)庫(kù)的服務(wù)器的數(shù)量將增加倍以便迎合倍的大數(shù)據(jù)增長(zhǎng)。毫無(wú)疑問(wèn),大數(shù)據(jù)將挑戰(zhàn)企業(yè)的存儲(chǔ)架構(gòu)及數(shù)據(jù)中心基礎(chǔ)設(shè)施等,也會(huì)引發(fā)云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘商業(yè)智能等應(yīng)用的連鎖反應(yīng)。 大數(shù)據(jù)正在徹底改變IT世界。那么,什么樣的數(shù)據(jù)談得上數(shù)據(jù)呢? ? 根據(jù)IDC的報(bào)告,未來(lái)十年全球大數(shù)據(jù)將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬(wàn)億GB)的大數(shù)據(jù)創(chuàng)建產(chǎn)生。這相當(dāng)...
摘要:毫無(wú)疑問(wèn),大數(shù)據(jù)將挑戰(zhàn)企業(yè)的存儲(chǔ)架構(gòu)及數(shù)據(jù)中心基礎(chǔ)設(shè)施等,也會(huì)引發(fā)云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘商業(yè)智能等應(yīng)用的連鎖反應(yīng)。 ?????? 大數(shù)據(jù)正在徹底改變IT世界。那么,什么樣的數(shù)據(jù)談得上數(shù)據(jù)呢? 根據(jù)IDC的報(bào)告,未來(lái)十年全球大數(shù)據(jù)將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬(wàn)億GB)的大數(shù)據(jù)創(chuàng)建產(chǎn)生。這相當(dāng)于每位美國(guó)人每分鐘寫3條Tweet,而且還是不停地寫2.6976...
摘要:如果組織受到自然災(zāi)害的影響,云備份可能無(wú)法幫組織恢復(fù)其物理基礎(chǔ)設(shè)施,但它可以為組織保存大量重要的數(shù)據(jù)。企業(yè)一旦與云備份提供商達(dá)成合作關(guān)系,并確定了要備份的內(nèi)容備份計(jì)劃,以及恢復(fù)要求,供應(yīng)商就會(huì)接管,提供程序確保備份正確執(zhí)行,并按計(jì)劃執(zhí)行。2017年9月和10月對(duì)許多人來(lái)說(shuō)可能記憶深刻。哈維颶風(fēng)在9月襲擊了美國(guó)德克薩斯州,幾個(gè)星期后,伊爾瑪颶風(fēng)對(duì)佛羅里達(dá)州造成了嚴(yán)重破壞,隨后在墨西哥和危地馬拉...
摘要:因?yàn)?,臉書的服?wù)器也擁堵了,還是遭遇了有史以來(lái)全球最大的宕機(jī)事故。另外,專家估計(jì)全球服務(wù)中斷一小時(shí)將給全球經(jīng)濟(jì)造成億美元的損失。相比于這些損失而言,受此消息影響,的股價(jià)今天暴跌了近,創(chuàng)下全年最大單日跌幅,百億市值瞬間蒸發(fā)。 上面這個(gè)公號(hào)「澀郎」,是我的一個(gè)備用號(hào),為了防止萬(wàn)一哪天大號(hào)失聯(lián)...
閱讀 1101·2023-04-25 17:51
閱讀 2894·2021-11-23 09:51
閱讀 1509·2021-11-08 13:21
閱讀 2509·2021-09-22 15:14
閱讀 1537·2019-08-30 12:48
閱讀 1103·2019-08-29 12:44
閱讀 1161·2019-08-26 12:21
閱讀 1423·2019-08-26 10:47