摘要:打錯(cuò)一個(gè)字母癱瘓半個(gè)互聯(lián)網(wǎng)是怎樣的感受在今天亞馬遜披露了這起事故背后的原因后,很多人心里都會(huì)有一個(gè)疑問(wèn)這個(gè)倒霉的程序員會(huì)被開除嗎關(guān)于這一點(diǎn),雖然主頁(yè)君肯定沒(méi)法做出準(zhǔn)確的判斷,但還是愿意給出我們的猜測(cè)不會(huì)。
2月28號(hào),號(hào)稱「亞馬遜AWS最穩(wěn)定」的云存儲(chǔ)服務(wù)S3出現(xiàn)“超高錯(cuò)誤率”的宕機(jī)事件。
接著,半個(gè)互聯(lián)網(wǎng)都跟著癱瘓了。
一個(gè)字母造成的血案
AWS 最近給出了確切的解釋:一名程序員在調(diào)試系統(tǒng)的時(shí)候,運(yùn)行了一條原本打算刪除少量服務(wù)器的腳本,結(jié)果輸錯(cuò)了一個(gè)字母,導(dǎo)致大量服務(wù)器被刪。為了修復(fù)這個(gè)錯(cuò)誤,亞馬遜不得不重啟整個(gè)系統(tǒng)(在此之前已經(jīng)幾年都沒(méi)有重啟過(guò)了),最終導(dǎo)致了震驚全球的Amazon S3宕機(jī)4個(gè)小時(shí)事件。
我想這名程序猿當(dāng)時(shí)的表情應(yīng)該是這樣的
曾經(jīng)有人計(jì)算過(guò),AWS每宕機(jī)一分鐘,對(duì)亞馬遜造成的損失是$66,240美元...而這還不包括那些依靠AWS來(lái)運(yùn)行自家服務(wù)的公司們的損失。所以這次接近4小時(shí)的宕機(jī)造成多大的損失,只能請(qǐng)大家自行腦補(bǔ)了。
程序員的世界就是這樣的不近人情,一丁點(diǎn)兒錯(cuò)誤就足以釀成大錯(cuò)。在這次“一個(gè)字母造成的血案”之前,剛剛發(fā)生了Gitlab程序猿用錯(cuò)一條命令誤刪了整個(gè)數(shù)據(jù)庫(kù)的悲劇。再久一點(diǎn)以前,歐洲宇航局的的火星探測(cè)器因?yàn)閭鞲衅魇ъ`了僅僅一秒鐘,就造成探測(cè)器在火星表面墜毀,歷時(shí)數(shù)年的探測(cè)計(jì)劃功虧一簣。
所以,當(dāng)你身邊的程序員為了一點(diǎn)點(diǎn)小事較真的時(shí)候,你一定要理解:魔鬼都藏在細(xì)節(jié)里??!
當(dāng)S3宕機(jī)時(shí),你才明白AWS多么強(qiáng)大
幾年前,Google.com曾有一次宕機(jī)了一個(gè)小時(shí)。在那一個(gè)小時(shí)的時(shí)間里,整個(gè)互聯(lián)網(wǎng)的流量減少了40%。當(dāng)時(shí)有人感慨:Google一家就是半個(gè)互聯(lián)網(wǎng)。如今,“半壁江山”的江湖地位似乎要?dú)w屬于亞馬遜了。
AWS是云計(jì)算領(lǐng)域全球的領(lǐng)導(dǎo)者,而S3又是AWS歷史最久的服務(wù),可以說(shuō)是AWS的基石。很多AWS提供的其他服務(wù)都依賴于S3云存儲(chǔ),比如EC2,Lambda 和 EBS 等,所以這次宕機(jī)影響巨大。據(jù)最近的統(tǒng)計(jì)顯示,全球共有148213個(gè)網(wǎng)站和121761個(gè)獨(dú)立域名在使用AWS S3服務(wù)。
就拿這次事故來(lái)說(shuō),很多人一覺起來(lái)發(fā)現(xiàn)手機(jī)里的歌聽不了,電影看不了,股票不能交易,App也沒(méi)法下載,就連家里的智能電器都紛紛罷工(主頁(yè)君家里的電子門鎖都失靈了!)云計(jì)算聽上去離生活很遠(yuǎn),其實(shí)離我們很近。
這次S3宕機(jī)影響到無(wú)數(shù)家公司和服務(wù)
在這里羅列了幾個(gè)著名的:
Apple App Store & icloud
Airbnb
Expedia
Netflix
Quora
Amazon Echo
Amazon.com
Nasdaq
就連AWS自己用來(lái)公布服務(wù)狀態(tài)的 AWS Dashboard 都受到了影響,在一段時(shí)間內(nèi)只能通過(guò)Twitter賬戶來(lái)發(fā)布更新狀態(tài)。這次S3宕機(jī)事件的影響范圍之廣,可見一斑。
“打錯(cuò)一個(gè)字母癱瘓半個(gè)互聯(lián)網(wǎng)”是怎樣的感受?
在今天亞馬遜披露了這起事故背后的原因后,很多人心里都會(huì)有一個(gè)疑問(wèn):
這個(gè)倒霉的程序員會(huì)被開除嗎?
關(guān)于這一點(diǎn),雖然主頁(yè)君肯定沒(méi)法做出準(zhǔn)確的判斷,但還是愿意給出我們的猜測(cè):不會(huì)。
首先,這名程序猿打錯(cuò)命令有沒(méi)有責(zé)任?肯定有。但是,在處理高度可靠的云服務(wù)時(shí),每一次操作都應(yīng)該按照嚴(yán)格的程序,每一個(gè)命令都要經(jīng)過(guò)足夠的審核。除非這名程序員在操作過(guò)程中因?yàn)橥祽惺÷粤艘恍┍匾牟襟E,否則,這次事故更多是系統(tǒng)的責(zé)任,因?yàn)橄到y(tǒng)沒(méi)有足夠的機(jī)制來(lái)防止錯(cuò)誤的發(fā)生。人,都是會(huì)犯錯(cuò)的,只有機(jī)器不會(huì)。
其次,oncall(值班)的程序員一邊操作著影響巨大的的系統(tǒng),一邊還需要爭(zhēng)分奪秒的解決問(wèn)題,肩上的壓力之大難以想象。雖然這次事故確實(shí)是由于一個(gè)打錯(cuò)的字母造成的,但如果事故發(fā)生后,作為云服務(wù)領(lǐng)航者的亞馬遜不是勇敢的承擔(dān)這筆學(xué)費(fèi),而是把鍋甩給某一個(gè)程序員身上,那就太讓人寒心了。
我甚至敢斷言:如果亞馬遜真的做出這樣的決定,那么他們?cè)谌蘸蟮恼衅高^(guò)程中會(huì)遇到很大的困難——每個(gè)程序員都會(huì)三思:我會(huì)不會(huì)成為下一個(gè)背鍋的人?
當(dāng)然,如果這哥們(也可能是姐們)
真的因此被解雇了,想想看——我打錯(cuò)了一個(gè)字母,就癱瘓了半個(gè)互聯(lián)網(wǎng)?
這牛逼也夠吹一輩子了!
最后,主頁(yè)君想說(shuō):程序員這行真的不容易,做云服務(wù)的尤其如此,大家且行且珍惜。對(duì)受到這次事故影響而心驚膽戰(zhàn)了好幾幾天的程序員們說(shuō)一句:加油,你們挺??!
歡迎加入本站公開興趣群軟件開發(fā)技術(shù)群
興趣范圍包括:Java,C/C++,Python,PHP,Ruby,shell等各種語(yǔ)言開發(fā)經(jīng)驗(yàn)交流,各種框架使用,外包項(xiàng)目機(jī)會(huì),學(xué)習(xí)、培訓(xùn)、跳槽等交流
QQ群:26931708
Hadoop源代碼研究群
興趣范圍包括:Hadoop源代碼解讀,改進(jìn),優(yōu)化,分布式系統(tǒng)場(chǎng)景定制,與Hadoop有關(guān)的各種開源項(xiàng)目,總之就是玩轉(zhuǎn)Hadoop
QQ群:288410967?
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/4197.html
前言 學(xué)習(xí)中有一種方式就是錯(cuò)題匯總,在學(xué)習(xí)代碼,日常書寫代碼中對(duì)于遇到報(bào)錯(cuò),也要匯總,這樣可以在以后編碼過(guò)程中避免或解決這些問(wèn)題?! ∫?、報(bào)錯(cuò)結(jié)構(gòu) 首先對(duì)于報(bào)錯(cuò)分為:錯(cuò)誤類型、錯(cuò)誤位置、錯(cuò)誤描述、錯(cuò)誤規(guī)則和問(wèn)題數(shù)量?! ∪缟蠄D: 報(bào)錯(cuò)類型為編譯錯(cuò)誤; 錯(cuò)誤位置在D:\myel\src\views\admin\AdminView.vue中的第四行第2個(gè)字符;(報(bào)錯(cuò)位置不一定每次都是準(zhǔn)確的...
我們所說(shuō)的大帶寬服務(wù)器是一個(gè)泛指,通常針對(duì)國(guó)外服務(wù)器來(lái)說(shuō),10000M、10000M的帶寬就是大帶寬服務(wù)器,RAksmart可提供T級(jí)全球帶寬,功能選擇。大帶寬服務(wù)器擁有以下優(yōu)勢(shì):1、傳輸速度快:大帶寬服務(wù)器最主要就是可以有效實(shí)現(xiàn)雙向數(shù)據(jù)同步傳輸,提升了數(shù)據(jù)的傳輸速度同時(shí),也保證了穩(wěn)定性。而且降低了丟包率,同樣服務(wù)器也是安全性能很強(qiáng)的,可以滿足不同商家的業(yè)務(wù)需要,適用范圍也是更廣泛一些。2、穩(wěn)定性...
服務(wù)器托管劣勢(shì)主要有以下幾點(diǎn): 費(fèi)用高昂:服務(wù)器托管需要付出相對(duì)較高的費(fèi)用,包括服務(wù)器租用費(fèi)、維護(hù)費(fèi)、帶寬費(fèi)等。這些費(fèi)用可能對(duì)于一些小型企業(yè)或個(gè)人來(lái)說(shuō)難以承受?! ⌒枰夹g(shù)人員維護(hù):服務(wù)器托管需要具備一定的技術(shù)能力,需要有專門的技術(shù)人員負(fù)責(zé)服務(wù)器的運(yùn)行和維護(hù)。如果沒(méi)有這方面的技術(shù)人員,就需要額外雇傭技術(shù)人員,增加費(fèi)用。 安全風(fēng)險(xiǎn)較高:服務(wù)器托管的系統(tǒng)和數(shù)據(jù)都存儲(chǔ)在服務(wù)器上,如果服務(wù)器出現(xiàn)安...
摘要:例如同樣的兩份內(nèi)容,一個(gè)使用加速,一個(gè)沒(méi)有,那么加速過(guò)后的網(wǎng)站就會(huì)獲得更高的曝光度。當(dāng)今社會(huì),經(jīng)濟(jì)發(fā)展迅速,許多網(wǎng)站在互聯(lián)網(wǎng)中涌現(xiàn),其中包括文字、圖片、視頻、音頻等等類型,豐富著我們的的生活,事實(shí)上,我們?cè)L問(wèn)的網(wǎng)站能夠大量出現(xiàn)的原因,就是因?yàn)閏dn加速。在還沒(méi)cnd加速之前,我們看一些視頻的時(shí)候,會(huì)出現(xiàn)延遲、卡頓甚至?xí)霈F(xiàn)網(wǎng)絡(luò)崩潰等現(xiàn)象,嚴(yán)重影響我們上網(wǎng)體驗(yàn),有了cdn加速,它能優(yōu)化網(wǎng)站網(wǎng)速...
近年來(lái),越來(lái)越多的用戶選擇高防服務(wù)器,就是為了防止網(wǎng)站受到攻擊,沒(méi)有高防服務(wù)器可能會(huì)被攻擊,導(dǎo)致網(wǎng)癱瘓。從而失去一些客戶,這些損失都是不可估量的。所以,高防服務(wù)器是很重要的。那么我們一般受到的網(wǎng)絡(luò)攻擊有哪些呢?1、CC攻擊:CC攻擊的原理就是攻擊者控制某些主機(jī)不停地發(fā)大量數(shù)據(jù)包給對(duì)方服務(wù)器造成服務(wù)器資源耗盡,一直到宕機(jī)崩潰。CC就是模擬多個(gè)用戶不停地進(jìn)行訪問(wèn)那些需要大量數(shù)據(jù)操作的頁(yè)面,造成服務(wù)器資...
閱讀 2880·2021-11-11 10:58
閱讀 1933·2021-10-11 10:59
閱讀 3500·2019-08-29 16:23
閱讀 2349·2019-08-29 11:11
閱讀 2796·2019-08-28 17:59
閱讀 3846·2019-08-27 10:56
閱讀 2093·2019-08-23 18:37
閱讀 3123·2019-08-23 16:53