摘要:有一次別人的云服務器被攻擊,提供商竟然重啟了物理機然后又諸多悲劇出現(xiàn)最大的感恩就是學到了很多知識。
第一階段(3臺):1測試,1web 1數(shù)據(jù)庫
這個是云服務器,配置高的驚人,測試的機子竟然和正式的機子一模一樣,只實現(xiàn)了web和數(shù)據(jù)庫分離的構(gòu)架
維持了3個月,由于物理機故障,3臺服務器同時掛掉,網(wǎng)站暫停服務至少一天
master-slave:
還是云服務器,配置還是高的驚人, 除了另一個機房實現(xiàn)了web備份和數(shù)據(jù)庫主從外,跟第一階段沒什么差別
因為一次數(shù)據(jù)庫服務器數(shù)據(jù)頁面錯誤,主庫崩潰,web和數(shù)據(jù)庫跨機房了
master-master
上一次的教訓是數(shù)據(jù)庫修復的時候,發(fā)現(xiàn)master的數(shù)據(jù)必須從slave導出來...數(shù)據(jù)一致性的要求.
痛定思痛,決定上雙master-master,這個時候出現(xiàn)了一個應用層的悲劇,就是多個項目要公用一部分表了,而web卻在另在兩個服務器上 期間為了解決沖突,把自增id給岔開了
這個階段最大的悲劇在同一個機房內(nèi),web+數(shù)據(jù)庫沒有備份的,在某次攻擊后,悲劇的發(fā)現(xiàn),web+數(shù)據(jù)必須切換到那個備份的機房去了
第三階段...還在進行中...
推進太困難了,經(jīng)過2次事故..我有點不想繼續(xù)既做開發(fā)又做運維的了...出現(xiàn)問題的時候大家說,我不知道啊,服務器不歸我管理,我怎么操作呢?要講解運維思路的時候大家又不積極
總結(jié)得出的最大教訓就是:云服務器太不穩(wěn)定了,要以數(shù)量取勝,不能同一機柜。有一次別人的云服務器被攻擊,提供商竟然重啟了物理機..然后又諸多悲劇出現(xiàn)
最大的感恩就是:學到了很多知識。每次事故服務器我都要被迫親自參與修復,本來不那么熟悉的,一下子被強迫做了很多事情
最近這段時間開始測試的東西有:
Fabric 用于多項目多服務器的代碼發(fā)布...
Atlas 數(shù)據(jù)庫讀寫分離中間件,從另一方面說也是屏蔽數(shù)據(jù)庫服務器差異的中間件,這點認識很重要,如果有3臺web,當一臺出現(xiàn)問題是,3臺的數(shù)據(jù)庫連接都要修改,但有了這個中間件,只要把有問題的offline即可...1分鐘就能搞定
Fabric 已經(jīng)上線使用,Atlas 上線遙遙無期..很多坑等待被發(fā)現(xiàn)
2014年2月8日補充:今天因為到期,來不及續(xù)費,還剩下10個小時的時間,服務器竟然自動關機了...還好,是關機而已,不是刪除服務器....坑啊
2014年2月12日補充:今天新增加2臺服務器,準備內(nèi)網(wǎng)使用,中國的帶寬真TMD的貴.并不是每臺都能10M出口帶寬的..
因為沒有統(tǒng)一的上傳文件和圖片,每個服務器都把圖片上傳到自己那臺,最近要考慮怎么把這些圖片整合起來了,因為圖片量比較少,所以準備了一下方案:
rsync + crontab
rsync + inotify
sersync + inotify
inotify + svn
不知道大家還有其它方案么?難點在于多臺服務器之間相互rsync...
再次重申云服務器的好處:新開服務器幾乎是1小時以內(nèi),然后,一定要以數(shù)量取勝...
2014年2月13日補充:今天同一個物理盤所在的云盤上可能有人大量寫入數(shù)據(jù)...導致同一個機柜上的N個機子云盤io 100%... 以前對云主機都沒怎么認識,今天真是大開眼界了...
云盤和云主機,另一個大坑就是:天佑同機柜和同物理機的的人都正正當當,不然,一般的人都不知道問題出在哪里
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/7905.html
摘要:有一次別人的云服務器被攻擊,提供商竟然重啟了物理機然后又諸多悲劇出現(xiàn)。造成微博服務短暫不可用。通過建立工具來診斷問題,并創(chuàng)建一種復盤事故的文化來推動并作出改進,防止未來發(fā)生故障。 showImg(https://segmentfault.com/img/bV0jif?w=900&h=385); 相信小伙伴們在上網(wǎng)或者玩游戲的時候一定都遇到過無法訪問的情況。服務器炸了的原因有各種各樣,下...
摘要:在谷歌不是這樣,谷歌不會把特定的應用裝在某臺服務器上,業(yè)務應用和服務器的強綁定對于谷歌這種量級的數(shù)據(jù)中心的維護難度太高了。但是金融機構(gòu)的數(shù)據(jù)中心規(guī)模不像谷歌這么大,所以能做到業(yè)務應用和硬件的強綁定。 復雜的基礎IT架構(gòu)是傳統(tǒng)金融的現(xiàn)狀,如何快速響應用戶需求,加快新業(yè)務上線速度,縮短產(chǎn)品的迭代周期? 數(shù)人云在容器落地金融云的2年實踐中,實現(xiàn)金融核心業(yè)務技術(shù)WebLogic、J2EE、Or...
摘要:分享實錄云計算技術(shù)源于互聯(lián)網(wǎng)公司,現(xiàn)在云計算已經(jīng)是下一代企業(yè)級的發(fā)展趨勢。如何做云計算一直是云計算技術(shù)的領導者?;ヂ?lián)網(wǎng)公司的快速發(fā)展,已經(jīng)印證了云計算技術(shù)和云原生應用相比傳統(tǒng)構(gòu)架的巨大優(yōu)勢。 今天小數(shù)又給大家?guī)硪黄韶洕M滿的分享——來自KVM社區(qū)線上群分享的實錄,分享嘉賓是數(shù)人云CEO王璞,題目是《云計算與 Cloud Native》。這是數(shù)人云在KVM社區(qū)群分享的第一彈,之后還有數(shù)...
摘要:摘要第九屆中國數(shù)據(jù)庫技術(shù)大會,阿里云數(shù)據(jù)庫產(chǎn)品專家蕭少聰帶來以阿里云如何打破遷移上云的壁壘為題的演講。于是,阿里云給出了上面的解決方案。 摘要: 2018第九屆中國數(shù)據(jù)庫技術(shù)大會,阿里云數(shù)據(jù)庫產(chǎn)品專家蕭少聰帶來以阿里云如何打破Oracle遷移上云的壁壘為題的演講。Oracle是指數(shù)據(jù)庫管理系統(tǒng),面對Oracle遷移上云的壁壘,阿里云如何能夠打破它呢?本文提出了Oracle 到云數(shù)據(jù)庫P...
閱讀 1428·2021-10-11 11:12
閱讀 3258·2021-09-30 09:46
閱讀 1644·2021-07-28 00:14
閱讀 3147·2019-08-30 13:49
閱讀 2594·2019-08-29 11:27
閱讀 3248·2019-08-26 11:52
閱讀 610·2019-08-23 18:14
閱讀 3447·2019-08-23 16:27