MySQL主從復(fù)制技術(shù)應(yīng)用非常廣泛,M-S復(fù)制架構(gòu)、keepalived+M-M復(fù)制架構(gòu)、MHA等高可用架構(gòu)都基于MySQL主從復(fù)制技術(shù)。但因主從復(fù)制是基于binlog的邏輯復(fù)制,實際應(yīng)中,可能會因為各種原因出現(xiàn)主從數(shù)據(jù)不一致的情況,關(guān)系數(shù)據(jù)則無小事,因此我們需要定期或不定期地開展主從復(fù)制數(shù)據(jù)一致性的校驗和修復(fù)工作。那么對于mysql主從數(shù)據(jù)不一致的情況,應(yīng)該怎樣修復(fù)呢?不止一次聽到說只需要從主庫重新導(dǎo)入備庫就可以了,咋一聽似乎沒毛病,但細思極恐,下面我們來探討這些問題。
Master節(jié)點
mysqldump -uxxx -p test aa--set-gtid-purged=OFF > aa.sql
Slave節(jié)點
Source aa.sql
Start slave;
很多人處理數(shù)據(jù)不一致時采用以上操作,甚至有些專業(yè)MySQLDBA也是采取如此操作,如果數(shù)據(jù)完全靜態(tài),這樣操作沒有問題。但數(shù)據(jù)往往都是動態(tài)變化的,那如何確保導(dǎo)出導(dǎo)入和salve故障點的時刻的一致性呢?“現(xiàn)在mysql都是基于GTID的復(fù)制,mysql自己會找去從哪里開始復(fù)制”有人這樣解釋,但是GTID是全局的,在運行的復(fù)制架構(gòu)中,無法自動針對某一張表去挑選數(shù)據(jù)進行復(fù)制應(yīng)用。
下面就上面的操作進行詳細分析,以下數(shù)據(jù)表特指復(fù)制中存在數(shù)據(jù)差異的數(shù)據(jù)表:
T1時刻發(fā)現(xiàn)復(fù)制異常
T2時刻在master導(dǎo)出數(shù)據(jù)表
T3時刻在slave導(dǎo)入數(shù)據(jù)表并啟動復(fù)制
T1時刻之前就已經(jīng)發(fā)生了錯誤,復(fù)制異常時binglog日志中記錄的錯誤時間點早于T1時刻,slave導(dǎo)入數(shù)據(jù)之后,日志開始應(yīng)用的位置是早于T1而不是從T2開始,那么salve節(jié)點將會重復(fù)故障點到T2時刻的操作,結(jié)果大概率是報錯,或者是主從數(shù)據(jù)仍然不一致。
那么可以臨時跳過出錯的表(REPLICATE_WILD_IGNORE_TABLE),主從復(fù)制無延遲的時候再進行修復(fù)導(dǎo)出導(dǎo)入的修復(fù)操作,還是以上面的圖為例:
假定數(shù)據(jù)是持續(xù)變化的,修復(fù)過程中salve不停止應(yīng)用日志,且復(fù)制基本無延遲:
T1時刻在master導(dǎo)出數(shù)據(jù)表
T2時刻在slave導(dǎo)入數(shù)據(jù)表,并取消REPLICATE_WILD_IGNORE_TABLE設(shè)置,重啟slave復(fù)制
那么slave節(jié)點將缺少T1至T2時刻的數(shù)據(jù)表的數(shù)據(jù)變更,結(jié)果要么無法啟動復(fù)制要么數(shù)據(jù)存在不一致,存在后續(xù)復(fù)制異常的隱患。
既然導(dǎo)數(shù)過程種slave復(fù)制正常運行會導(dǎo)致異常,那停止slave復(fù)制后再修復(fù)是怎樣的呢,下面來看一下:
T1時刻在slave停止復(fù)制
T2時刻在master導(dǎo)出數(shù)據(jù)表
T3時刻在slave導(dǎo)入數(shù)據(jù)表,并取消REPLICATE_WILD_IGNORE_TABLE設(shè)置,重啟slave復(fù)制
那么slave節(jié)點將重復(fù)T1至T2時刻的數(shù)據(jù)表的數(shù)據(jù)變更,結(jié)果要么無法啟動復(fù)制要么數(shù)據(jù)存在不一致,存在后續(xù)復(fù)制異常的隱患。
既然無論slave是保持復(fù)制還是停止復(fù)制,數(shù)據(jù)都不對,那正確操作是怎樣的?
既然無論slave是保持復(fù)制還是停止復(fù)制,數(shù)據(jù)都不對,那正確操作是怎樣的?假如salve節(jié)點在a時刻停止復(fù)制,master在b時刻導(dǎo)出數(shù)據(jù),如a時刻salve節(jié)點應(yīng)用binlog的位置和b時刻Masterbinlog位置相同即可確保數(shù)據(jù)一致,該操作幾乎無法人為確保,但是我們可以確a和b之間數(shù)據(jù)表沒有數(shù)據(jù)變更,下面描述具體過程:
T1:設(shè)置數(shù)據(jù)表只讀
lock tables aa read;
T2:停止slave復(fù)制(復(fù)制無延遲的情況下,確保停止時間點在T1之后)
T3:一致性導(dǎo)出數(shù)據(jù)表
mysqldump -uroot test aa--set-gtid-purged=OFF --single-transaction > aa.sql
導(dǎo)出后可解鎖master上的鎖定,減少業(yè)務(wù)影響時間,如執(zhí)行如上語句做一致性快照導(dǎo)出,導(dǎo)出開始后即可解鎖master,無需等待導(dǎo)出結(jié)束
T4:在slave導(dǎo)入數(shù)據(jù)表,并取消REPLICATE_WILD_IGNORE_TABLE設(shè)置,重啟slave復(fù)制
因為T1至T3時刻數(shù)據(jù)表沒有數(shù)據(jù)變更,salve復(fù)制停止在T1與T3之間,故master和slave數(shù)據(jù)是一致的,T4時刻開啟復(fù)制應(yīng)用,salve從T2時刻的日志開始應(yīng)用,數(shù)據(jù)一致,不會發(fā)生異常。
除了以上方式將數(shù)據(jù)修復(fù)一致之外,還可以使用pt-table-sync,以及傳輸表空間的方式進行數(shù)據(jù)修復(fù),甚至手工處理差異的數(shù)據(jù),視具體場景(差異量,影響范圍,修復(fù)所需時間及影響)選擇合適的修復(fù)方式。
相比修復(fù)問題,日常預(yù)防問題發(fā)生更加重要,異常宕機以及人為操作常常導(dǎo)致數(shù)據(jù)差異。
異常宕機:可通過更安全的配置選項規(guī)避,但安全性和性能往往不能兼得,需要結(jié)合具體業(yè)務(wù)評估。
人為操作:我遇到的數(shù)據(jù)不一致大部分為非運維人員不恰當?shù)牟僮鲗?dǎo)致數(shù)據(jù)差異,設(shè)置salve節(jié)點只讀可有效避免。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/130140.html
摘要:簡介項目地址主從環(huán)境下數(shù)據(jù)一致性校驗經(jīng)常會用工具,它的原理及實施過程之前寫過一篇文章生產(chǎn)環(huán)境使用檢查數(shù)據(jù)一致性。上面的配置文件可以認為是用于控制程序的,這個配置文件是指定要校驗的源庫和目標庫信息,以及要檢驗?zāi)男┍怼? 1. 簡介 項目地址:https://github.com/seanlook/p... 主從環(huán)境下數(shù)據(jù)一致性校驗經(jīng)常會用 pt-table-checksum 工具,它的原理...
摘要:通過對一些客戶的跨云遷移過程進行總結(jié),發(fā)現(xiàn)普遍存在的挑戰(zhàn)有三點數(shù)據(jù)完整性和一致性挑戰(zhàn)。簡而言之,跨云遷移過程中的數(shù)據(jù)一致性主要就集中在存量數(shù)據(jù)的遷移如何保證一致。前言隨著互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展對容災(zāi)以及對訪問加速、多供應(yīng)商成本控制等需求的產(chǎn)生,互聯(lián)網(wǎng)公司的多云部署和跨云遷移逐漸成為剛需,而在此過程中,最困擾運維和研發(fā)人員的就是數(shù)據(jù)的遷移和同步。俗語說 上屋搬下屋,搬灑一籮谷 ,在業(yè)務(wù)的遷移過程中一旦...
摘要:的主從備份相關(guān)配置服務(wù)器號,不要和其他服務(wù)器重復(fù)開啟二進制日志索引二進制日志的文件名設(shè)為就是把每次發(fā)生的修改和事件的日志即時同步到硬盤上復(fù)制模式防止從服務(wù)器在崩潰后自動開啟,以給你足夠的時間修復(fù)。 實踐背景 最近加入了同學(xué)的技術(shù)分享小組,4個人分兩組,半月進行一次技術(shù)分享,現(xiàn)在一起搞Mysql我被分到講解Mysql日志方面,上周已經(jīng)講完了,不過他們總是覺得對于日志這塊了解不透徹,覺得不...
閱讀 1356·2023-01-11 13:20
閱讀 1707·2023-01-11 13:20
閱讀 1215·2023-01-11 13:20
閱讀 1906·2023-01-11 13:20
閱讀 4165·2023-01-11 13:20
閱讀 2757·2023-01-11 13:20
閱讀 1402·2023-01-11 13:20
閱讀 3671·2023-01-11 13:20