成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

DM同步主鍵沖突原因及排查恢復(fù)

IT那活兒 / 3522人閱讀
DM同步主鍵沖突原因及排查恢復(fù)

點(diǎn)擊上方“IT那活兒”,關(guān)注后了解更多內(nèi)容,不管IT什么活兒,干就完了?。。?/span>



報(bào)錯(cuò)現(xiàn)象

主鍵沖突:


報(bào)錯(cuò)分析



情況1:上游數(shù)據(jù)存在沖突的情況,例如上游兩套Mysql庫(kù),分別都有store_bj表,通過(guò)DM將上游兩張表的數(shù)據(jù)匯總到下游一張表中,在同步的過(guò)程中上游兩張表都有id=12的主鍵的數(shù)據(jù),上游mysql中均插入成功,但在同步Tidb進(jìn)行中出現(xiàn)主鍵沖突。
-- 解決方法:從上游數(shù)據(jù)入手,避免重復(fù)主鍵數(shù)據(jù),出現(xiàn)主鍵沖突的報(bào)錯(cuò)之后,同步Task任務(wù)將被終止,通過(guò)重啟Task任務(wù)可以恢復(fù)同步狀態(tài)。
在任務(wù)終止期間,如果上游Mysql繼續(xù)有相同主鍵數(shù)據(jù)更新的操作會(huì)在重啟Task任務(wù)后再次出現(xiàn)主鍵沖突報(bào)錯(cuò),需要再次進(jìn)行Task任務(wù)的重啟。
建議對(duì)于報(bào)錯(cuò)的主鍵沖突情況,需要業(yè)務(wù)開(kāi)發(fā)人員對(duì)報(bào)錯(cuò)的表操作以及數(shù)據(jù)進(jìn)行排查,會(huì)存在主鍵沖突的數(shù)據(jù)未同步成功的情況。
-- 測(cè)試報(bào)錯(cuò)及恢復(fù)案例:
1)store_bj表結(jié)構(gòu):
create table store_bj (id int primary key,name varchar(20));
mysql1:

mysql> insert into store_bj values (12,store_bj_11);
Query OK, 1 row affected (0.01 sec)

mysql2:

mysql> insert into store_bj values (12,store_bj_12)
;
Query OK, 1 row affected (0.01 sec)
2)在上游兩套Mysql中,均正常插入id=12的數(shù)據(jù),但在Tidb中只有成功插入其中一條數(shù)據(jù)插入,查詢(xún)Task狀態(tài)報(bào)錯(cuò):
[tidb@tidb1 ~]$ tiup dmctl --master-addr ***.**.***.134:8261 query-status two_tidb_slave
………
"subTaskStatus": [
{
"name": "two_tidb_slave",
"stage": "Paused",
"unit": "Sync",
"result": {
"isCanceled": false,
"errors": [
{
"ErrCode": 100*6,
"ErrClass": "database",
"ErrScope": "not-set",
"ErrLevel": "high",
"Message": "startLocation: [position: (, 0), gtid-set: ], endLocation: [position: (mysql-bin.000002, 12368), gtid-set: ]: execute statement failed: commit",
                               "RawCause": "Error 1062: Duplicate entry 12 for key PRIMARY",
"Workaround": ""
}
],
"detail": null
…………
3)排查DM日志,可以找到對(duì)應(yīng)的主鍵沖突的報(bào)錯(cuò)以及對(duì)應(yīng)表的操作:
[tidb@tidb1 ~]$ cat /home/tidb/dm/deploy/dm-worker-8262/log/dm-worker.log
………
[2021/12/03 16:54:39.773 +08:00] [INFO] [syncer.go:1902] ["meet heartbeat event and then flush jobs"] [task=two_tidb_slave] [unit="binlog replication"]
[2021/12/03 16:54:39.773 +08:00] [INFO] [syncer.go:3016] ["
flush all jobs"] [task=two_tidb_slave] [unit="binlog replication"] ["global checkpoint"="position: (mysql-bin.000002, 12123), gtid-set: (flushed position: (mysql-bin.000002, 12123), gtid-set: )"]
[2021/12/03 16:54:39.773 +08:00] [INFO] [syncer.go:1119] ["
flushed checkpoint"] [task=two_tidb_slave] [unit="binlog replication"] [checkpoint="position: (mysql-bin.000002, 12123), gtid-set: (flushed position: (mysql-bin.000002, 12123), gtid-set: )"]
[2021/12/03 16:54:39.773 +08:00] [INFO] [syncer.go:1127] ["
after last flushing checkpoint, DM has ignored row changes by expression filter"] [task=two_tidb_slave] [unit="binlog replication"] ["number of filtered insert"=0] ["number of filtered update"=0] ["number of filtered delete"=0]

[2021/12/03 16:54:41.794 +08:00] [ERROR] [db.go:201] ["
execute statements failed after retry"] [task=two_tidb_slave] [unit="binlog replication"] [queries="[INSERT INTO `store`.`store_bj` (`id`,`name`) VALUES (?,?)]"] [arguments="[[12 store_bj_12]]"] [error="[code=10006:class=database:scope=not-set:level=high], Message: execute statement failed: commit, RawCause: Error 1062: Duplicate entry 12 for key PRIMARY"]
[2021/12/03 16:54:41.794 +08:00] [INFO] [syncer.go:2854] ["
print status routine exits"] [task=two_tidb_slave] [unit="binlog replication"] [error="context canceled"]
[2021/12/03 16:54:41.794 +08:00] [INFO] [syncer.go:1696] ["
binlog replication main routine quit(context canceled)!"] [task=two_tidb_slave] [unit="binlog replication"] ["last location"="position: (mysql-bin.000002, 12399), gtid-set: "]
[2021/12/03 16:54:41.828 +08:00] [INFO] [syncer.go:1602] ["
flush checkpoints when exit task"] [task=two_tidb_slave] [unit="binlog replication"]
[2021/12/03 16:54:41.837 +08:00] [INFO] [checkpoint.go:694] ["
rollback checkpoint"] [task=two_tidb_slave] [unit="binlog replication"] [component="remote checkpoint"] [schema=store] [table=store_shenzhen] [from="position: (mysql-bin.000002, 10712), gtid-set: "] [to="position: (mysql-bin.000002, 10712), gtid-set: "]
[2021/12/03 16:54:41.837 +08:00] [WARN] [checkpoint.go:697] ["
failed to drop table from schema tracker"] [task=two_tidb_slave] [unit="binlog replication"] [component="remote checkpoint"] [schema=store] [table=store_shenzhen] [error="[schema:1146]Table store.store_shenzhen doesnt exist"]
[2021/12/03 16:54:41.844 +08:00] [WARN] [syncer.go:681] ["something wrong with rollback global checkpoint"] [task=two_tidb_slave] [unit="binlog replication"] ["previous position"="position: (mysql-bin.000002, 12399), gtid-set: "] ["current position"="position: (mysql-bin.000002, 12123), gtid-set: "]
[2021/12/03 16:54:41.844 +08:00] [INFO] [subtask.go:292] ["unit process returned"] [subtask=two_tidb_slave] [unit=Sync] [stage=Paused] [status="{"totalEvents":1,"syncerBinlog":"(mysql-bin.000002, 12123)","binlogType":"remote"}"]
[2021/12/03 16:54:41.844 +08:00] [ERROR] [subtask.go:311] ["unit process error"] [subtask=two_tidb_slave] [unit=Sync] ["error information"="{"ErrCode":10006,"ErrClass":"database","ErrScope":"not-set","ErrLevel":"high","Message":"startLocation: [position: (, 0), gtid-set: ], endLocation: [position: (mysql-bin.000002, 12368), gtid-set: ]: execute statement failed: commit","RawCause":"Error 1062: Duplicate entry
12 for key PRIMARY"}"]
[2021/12/03 16:54:45.961 +08:00] [WARN] [task_checker.go:390] ["task can
t auto resume"] [component="task checker"] [task=two_tidb_slave]
…………
對(duì)于報(bào)錯(cuò)的同步,建議業(yè)務(wù)開(kāi)發(fā)人員對(duì)DM失敗的操作進(jìn)行排查,對(duì)同步的表上游源端和下游成功插入的數(shù)據(jù)是否有效,未同步成功的數(shù)據(jù)是否需要進(jìn)行主鍵的調(diào)整,均需要進(jìn)行排查。當(dāng)調(diào)整完成后,再次重啟Task任務(wù),并檢查同步狀態(tài)。
4)再次重啟task任務(wù):
[tidb@tidb1 ~]$ tiup dmctl -master-addr ***.**.***.134:8261 stop-task task3637.yaml
[tidb@tidb1 ~]$ tiup dmctl -master-addr ***.**.***.134:8261 start-task task3637.yaml
5)檢查同步狀態(tài):
[tidb@tidb1 ~]$ tiup dmctl --master-addr ***.**.***.134:8261 query-status two_tidb_slave
情況2:
全量導(dǎo)入數(shù)據(jù)之前,該主鍵數(shù)據(jù)已經(jīng)存在于下游數(shù)據(jù)庫(kù)中。
判斷依據(jù):主鍵寫(xiě)入數(shù)據(jù)庫(kù)的時(shí)間即(MVCC時(shí)間)早于 load 的時(shí)間(min(create_time)),查詢(xún)時(shí)間點(diǎn)可以參考情況3。
解決方法:如僅出現(xiàn)一次主鍵沖突的情況,可以將下游主鍵數(shù)據(jù)刪掉,恢復(fù)同步任務(wù)即可;如多次出現(xiàn)主鍵沖突,建議刪除下游數(shù)據(jù)以及為位點(diǎn)信息后,重新進(jìn)行全量數(shù)據(jù)的導(dǎo)入。
情況3:
由于位點(diǎn)信息被清理導(dǎo)致 sql 文件被重復(fù)導(dǎo)入(未重現(xiàn),需要根據(jù)情況進(jìn)行判斷,BUG情況需要提交AskTUG專(zhuān)家進(jìn)行分析)。
判斷依據(jù):根據(jù)以下信息可了解到在全量遷移階段開(kāi)始后,因某種原因?qū)е?sql 文件位點(diǎn)被刪除,sql 文件被重復(fù)導(dǎo)入,導(dǎo)致主鍵沖突。
同步任務(wù)全量遷移階段開(kāi)始時(shí)間為:2020-03-17 11:57:36
該數(shù)據(jù)插入數(shù)據(jù)庫(kù)的時(shí)間為:2020-03-17 11:57:37
該文件 test.sbtest5.000000005.sql 記錄的創(chuàng)建時(shí)間以及更新時(shí)間都是 2020-03-17 12:20:29
從 dm-worker.log 中 grep test.sbtest5.000000005.sql 發(fā)現(xiàn)同步任務(wù)開(kāi)始后,有兩次導(dǎo)入該文件。
解決方法:建議清空下游數(shù)據(jù),重新導(dǎo)入。
根據(jù)沖突主鍵的 MVCC 版本以及 dm_meta 中的位點(diǎn)信息具體分析:
1)利用 tidb API 查看主鍵沖突的行的 mvcc 版本,以此來(lái)確認(rèn)該行數(shù)據(jù)插入數(shù)據(jù)庫(kù)的時(shí)間
注意:該操作需要保留現(xiàn)場(chǎng),該操作是從下游 TiDB 中查詢(xún)。
#主鍵為 int 類(lèi)型,handle 即 int 類(lèi)型主鍵。
curl http://{TiDBIP}:1**80/mvcc/key/{db}/{table}/{handle}
#主鍵為非整數(shù)類(lèi)型。
select _tidb_rowid from xxx where trade_no=‘190606LI8OODRTZA5XX1’;
curl http://{TiDBIP}:1**80/mvcc/key/{db}/{table}/{_tidb_rowid}
根據(jù)上述命令得到如下結(jié)果:
下一步操作為根據(jù) pd-ctl 將 commit_ts 轉(zhuǎn)化為對(duì)應(yīng)的時(shí)間,即解析 tso。
注:也可以在 TiDB 中調(diào)用 select TIDB_PARSE_TSO(415345529804292097); 獲取對(duì)應(yīng)時(shí)間。
2)在 dm_meta 查詢(xún) min(create_time) 來(lái)獲得 load 第一個(gè)文件時(shí)的時(shí)間,可以認(rèn)為是 全量遷移階段的開(kāi)始時(shí)間。
3)在 dm_meta 中查看 xxx_loadder_checkpoint 表查看該文件 test.sbtest5.000000005.sql 的詳細(xì)信息!
4)從 dm-worker 中 grep 查看該主鍵所在的 .sql 文件出現(xiàn)的時(shí)間以及次數(shù)
沖突的主鍵(1292790)所在的文件為 test.sbtest5.000000005.sql
grep test.sbtest5.000000005.sql dm-worker.log



本文作者:陳聰

本文來(lái)源:IT那活兒(上海新炬王翦團(tuán)隊(duì))

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/129629.html

相關(guān)文章

  • TiDB Ecosystem Tools 原理解讀系列(三)TiDB-DM 架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)原理

    摘要:合庫(kù)合表數(shù)據(jù)同步在使用支撐大量數(shù)據(jù)時(shí),經(jīng)常會(huì)選擇使用分庫(kù)分表的方案。但當(dāng)將數(shù)據(jù)同步到后,通常希望邏輯上進(jìn)行合庫(kù)合表。為支持合庫(kù)合表的數(shù)據(jù)同步,主要實(shí)現(xiàn)了以下的一些功能。 作者:張學(xué)程 簡(jiǎn)介 TiDB-DM(Data Migration)是用于將數(shù)據(jù)從 MySQL/MariaDB 遷移到 TiDB 的工具。該工具既支持以全量備份文件的方式將 MySQL/MariaDB 的數(shù)據(jù)導(dǎo)入到 Ti...

    legendaryedu 評(píng)論0 收藏0
  • DM 源碼閱讀系列文章(七)定制化數(shù)據(jù)同步功能的實(shí)現(xiàn)

    摘要:作者王相本文為源碼閱讀系列文章的第七篇,在上篇文章中我們介紹了的實(shí)現(xiàn),主要包括目錄結(jié)構(gòu)定義數(shù)據(jù)的處理流程主從切換支持的讀取等邏輯。本篇文章我們將會(huì)對(duì)的定制化數(shù)據(jù)同步功能進(jìn)行詳細(xì)的講解。 作者:王相 本文為 DM 源碼閱讀系列文章的第七篇,在 上篇文章 中我們介紹了 relay log 的實(shí)現(xiàn),主要包括 relay log 目錄結(jié)構(gòu)定義、relay log 數(shù)據(jù)的處理流程、主從切換支持、...

    leo108 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<