pt-table-checksum 3.0.4 bug 无法检查出不一致

环境及关键配置:oracle mysql 5.6.31、pt-table-checksum 3.0.4

binlog_format : row

现象:通过工具进行master slave 数据表的比对,命令如下:

无法检查出主从库里表一致的情况。

pt-table-checksum \

--host=172.17.0.2 \

--port=3306 \

--user=root \

--password=root \

--tables=test.sbtest1 \

--nocheck-replication-filters \

--nocreate-replicate-table \

--nocheck-binlog-format \

--replicate=percona.checksums \

--recursion-method dsn=t=percona.dsns

原因:简单说明下工具的原理

工具会在主库上建立表checksum,表中有字段this_crc,this_cnt,master_crc,master_cnt四个字段。

主库建表会同步到从库,this是从库表的一个chunk的值,master是主库相同chunk的值,对这四个字段进行比对,如果相等,则数据一致。

那么两组数据,四个值如何得到。

pt-table-checksum会先修改binlog_format=statement,再执行两次修改,第一次replace的方式修改this_crc,this_cnt,以“变量”值在主库执行

REPLACE INTO `percona`.`checksums` (db, tbl, chunk, chunk_index, lower_boundary, upper_boundary, this_cnt, this_crc) SELECT 'test', 't1', '1', NULL, NULL, NULL, COUNT(*) AS cnt, COALESCE(LOWER(CONV(BIT_XOR(CAST(CRC32(CONCAT_WS('#', `t`, CONCAT(ISNULL(`t`)))) AS UNSIGNED)), 10, 16)), 0) AS crc FROM `test`.`t1` /*checksum table*/

语句复制到从库执行,如果主从的同一个chunk不一致,则写入到值this_crc,this_cnt也会不一致

第二次update的方式修改master_crc,master_cnt

则是以master的值作为“常量”进行更新,例如:

UPDATE `percona`.`checksums` SET chunk_time = '0.005717', master_crc = '435a7b4f', master_cnt = '3' WHERE db = 'test' AND tbl = 't1' AND chunk = '1'

则从库会复制到主库的值,然后四个值两两比对,得到一致或者不一致。

那么为什么会出现无法检查出不一致的情况呢。

因为脚本没有执行set binlog_format=statement

试想下,如果没有修改复制模式,而主库的复制模式是row或者mixed,则第一次的replace会使用row的方式进行复制,那么从库表里的this和master两组字段数据始终会保持一致。

比对pt-table-checksum工具3.0.3和3.0.4版本,发现问题出在:

去掉这个if判断修改此bug


附:

pt-table-checksum关键过程

引用自:http://keithlan.github.io/2016/05/25/pt_table_checksum/

master> /!50108 SET @@binlog_format := ‘STATEMENT’/ 设置binlog-format为statement

master> SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ 这是隔离级别为RR,利用RR的特性让数据在这一刻静止,就不用加锁了。

master> checksums表:REPLACE INTO select设置this_cnt, this_crc(传递到slave,这其实设置slave每个chunk的cnt,crc),算法来自:COALESCE(LOWER(CONV(BIT_XOR(CAST(CRC32(主键) AS UNSIGNED)), 10, 16)), 0)

slave> 当同步追上后,开始执行REPLACE INTO select,然后设置slave每个chunk的cnt,crc

master> checksums表:update master_cnt,master_crc ,这是设置master每个chunk的cnt,crc

slave> 当同步追上后,开始执行update master_cnt,master_crc ,这是设置master每个chunk的cnt,crc

以上,基本完成。 接下来只需要去checksums表中找 master_cnt <> this_cnt or OR master_crc <> this_crc 的记录就行。

在做查询校验时,select语句有两个小技巧:

/*!40001 SQL_NO_CACHE */    不加载数据到innodb buffer里,避免大量的内存被换出
FORCE INDEX 强制使用同样的索引

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 数据不一致的原因 我们平台中上线了大量的MySQL业务,但是每个MySQL业务中主从数据库之间的一致性,我们基本不...
    何约什阅读 4,339评论 0 6
  • mysql主从复制 主从复制慨述 构建大型,高性能应用程序的基础主服务器复制负责更新,且将更新写入二进制日志文件,...
    肖金光xjg阅读 949评论 0 1
  • 【读经】 王上9章 【金句】 倘若你们和你们的子孙转去不跟从我,不守我指示你们的诫命律例,去侍奉敬拜别神,我就必将...
    chanor阅读 1,555评论 0 0
  • 大概断断续续用了小一个月才把这本书看完,总的来说这本叙事说情的经典名著还是挺有意思,于是看完的当天晚上熬夜把电...
    llpspark阅读 292评论 0 1
  • 有时候会为了找一个软件而头疼不已,这里找那里问,就是为了找一个类似的软件来替代,好不容易找到了,还可能不支持手头上...
    伪君子_阅读 11,337评论 0 1