面试官:说一说Binlog是怎么实现的

复制概述

简单来说,“复制”就是将来自一个MySQL Server(这里指master角色,即主库)的数据变更,通过其逻辑的二进制日志(binlog)传输到其他的一个或多个MySQLServer(这里指slave角色,即从库)中,其他MySQL Server通过应用(回放)这些逻辑的二进制日志来完成数据的同步。这些MySQL Server之间的逻辑关系,我们称为“复制拓扑”(也可以称为“复制架构”)。MySQL的复制功能是构建MySQL大规模、高性能应用的基础。我们可以通过配置一个或者多个备库的方式来进行数据同步。复制功能不仅有利于构建高性能的应用,同时也是高可用性、可扩展性、灾难恢复、备份以及数据仓库等工作的基础。

复制常见用途

•数据分布: 在不同的地理位置分布数据备份,创建数据的本地副本。

• 负载均衡: 通过MySQL复制将读操作分布到多个服务器上,实现对读密集型应用的优化,并且实现很方便,通过简单的代码修改就能实现基本的负载均衡

• 备份: 复制的一项很有意义的补充,但复制既不是备份也不能取代备份

• 高可用和故障切换:复制能够帮助应用程序避免MySQL单点故障,一个包含复制的设计良好的故障切换系统能够现住地缩短宕机时间。

• MySQL升级测试:使用更高版本的MySQL作为备库,保证在升级全部实例前查询能够在备库按照预期执行。

复制原理

复制的过程

单线程复制

• 在主库上把数据更改记录到二进制日子(Binary Log)中

• 备库将主库上的日志复制到自己的中继日志(Relay Log)中。

• 备库读取中继日志中的事件,将其重放到备库数据之上。

复制使用三个线程来实现:
从节点:
    I/O Thread: 从 Master 节点请求二进制日志事件,并保存于中继日志中。
    Sql Thread: 从Relay log 中读取日志事件并在本地完成重放。
主节点:
    Dump Thread:为每个 Slave 的 I/O Thread 启动一个 dump 线程,用于向从节点发送二进制事件。
DATABASE多线程复制(5.6)库级别的多线程复制。主要的改进在于从库复制的SQL线程——增加了一个SQL协调器线程(Coordinator线程),真正干活的SQL线程被称为工作线程(Worker线程),当Worker线程为N个(N > 1)以及主库的DATABASE(Schema)为N个时,从库就可以根据多个DATABASE之间相互独立(彼此之间无锁冲突)的语句来实现多线程复制;

LOGICAL_CLOCK多线程复制(5.7)
    LOGICAL_CLOCK基于组提交的并行复制方式,允许并行回放的粒度为事务级别,即便在同一时间修改数据的操作针对的是同一个数据库,理论上只要事务之间不存在锁冲突,就允许并行。
WRITESET多线程复制(5.7.22,8)
    只要不同事务的修改记录不重叠,就可以在从库中并行回放。通过计算每行记录的哈希值(hash)来确定其是否为相同的记录。该哈希值就是WRITESET值。这个hash值是通过“库名+表名+索引名+值”计算出来的。如果一个表上除了有主键索引外,还有其他唯一索引,那么对于每个唯一索引,insert语句对应的writeset就要多增加一个hash值。

数据同步方法

MySQL 5.7支持以下两种数据同步方法(也可以称为复制模式或复制方法)

传统复制

也可以称为基于二进制日志文件和位置的复制,在从库中配置复制时,要求指定从主库中获取的二进制日志文件(binlog file)和位置(binlogposition),以便从库中的复制线程启动时,能够以指定的二进制日志文件和位置为起点,持续读取主库中的二进制日志,并在从库中应用,从而达到数据同步的目的。

GTID复制

GTID(全局事务标识符)是新的事务性复制方法,利用GTID可以自动在主库中寻找需要复制的二进制日志记录,因此不需要关心日志文件或位置,极大地简化了许多常见的复制任务。使用GTID复制可确保主库和从库之间的一致性。

• GTID的组成部分 GDIT由两部分组成:GTID = source_id:transaction_id。 其中source_id是产生GTID的服务器,即是server_uuid,在第一次启动时生成(sql/mysqld.cc: generate_server_uuid()),并保存到DATADIR/auto.cnf文件里。transaction_id是序列号(sequence number),在每台MySQL服务器上都是从1开始自增长的顺序号,是事务的唯一标识。例如:3E11FA47-71CA-11E1-9E33-C80AA9429562:23 GTID 的集合是一组GTIDs,可以用source_id+transaction_id范围表示,例如:3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5 复杂一点的:如果这组 GTIDs 来自不同的 source_id,各组 source_id 之间用逗号分隔;如果事务序号有多个范围区间,各组范围之间用冒号分隔,例如:3E11FA47-71CA-11E1-9E33-C80AA9429562:23,3E11FA47-71CA-11E1-9E33-C80AA9429562:1-5

• GTID产生 GTID的生成受GTID_NEXT控制。在主服务器上,GTID_NEXT默认值是AUTOMATIC,即在每次事务提交时自动生成GTID。它从当前已执行的GTID集合(即gtid_executed)中,找一个大于0的未使用的最小值作为下个事务GTID。同时在实际的更新事务记录之前,将GTID写入到binlog(set GTID_NEXT记录,mysql.gtid_executed表中)。 在Slave上,从binlog先读取到主库的GTID(即get GTID_NEXT记录),而后执行的事务采用该GTID。

• GTID的工作原理

GTID在所有主从服务器上都是不重复的。所以所有在从服务器上执行的事务都可以在bnlog找到。一旦一个事务提交了,与拥有相同GTID的后续事务都会被忽略。这样可以保证从服务器不会重复执行同一件事务。当使用GTID时,从服务器不需要保留任何非本地数据。使用数据都可以从replicate data stream。从DBA和开发者的角度看,从服务器无保留file-offset pairs以决定如何处理主从服务器间的数据流。

• GTID的生成和使用由以下几步组成

  • 主服务器更新数据时,会在事务前产生GTID,一同记录到binlog日志中。

  • binlog传送到从服务器后,被写入到本地的relay log中。从服务器读取GTID,并将其设定为自己的GTID(GTID_NEXT系统)。

  • sql线程从relay log中获取GTID,然后对比从服务器端的binlog是否有记录。

  • 如果有记录,说明该GTID的事务已经执行,从服务器会忽略。

  • 如果没有记录,从服务器就会从relay log中执行该GTID的事务,并记录到binlog。

复制的格式

• 基于statement的复制(Statement Based Replication,SBR):当系统变量binlog_format设置为statement时表示使用SBR。SBR复制的是整个SQL语句的原始文本,日志量较小,但容易出现主从库数据不一致。对于SBR,当执行的某个语句被判定为不安全时,是否允许其执行还取决于事务的隔离级别。

• 基于row的复制(Row Based Replication,RBR):当系统变量binlog_format设置为row时表示使用RBR。RBR复制的是发生更改的数据行的实际记录(原始语句会被转换为发生变更的行数据记录),日志量较大,但可以保证主从库数据的一致性。

• 混合复制(Mixed Based Replication,MBR):系统变量binlog_format设置为mixed时表示使用MBR。MBR实际上是由MySQL自行判断的,即在不影响数据一致性的情况下,使用SBR;如果可能影响数据一致性,则自动转换为RBR。

数据同步方式

异步复制

半同步复制

延迟复制

MySQL 5.7 支持延迟复制,以便副本服务器故意落后于源至少指定的时间。默认延迟为 0 秒。使用 MASTER_DELAY选项将延迟设置为N秒。延迟复制可用于多种目的:

• 防止用户在源头上犯错。DBA 可以将延迟的副本回滚到灾难发生之前的时间。

• 测试系统在滞后时的行为。例如,在应用程序中,延迟可能是由副本上的重负载引起的。但是,生成这种负载级别可能很困难。延迟复制可以模拟滞后,而不必模拟负载。它还可用于调试与滞后副本相关的条件。

同步复制

指的是需要保证写操作完全同步到其他数据节点,而不仅仅是二进制日志被其他节点接收。例如NDB Cluster,它是一种集群架构,所有节点都可以进行读/写,而且每个节点上发生的写操作都会实时同步到其他节点。对于需要同步复制的场景,可以使用NDB Cluster,或者其他类似的开源解决方案(虚拟同步,非完全同步),例如Percona XtraDB Cluster(PXC)、MariaDB Galera Cluster(MGC)、MySQL Group Replication(MGR)。

复制的应用-canal

canal是什么

基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费

早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。

canal的数据同步不是全量的,而是增量。基于binary log增量订阅和消费,canal可以做:

• 数据库镜像

• 数据库实时备份

• 索引构建和实时维护

• 业务cache(缓存)刷新

• 带业务逻辑的增量数据处理

canal 工作原理

• canal 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议

• MySQL master 收到 dump 请求,开始推送 binary log 给 slave (即 canal )

• canal 解析 binary log 对象(原始为 byte 流)


参考:

《MySQL复制技术与生产实践》 https://dev.mysql.com/doc/refman/5.7/en/group-replication-primary-secondary-replication.html
https://zhuanlan.zhihu.com/p/157113690https://github.com/alibaba/canal

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容