细聊冗余表数据一致性 学习笔记

微信公共号 [架构师之路] 上看到一篇文章 细聊冗余表数据一致性,学习了下,一些笔记。

为什么会有冗余表的需求

互联网很多业务场景的数据量很大,此时数据库架构要进行 水平切分,水平切分会有一个 patition key,通过 patition key 的查询能够直接定位到库,但是非 patition key 上的查询可能就需要扫描多个库了。

例如订单表,业务上对 买家 buyer卖家 seller 都有订单查询需求:
订单表:order(order_id, others_columns)
成交记录表:transaction(buyer_id, seller_id, order_id)

假设 transaction 表很大,需要水平切分来放到多个数据库中:

  • 如果用买家 buyer_id 来分库:
    • 比如 transaction 表中 buyer_id 在 B0000 到 B1000 的记录放到 DB1 中,B1000 到 B2000 的记录放到 DB2 中,依次类推。。。
    • 如果想查找 B0001 这个买家所有的成交记录,可以直接去 DB1 中查询。
    • 缺点:seller_id 的查询就需要扫描多库,如果想查找 S0001 这个卖家所有的成交记录,需要去多个数据库中查询。**
  • 如果用卖家 seller_id 来分库,同理,也会有上述类似的问题。

为了做到高吞吐量低延时的查询,往往使用 数据冗余 的方式来实现,即创建两份成交记录表 transaction
以买家为核心的成交记录表:transaction1(buyer_id, seller_id, order_id)
以卖家为核心的成交记录表:transaction2(seller_id, buyer_id, order_id)

其中:

  • transaction1 以 *buyer_id *来分库,满足买家的查询需求;
  • transaction2 以 *seller_id *来分库,满足卖家的查询需求;

冗余表的实现方案

方法一:服务同步写

方法一:服务同步写

由服务层同步写冗余数据:

  1. 业务方调用服务,新增数据
  • 服务先插入 transaction1 数据
  • 服务再插入 transaction2 数据
  • 服务返回业务方新增数据成功

优点:

  • 不复杂,服务层由单次写,变两次写
  • 数据一致性相对较高(因为双写成功才返回)

缺点:

  • 请求的处理时间增加(要插入两次,时间加倍)
  • 数据仍可能不一致,例如第二步写入 transaction1 完成后服务重启,则数据不会写入 transaction2

方法二:服务异步写,应用场景:系统对处理时间比较敏感

方法二:服务异步写

数据的双写并不再由服务层来完成,服务层异步发出一个消息,通过消息总线发送给一个专门的数据复制服务来写入冗余数据:

  1. 业务方调用服务,新增数据
  • 服务先插入 transaction1 数据
  • 服务向消息总线发送一个异步消息(发出即可,不用等返回,通常很快就能完成)
  • 服务返回业务方新增数据成功
  • 消息总线将消息投递给数据同步中心
  • 数据同步中心插入 transaction2 数据

优点:

  • 请求处理时间短(只插入1次)

缺点:

  • 系统的复杂性增加了,多引入了一个组件(消息总线)和一个服务(专用的数据复制服务)
  • 因为返回业务线数据插入成功时,数据还不一定插入到T2中,因此数据有一个不一致时间窗口(这个窗口很短,最终是一致的)
  • 在消息总线丢失消息时,冗余表数据会不一致

究竟先写 正表 transaction1 还是反表 transaction2

对于一个不能保证事务性的操作,一定涉及 哪个任务先做,哪个任务后做 的问题,解决这个问题的方向是:
如果出现不一致,谁先做对业务的影响较小,就谁先执行。

如何保证数据的一致性

不管哪种方案,因为两步操作不能保证原子性,总有出现数据不一致的可能,那如何解决呢?

方法一:线下扫描正反冗余表全部数据

线下启动一个离线的扫描工具,不停的比对正表 transaction1 和反表 transaction2,如果发现数据不一致,就进行补偿修复。

方法二:线下扫描增量数据

每次只扫描增量的日志数据 log,就能够极大提高效率,缩短数据不一致的时间窗口。

方法三:实时线上 消息对 检测

这次不是写日志了,而是向消息总线发送消息 写入正表的消息 msg1 和写入反表的消息 msg2。
假设正常情况下,msg1 和 msg2 的接收时间应该在 3s 以内,如果检测服务在收到 msg1 后没有收到 msg2,就尝试检测数据的一致性,不一致时进行补偿修复


引用:
细聊冗余表数据一致性

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容