在线变更亿级 MySQL 表结构实战

1.背景

IM作为社交应用的基础服务,承担着即时聊天、群聊、直播、多人语音等功能。即时聊天又是众多功能模块中最重要的一个,需要维护两个用户的会话(多对多)关系,随着应用推广用户量级在不断增加会话关系呈指数级增长,获取会话信息接口调用频率呈指数级增长,由于应用立项比较匆忙,对应用发展速度预估比较悲观,且初期人力资源有限没有引入分库分表,单表数据指数增长所以响应速度肉眼可见的变慢,优化会话表迫在眉睫

相关概念

  • 会话


    image.png
  • 拉取会话


    image.png

2.问题现状

假设每个活跃用户会话数是10个,当日活为100时,总会话数大约是在1000左右;当日活到达百万时, 每日的会话数量就是一个较大的数量级,在实际业务场景中只要用户发生对话并且在会话列表中没有当前聊天会话就会调用接口(qps为1000,rt为400ms左右)获取会话信息,调用频率高响应速度慢导致用户体验很差,用户活跃高峰期常因该接口导致服务器cpu长时间处于极高负载状态,严重时直接导致整个系统瘫痪

3.解决方案

问题点

  • uid是会话发起方id,to_uid是会话接收方id,uid在实际业务中是付费者的角色,to_uid是获益者的角色,uid找to_uid聊天需要花费一定的费用。在这样的商业背景下设计出了uid和to_uid的表结构,虽然这种结构满足了商业要求,但是仍然存在业务缺陷,如:
    查询用户1(id = 1)与用户2(id = 2)、用户3(id = 3)的会话信息,对应如下SQL,没办法明确两个用户谁是uid谁是to_uid,只能通过OR去查询


    image.png
SELECT * FROM chat_table 
WHERE 
    (uid = 1 AND to_uid IN (2,3)) 
    OR 
    (uid IN (2,3) AND to_uid = 2);
  • 由于是单表且数据量达到了3000w+,仅SQL查询就要300ms左右,加上业务处理时间单次接口调用需要耗时400ms+
  • 优化过程不能停机维护,不能影响用户正常使用

优化思路

  • 既然原表结构在知道两个用户id的情况下无法明确谁是uid,只能通过OR去查询两者的会话。可以在表中添加uid、to_uid按照<小的用户id_大的用户id>成的splic_user_id字段,由于uid和to_uid都是唯一确定的,拼接成的splic_user_id也是唯一确定的,即达到了通过uid、to_uid快速确定一条会话的目的
  • 明确优化思路后,需要考虑不能停机维护,直接通过DDL语句直接给表添加字段必然会锁表导致IM服务直接瘫痪,应该如何做到既不停机维护,在不影响业务的情况下完成优化呢?
    • 方案一:创建一张添加了splic_user_id字段的新表(chat_table_new),chat_table 向 chat_table_new实时写入数据,等数据基本同步完成后,发布代码查询chat_table_new表,此方案有明显很费时
    • 方案二:找到一款可以在线修改表结构而不锁表的工具,这样不需要修改代码成本很小
      通过查询资料得知有一款工具(percona-toolkit)可以在线修改MySQL表结构而不锁表

方案对比

[图片上传失败...(image-648cde-1701047272899)]

percona-toolkit

percona-toolkit 源自 Maatkit 和 Aspersa 工具,这两个工具是管理 MySQL 的最有名的工具,但 Maatkit 已经不维护了,全部归并到 percona-toolkit。Percona Toolkit 是一组高级的命令行工具,用来管理 MySQL 和系统任务,主要包括:

  • 验证主节点和复制数据的一致性
  • 有效的对记录行进行归档
  • 找出重复的索引
  • 总结 MySQL 服务器
  • 从日志和 tcpdump 中分析查询
  • 问题发生时收集重要的系统信息
  • 在线修改表结构

在业务不断迭代的情况下,不可避免对数据表进行 DDL 操作,修改、添加、删除字段、索引,对于 MySQL 而言,DDL 是一个需要非常谨慎使用的功能,因为在 MySQL 中在对表进行 DDL 时会锁表,表数据量越大,影响程度越大。在 5.1 之前 DDL 是非常耗时耗力的,在 5.1 之后随着 Plugin innodb 的出现在线加索引的速度提高了很多,但是还有影响(时间缩短了); 在 5.6 可以避免上面的情况,目前 InnoDB 引擎是通过以下步骤来进行 DDL 的 :

  • 按照原始表(original_table)的表结构和 DDL 语句,新建一个不可见的临时表(tmp_table)
  • 在原表上加 write lock,阻塞所有更新操作(insert、delete、update 等)
  • 执行 insert into tmp_table select * from original_table
  • rename original_table 和 tmp_table,最后 drop original_table
  • 释放 write lock。
    我们可以看见在 InnoDB 执行 DDL 的时候,原表是只能读不能写的。为此 perconal 推出一个工具 pt-online-schema-change ,其特点是修改过程中不会造成读写阻塞。

pt-online-schema-change 工作原理

  • 如果存在外键,根据 alter-foreign-keys-method 参数的值,检测外键相关的表,做相应设置的处理。没有使用 alter-foreign-keys-method 指定特定的值,该工具不予执行

  • 创建一个新的空表,其命名规则是:下划线 + 原表名 +new—-原表名_new

  • 根据 alter 语句,更新新表的表结构;

  • 创建触发器,用于记录从拷贝数据开始之后,对源数据表继续进行数据修改的操作记录下来,用于数据拷贝结束后,执行这些操作,保证数据不会丢失。如果表中已经定义了触发器这个工具就不能工作了。

  • 拷贝数据,从源数据表中拷贝数据到新表中。

  • 修改外键相关的子表,根据修改后的数据,修改外键关联的子表。

  • rename 源数据表为 old 表,把新表 rename 为源表名,其通过一个 RENAME TABLE 同时处理两个表,实现原子操作。(RENAME TABLE dbteamdb. chat_table TO dbteamdb._chat_table_old, dbteamdb._chat_table_new TO dbteamdb. chat_table)

  • 将 old 表删除、删除触发器。

  • 新方案直接命中索引,能够做到精确查询,查询速度很快
    -- 新
    SELECT * FROM chat_table WHERE splic_user_id IN ('1_2','1_3');

4.效果比对

优化前:


image.png

优化后:查询速度提升10倍以上


image.png

5.总结

  • 遇到问题尽量不要闭门造车,埋头苦想,可以先在网上找下有没有其他人遇到过相似的问题,这样可以避免自己掉进坑里越陷越深,站在前人经验的基础上去解决问题可以取得事半功倍的效果
  • 实践证明 percona-toolkit 实时修改表结构真的很强大,千万级数据量表添加字段,对业务没有产生任何影响
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,000评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,745评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,561评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,782评论 1 298
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,798评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,394评论 1 310
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,952评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,852评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,409评论 1 318
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,483评论 3 341
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,615评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,303评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,979评论 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,470评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,571评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,041评论 3 377
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,630评论 2 359

推荐阅读更多精彩内容