MySQL 数据同步到 MongoDB

今年春节假期比较闲,整理了下我的开源项目 go-mysql-mongodb

这个工具用来将 MySQL 数据同步到 MongoDB。开发挺久了,但是一直都没有怎么维护。前几天突然收到了一个用户的邮件,咨询使用中遇到的问题,我意识到这个工具还是有人用的,我趁着假期维护一下,也希望未来可以帮助更多人。

起源

这个项目还要追溯到 2017 年,当时我的工作主要是调研各种大数据平台,需要将 MySQL 的数据同步到 Elasticsearch、MongoDB 等数据库中。

tungsten-replicator

我谷歌搜了一些解决方案,一开始使用的是 tungsten-replicator,用来将 MySQL 数据同步到 MongoDB。这个工具功能强大,用于多种异构数据库之间的数据同步。例如,下面是 tungsten-replicator 将 MySQL/Oracle 数据同步到异构数据库的拓扑架构图:

Topologies: Heterogeneous Operation

工作流程:

  1. 在 Master 和 Slave 的服务器上分别部署一个 Replicator 服务。

  2. Master Replicator 从 Master DB 中拉取 binlog/CDC 数据,并转化成一种通用的 THL 格式的数据。

  3. Master Replicator 将 THL 数据传输到 Slave Replicator。

  4. Slave Replicator 根据 Slave DB 的类型,将 THL 数据转化成 SQL 同步到 Slave DB。

这个工具比较成熟,可以看下他们的使用文档,总共 300 多页,各种场景都有说明。但是在使用的过程中主要有这些问题:

  1. 架构太重了。可以从上面的例子看出来,需要在 Master 和 Slave 服务器上各部署一个,而且需要保存 THL 数据,会占用大量的磁盘。

  2. 部署和配置比较复杂。它支持的功能非常丰富,但是它强大的功能也就需要复杂的配置来支持。但是实际上我们只需要使用其中一小部分的功能。

  3. 开发语言(不算这个工具的问题)。这个工具是用 Java 开发的,而我当时的组主要使用 Python、Golang 开发,如果有新的需求、或者有 bug 需要修复,维护上会比较困难。

go-mysql-elasticsearch

后来有需求将 MySQL 数据同步到 Elasticsearch,我找到了另外一个工具 go-mysql-elasticsearch,试用了一下,发现这个工具比较轻量,配置、部署都比较简单。这个工具的工作流程如下:

  1. 使用 mysqldump 导出 MySQL 的全量数据。

  2. 将全量数据导入 Elasticsearch 中。

  3. 从全量数据的 binlog postion 位置开始拉取 MySQL 的 binlog 数据。

  4. 将 binlog 转化为 Elasticsearch 格式的数据,并以 RESTful API 的形式同步到 Elasticsearch。

可以看出来,这个工具比较轻量,对于一个 MySQL 实例的同步只需要部署一个服务;另外它是使用 Golang 语言开发的,我比较熟悉,在使用过程中遇到新的需求,我也可以自己实现了。

go-mysql-mongodb

成功将 go-mysql-elasticsearch 应用到准生产环境之后,我就萌生了替换掉 tungsten-replicator 的想法。

MongoDB 和 Elasticsearch 比较类似,都属于 NoSQL,存储的数据都是文档型。于是我复用了 go-mysql-elasticsearch 中的大部分逻辑,只需要将代码中 Elasticsearch 客户端的代码修改为 MongoDB 的基本上就可以运行了。这样就形成了 go-mysql-mongodb 这个项目。

go-mysql-mongodb 功能

由于 go-mysql-mongodb 主要参考了 go-mysql-elasticsearch,功能基本上一样。

配置数据源

必须要设置同步 MySQL 的哪些表到 MongoDB 中,示例配置:

[[source]]
schema = "test"
tables = ["t1", t2]

[[source]]
schema = "test_1"
tables = ["t3", t4]

同时也支持一些简单的表达式,例如:

[[source]]
schema = "test"
tables = ["test_river_[0-9]{4}"]

这样就选取了 test 库中类似 test_river_0001、test_river_0002这样的表。

转化规则

支持将 MySQL 中的表同步到 MongoDB 中指定的 collection 中,也支持对表中的字段名称做转化,例如:

[[rule]]
schema = "test"
table = "t1"
database = "t"
collection = "t"

    [rule.field]
    mysql = "title"
    mongodb = "my_title"

这个配置会将 MySQL 中的表 test.t1 同步到 MongoDB 中的 collection t.t 中,另外也会把该表中的 title 字段重命名为 my_title

过滤字段

支持只同步表中指定的字段,例如:

[[rule]]
schema = "test"
table = "tfilter"
database = "test"
collection = "tfilter"

# Only sync following columns
filter = ["id", "name"]

该配置只会同步表 test.tfilter 中 的 idname 两列的数据。

还有更多功能参考项目的 README

go-mysql-mongodb 现状

目前这个项目还在开发中,基本功能应该没啥问题,但是需要增加更多的测试来保证。

另外也需要关注 go-mysql-elasticsearch 的变更,及时把一些修复带到 go-mysql-mongodb。

希望这个小工具可以帮助到你。如果在使用过程中遇到问题可以提 issue,也可以直接发邮件联系我 wx347249478 at gmail.com。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,951评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,606评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,601评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,478评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,565评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,587评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,590评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,337评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,785评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,096评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,273评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,935评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,578评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,199评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,440评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,163评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,133评论 2 352

推荐阅读更多精彩内容