Canal 索引构建

增量索引构建的要求

  • 准实时;
  • 性能;
  • 编程简化;

Canal | 简介

  • 消息管道;
  • source 为 MySQL 数据库;
  • target 为其他存储,比如 ElasticSearch;
  • Canal 伪装成一个 MySQL 主库的备库,感知 MySQL 中 binlog 的变化,并同步出来一个结构化的数据,交给 Canal 管道的消费端;

开启 MySQL 的 binglog

Ubuntu 用 APT Repository 安装 MySQL 的安装位置
  • /etc/mysql - 配置文件
  • /var/lib/mysql - 数据存放的位置
  • /usr/bin/mysql - 启动命令
  • /usr/lib/mysql - 插件
查看 MySQL 几个变量的值
  • 要保证 binlog 开启,并且格式是 ROW;
  • 如果不是上述配置的话,需要修改 /etc/mysql/mysql.conf.d/mysqld.cnf,然后还要给 MySQL 实例起个 server-id = 1;MySQL 8 的话,两个参数默认就是这样的,然后 server-id 给个唯一值就行了;
# 是否开启 binlog
show variables like 'log_bin';
# binlog 的格式
show variables like 'binlog_format';
创建复制用户
create user 'canal'@'%' identified by 'canal';

grant replication slave on *.* to 'canal'@'localhost';
grant replication client on *.* to 'canal'@'localhost';
grant select on *.* to 'canal'@'localhost';

flush privileges;

canal 配置 | 1.1.3

修改 canal.properties
  • 文件路径:/home/lixinlei/application/canal/1.1.3/canal.deployer-1.1.3/conf
  • 这一行注释掉;
#canal.instance.tsdb.spring.xml = classpath:spring/tsdb/h2-tsdb.xml
修改 instance.properties
  • 位置:/home/lixinlei/application/canal/1.1.3/canal.deployer-1.1.3/conf/example/instance.properties
canal.instance.mysql.slaveId=8

canal.instance.dbUsername=canal
canal.instance.dbPassword=canal
启动 canal
  • JDK 换成 8 才启动起来;
bin/startup.sh

canal.adapter | 1.1.4

下载源码
  • 在 IDEA 中打开 client-adapter module;
  • 修改 /home/lixinlei/project/canal-canal-1.1.4/client-adapter/elasticsearch/pom.xml 中的 ElasticSearch 的依赖版本,改成 7.3.0;
<dependency>
    <groupId>org.elasticsearch</groupId>
    <artifactId>elasticsearch</artifactId>
    <version>7.3.0</version>
</dependency>
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>transport</artifactId>
    <version>7.3.0</version>
</dependency>
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-client</artifactId>
    <version>7.3.0</version>
</dependency>
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level-client</artifactId>
    <version>7.3.0</version>
</dependency>
在总 module 的目录下重新打包 canal
  • 路径为:/home/lixinlei/project/canal-canal-1.1.4
  • 打包命令:mvn clean package -DskipTests
  • 报错:[ERROR] /home/lixinlei/project/canal-canal-1.1.4/client-adapter/elasticsearch/src/main/java/com/alibaba/otter/canal/client/adapter/es/support/ESConnection.java:[420,47] 无法将类 org.elasticsearch.client.RestHighLevelClient中的方法 bulk应用到给定类型;
  • 找到指定的 ESConnection.java 的 420 行,解决问题:return restHighLevelClient.bulk(bulkRequest, RequestOptions.DEFAULT);
  • 重新打包:mvn clean package -DskipTests
  • 报错:/home/lixinlei/project/canal-canal-1.1.4/client-adapter/elasticsearch/src/main/java/com/alibaba/otter/canal/client/adapter/es/ESAdapter.java:[225,56] 不兼容的类型: org.apache.lucene.search.TotalHits无法转换为long
  • 找到指定的 ESAdapter.java 的 225 行,解决问题:long rowCount = response.getHits().getTotalHits().value;
  • 重新打包:mvn clean package -DskipTests,终于成功了;
进入编译后生成的目录
  • /home/lixinlei/project/canal-canal-1.1.4/client-adapter/launcher/target/canal-adapter,里面的内容和直接从 Github 上下载二进制的包是一样的;
  • 把这个目录拷到正经的目录下,并改个名字 /home/lixinlei/application/canal/1.1.4/canal-adapter-es7
修改配置文件 application.yml
  • 文件路径:/home/lixinlei/application/canal/1.1.4/canal-adapter-es7/conf/application.yml
  • 这个配置主要是指明管道两端的 MySQL 和 ElasticSearch;
server:
  port: 8081
spring:
  jackson:
    date-format: yyyy-MM-dd HH:mm:ss
    time-zone: GMT+8
    default-property-inclusion: non_null

canal.conf:
  mode: tcp 
  canalServerHost: 127.0.0.1:11111
  batchSize: 500
  syncBatchSize: 1000
  retries: 0
  timeout:
  accessKey:
  secretKey:
  srcDataSources:
    defaultDS:
      url: jdbc:mysql://127.0.0.1:3306/dianping?useUnicode=true&useSSL=false
      username: canal
      password: canal
  canalAdapters:
  - instance: example 
    groups:
    - groupId: g1
      outerAdapters:
      - name: logger
      - name: es
        hosts: 127.0.0.1:9300
        properties:
          cluster.name: dianping-app
创建文件 shop.yml
  • 文件路径:/home/lixinlei/application/canal/1.1.4/canal-adapter-es7/conf/es/shop.yml
  • 其中 defaultDSexample 分别对应 application.yml 中的 defaultDSexample
dataSourceKey: defaultDS
destination: example
groupId: 
esMapping:
  _index: shop
  _type: _doc
  _id: id
  upsert: true
  sql: "select a.id,a.name,a.tags,concat(a.latitude,',',a.longitude) as location,a.remark_score,a.price_per_man,a.category_id,b.name as category_name,a.seller_id,c.remark_score as seller_remark_score,c.disabled_flag as seller_disabled_flag from shop a inner join category b on a.category_id = b.id inner join seller c on c.id = a.seller_id"
  commitBatch: 3000
启动 canal-adapter-es7
  • MySQL 8 要把 /home/lixinlei/application/canal/1.1.4/canal-adapter-es7/lib 下的驱动换一下;
  • 启动命令:bin/startup.sh
启动编译好的 canal-deployer-es7
  • canal.adapter-1.1.4 和 canal.deployer-1.1.3 是不兼容的,所以要把之前启动的 canal.deployer-1.1.3 换成 Maven 编译好的 canal.deployer-1.1.4;
  • 编译好的原路径:/home/lixinlei/project/canal-canal-1.1.4/deployer/target/canal,更改到新路径:/home/lixinlei/application/canal/1.1.4/canal-deployer-es7
  • 先关停 canal.deployer-1.1.3:bin/stop.sh
  • 把 canal.deployer-1.1.3 的 canal.properties 和 example/ 拷贝到 canal-deployer-es7 中;
  • 启动 canal-deployer-es7:bin/startup.sh
更新 MySQL 中 dianping 库的 shop 表
  • 日志文件 canal-adapter-es7/logs/adapter/adapter.log 立马可以感知到;
  • 在 ElasticSearch 中查询,也可以立马感知到;
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354