docker安装canal

canal

canal使用的是1.1.5版本

# 下载镜像
docker pull canal/canal-server:v1.1.5
# 创建挂载的目录
mkdir /root/canal/conf
# 创建挂载的配置文件
touch /root/canal/conf/instance.properties
复制代码

instance.properties配置

## mysql serverId
# 目前最新的服务端版本已不需要配置serverId参数
canal.instance.mysql.slaveId = 1234  
#position info,需要改成自己的数据库信息
canal.instance.master.address = 172.16.204.13:3306
canal.instance.master.journal.name = 
canal.instance.master.position = 
canal.instance.master.timestamp = 
#canal.instance.standby.address = 
#canal.instance.standby.journal.name =
#canal.instance.standby.position = 
#canal.instance.standby.timestamp = 
#username/password,需要改成自己的数据库信息
canal.instance.dbUsername = canal  
canal.instance.dbPassword = canal
canal.instance.defaultDatabaseName =
canal.instance.connectionCharset = UTF-8
# table regex
# binlog解析的过滤规则,采用正则表达式
canal.instance.filter.regex = .*\\..*
复制代码

Note

  • canal.instance.master.address = 172.16.204.13:3306,这个地址一定是myql对应的地址。
  • 虽然两个镜像是在同一个宿主机上部署,但是不能通过127.0.0.1:3306进行访问。这里把服务映射到宿主机的ip上了,互相访问是需要通过宿主机。
  • 如果不是使用docker,而是直接下载canal和mysql在本地安装,可以设置为127.0.0.1:3306

启动宿主机

docker run --name=canal -p 11111:11111 -d -v /root/CC/canal/conf/instance.properties:/home/admin/canal-server/conf/example/instance.properties canal/canal-server
# 进入宿主机
docker exec -it canal /bin/bash
# 查看日志
cat /home/admin/canal-server/logs/example/example.log
复制代码

mysql ip配置不正确: [图片上传失败...(image-90c39f-1654766495553)]

mysql ip配置正确: [图片上传失败...(image-62cfdf-1654766495553)]

python操作

python 3.6 安装包

pip install canal-python
复制代码

需要在mysql里面创建库和表,我直接使用navicat创建的 这里建了一个demo的库,canal_test的表 [图片上传失败...(image-d429b2-1654766495553)]

python演示代码

# canal_demo.py
import time

from canal.client import Client
from canal.protocol import EntryProtocol_pb2
from canal.protocol import CanalProtocol_pb2

# 建立与canal服务端的连接
client = Client()
client.connect(host='172.16.204.1', port=11111)   # canal服务端部署的主机IP与端口
client.check_valid(username=b'canal', password=b'canal')  # 自行填写配置的数据库账户密码
# destination是canal服务端的服务名称, filter即获取数据的过滤规则,采用正则表达式
client.subscribe(client_id=b'1001', destination=b'example', filter=b'.*\..*')

while True:
    message = client.get(100)
    # entries是每个循环周期内获取到数据集
    entries = message['entries']
    for entry in entries:
        entry_type = entry.entryType
        if entry_type in [EntryProtocol_pb2.EntryType.TRANSACTIONBEGIN, EntryProtocol_pb2.EntryType.TRANSACTIONEND]:
            continue
        row_change = EntryProtocol_pb2.RowChange()
        row_change.MergeFromString(entry.storeValue)
        event_type = row_change.eventType
        header = entry.header
        # 数据库名
        database = header.schemaName
        # 表名
        table = header.tableName
        event_type = header.eventType
        # row是binlog解析出来的行变化记录,一般有三种格式,对应增删改
        for row in row_change.rowDatas:
            format_data = dict()
            # 根据增删改的其中一种情况进行数据处理
            if event_type == EntryProtocol_pb2.EventType.DELETE:
                format_data['before'] = dict()
                for column in row.beforeColumns:
                    #format_data = {
                    #    column.name: column.value
                    #}
                    #此处注释为原demo,有误,下面是正确写法
                    format_data['before'][column.name] = column.value
            elif event_type == EntryProtocol_pb2.EventType.INSERT:
                format_data['after'] = dict()
                for column in row.afterColumns:
                    #format_data = {
                    #    column.name: column.value
                    #}
                    #此处注释为原demo,有误,下面是正确写法
                    format_data['after'][column.name] = column.value
            else:
                # format_data['before'] = format_data['after'] = dict()  采用下面的写法应该更好
                format_data['before'] = dict()
                format_data['after'] = dict()
                for column in row.beforeColumns:
                    format_data['before'][column.name] = column.value
                for column in row.afterColumns:
                    format_data['after'][column.name] = column.value
            # data即最后获取的数据,包含库名,表明,事务类型,改动数据
            data = dict(
                db=database,
                table=table,
                event_type=event_type,
                data=format_data,
            )
            print(data)
    time.sleep(1)

client.disconnect()
复制代码

启动python文件 python canal_demo.py

connected to 172.16.204.13:11111
Auth succed
Subscribe succed
复制代码

在canal_test表修改数据

[图片上传失败...(image-9859f0-1654766495553)]

{'db': 'demo', 'table': 'canal_test', 'event_type': 1, 'data': {'after': {'id': '3', 'name': '33'}}}
{'db': 'demo', 'table': 'canal_test', 'event_type': 2, 'data': {'before': {'id': '3', 'name': '33'}, 'after': {'id': '3', 'name': '44'}}}
{'db': 'demo', 'table': 'canal_test', 'event_type': 2, 'data': {'before': {'id': '2', 'name': '22'}, 'after': {'id': '2', 'name': '222'}}}
{'db': 'demo', 'table': 'canal_test', 'event_type': 2, 'data': {'before': {'id': '1', 'name': 'cc'}, 'after': {'id': '1', 'name': '111'}}}
{'db': 'demo', 'table': 'canal_test2', 'event_type': 1, 'data': {'after': {'id': '1', 'level': '1'}}}
{'db': 'demo', 'table': 'canal_test', 'event_type': 1, 'data': {'after': {'id': '4', 'name': '传参'}}}
{'db': 'demo', 'table': 'canal_test', 'event_type': 3, 'data': {'before': {'id': '4', 'name': '传参'}}}
复制代码

Note

  • 由于canal是读取binlog,只对日志中增删改进行处理,所有对于创建表和删除表是不会有记录的
  • canal返回数据汇总event_type:1表示新增,2表示更新,3表示删除

作者:无糖朋克
链接:https://juejin.cn/post/7051863581742071821
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容