canal 监听同步指定数据库,所有表
因为工作需求,需要用到数据库同步,又从网上找了一些发现都有些问题,所以自己弄好之后写一篇总结,及配置步骤吧
- 先将 MySQL配置成 bin-log模式
- 给MySQL配置canal用户
- 下载 canal工具(在这里我用的是:canal.deployer-1.1.5-SNAPSHOT)我会把工具上传到我的资源(免费的)
- 配置instance.properties 配置文件
- 编写java api
开始配置
- 配置MySQL bin-log模式
先 window+R 唤出 输入 services.msc 然后点击确定

找到MySQL服务右键属性,找到MySQL地址,因为我这配置了默认的my.ini文件,没配置应该是一个MySQL的地址找到里面的my.ini文件

找到my.ini文件进入
添加配置
log-bin=mysql-bin
binlog-format=ROW
注意server-id之前有没有,没有就添加一个
server-id=1 然后保存,在刚才唤出的服务里重启MySQL服务

- 给MySQL配置canal用户
CREATE USER canal IDENTIFIED BY ‘canal’;
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON . TO ‘canal’@’%’;
FLUSH PRIVILEGES;
4.配置 instance.properties文件,注意 红框的文件夹名后面配置会用到



canal.instance.defaultDatabaseName = 你默认监听的数据库
canal.instance.filter.regex = 正则配置的规则
我这里配置的是 data_resource_update_platform 数据库下所有的表
mysql 数据解析关注的表,Perl正则表达式.
多个正则之间以逗号(,)分隔,转义符需要双斜杠(\)
常见例子:
所有表:.* or .\…
canal schema下所有表: canal\…*
canal下的以canal打头的表:canal\.canal.*
canal schema下的一张表:canal.test1
多个规则组合使用:canal\…*,mysql.test1,mysql.test2 (逗号分隔)
注意:此过滤条件只针对row模式的数据有效(ps. mixed/statement因为不解
析sql,所以无法准确提取tableName进行过滤)
我当时是这块出了问题,一直监听的是整个MySQL服务器,不是我配置的数据库
最重要部分
canal instance启动时,默认加载instance.properties的canal.instance.filter.regex参数,之后会根据conf/canal/meta.dat文件filter值更新过滤规则。当客户端调用CanalConnector.subscribe(String filter)方法时,instance再次用filter参数更新过滤规则。
所以当你只关心部分库表更新时,设置了canal.instance.filter.regex,一定不要在客户端调用CanalConnector.subscribe(".\…"),不然等于没设置canal.instance.filter.regex。
如果一定要调用CanalConnector.subscribe(".\…"),那么可以设置instance.properties的canal.instance.filter.black.regex参数添加黑名单,过滤非关注库表。
你需要将 meta.dat 文件中的 filter对应的正则 改成 你配置的那一个我的是:data_resource_update_platform\…*


然后再启动 bin下面的 startup.bat 文件

接着查看日志 这样就启动成功了

- java API 代码
package org.bigdata.framework.utils;
import java.net.InetSocketAddress;
import java.util.List;
import javax.validation.constraints.NotNull;
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.client.CanalConnectors;
import com.alibaba.otter.canal.common.utils.AddressUtils;<

本文详细介绍了如何配置Canal监听MySQL数据库,实现指定数据库所有表的数据同步。包括设置MySQL bin-log模式,创建Canal用户,下载并配置Canal工具,修改instance.properties文件以及编写Java API来消费数据变更。通过正确配置,避免监听全库,确保只同步目标数据库的表。

21万+

被折叠的 条评论
为什么被折叠?



