MySQL实时同步到Elasticsearch实现方案 —— canal（兼容ES5.X）

2024-09-02 11:48

文章标签 实现 mysql 实时 elasticsearch canal 同步兼容方案 database es5

本文主要是介绍MySQL实时同步到Elasticsearch实现方案 —— canal（兼容ES5.X），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

首先看一下canal的实现原理：

canal 模拟 MySQL slave 的交互协议，伪装自己为 MySQL slave ，向 MySQL master 发送dump 协议
MySQL master 收到 dump 请求，开始推送 binary log 给 slave (即 canal )
canal 解析 binary log 对象(原始为 byte 流)

怎么使用？

这里只记录需要使用过程中需要注意的地方，具体用法不在此赘述，可以参考canal的wiki：https://github.com/alibaba/canal

一、数据库配置：

需要先开启 Binlog 写入功能，配置 binlog-format 为 ROW 模式，my.cnf 中配置如下

log-bin=mysql-bin # 开启 binlog

binlog-format=ROW # 选择 ROW 模式 server_id=1 # 配置 MySQL replaction 需要定义，不要和 canal 的 slaveId 重复

授权 canal 链接 MySQL 账号具有作为 MySQL slave 的权限, 如果已有账户可直接 grant

CREATE USER canal IDENTIFIED BY 'canal';

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';

-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;

FLUSH PRIVILEGES;

二、canal server端：

1. conf/canal.properties下修改端口

2. 可以配置destinations（默认为example，多个以逗号隔开），这个对应conf下面的文件夹order

3. order文件夹中的instance.properties，可以进行消费通道的配置：

三、canal client端：

canal 1.1.1版本之后，自带了适配器，不用写任何java代码，只需要写几个SQL脚本就可以直接实现同步，简单同步逻辑的可以考虑使用，比如单表同步、多表简单关联，友情提醒请看文章末尾。

canal adapter 的 Elasticsearch 版本支持6.x.x以上，但是目前公司使用的es为5.3.3，官方宣称可以通过更改依赖即可适配低版本的es，但是还有一个地方需要调整，具体改动如下：

先将client-adapter中elasticsearch下的pom文件中依赖的elasticsearch相关组件的版本号降至5.X
com.alibaba.otter.canal.client.adapter.es.ESAdapter类中

transportClient.addTransportAddress(new TransportAddress(InetAddress.getByName(host.substring(0, i)),

Integer.parseInt(host.substring(i + 1))));

修改成：

transportClient.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(host.substring(0, i)),

Integer.parseInt(host.substring(i + 1))));

3. 重新编译
```
mvn clean install -Dmaven.test.skip -Denv=release
```

另外在同步SQL上面也有很多限制，下面是官方文档的：

主表不能为子查询语句
只能使用left outer join即最左表一定要是主表
关联从表如果是子查询不能有多张表
主sql中不能有where查询条件(从表子查询中可以有where条件但是不推荐, 可能会造成数据同步的不一致, 比如修改了where条件中的字段内容)
关联条件只允许主外键的'='操作不能出现其他常量判断比如: on a.role_id=b.id and b.statues=1
关联条件必须要有一个字段出现在主查询语句中比如: on a.role_id=b.id 其中的 a.role_id 或者 b.id 必须出现在主select语句中

除此之外，在使用过程中，还发现了一些其它未说明的限制和问题

1. _index只支持索引名称，不支持alias，在索引需要重构修改名称的时候，这里也需要进行修改。

2. 查询语句的字段大小写必须跟数据库中一致，如图中的ORDER_ID，如不指定，不会报错，但是查不出数据。

3. 在某一个表的数据时，会删除整个文档，比如删除了order_payment，那么会整个order_header文档。

5. 更新时查询不支持非数字类型主键，这个是由于拼接SQL字符串导致，已通过修改拼接代码解决。

6. 有一种业务场景，就是修改供应商或者维修厂的名称时，会涉及大量的文档更新，看了下原来的代码的代码中使用了批处理，但是速度奇慢，后续把代码注释掉之后，速度却得到了质的提升，无解。

注意：

对于官方提供的canal adapter，个人建议酌情使用，在非常简单的单表同步或者多表简单关联，可以考虑使用，能够很大程度的节省开发时间

在订单查询优化过程中，早期一直在使用canal adapter，但是因为订单的业务同步关联比较复杂，在对源码进行了多次修改才适配了订单数据的同步，另外，canal adapter在大多数场景下都会进行回表查询，这对同步效率也会有一定的影响。

在后面演示环境的DTS数据订阅处理时，发现有些代码完全可以为测试环境的canal同步所用，考虑到后续同步的灵活性，决定放弃了官方的adapter，自己写一套adapter。

这篇关于MySQL实时同步到Elasticsearch实现方案 —— canal（兼容ES5.X）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1129873。 23002807@qq.com

相关文章

MySQL数据库双机热备的配置方法详解

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备（M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

阅读更多...

C++中unordered_set哈希集合的实现

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

阅读更多...

C++中悬垂引用(Dangling Reference) 的实现

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量，变量超出作用域后销毁2. 引用绑定到动态分配的对象，对象

阅读更多...

SpringBoot基于注解实现数据库字段回填的完整方案

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

阅读更多...

Java HashMap的底层实现原理深度解析

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述：HashMap的宏观结构二、核心数据结构解析1. 数组（桶数组）2. 链表节点（Node

阅读更多...

Java AOP面向切面编程的概念和实现方式

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点（如日志、事务）与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么？二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

阅读更多...

Python实现字典转字符串的五种方法

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法：2、使用str方法：3、使用循环和字符串拼接：4、使用字符

阅读更多...

深入理解Mysql OnlineDDL的算法

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么？二、Online DDL 的三种主要算法2.1COPY（复制法）

阅读更多...

Linux下利用select实现串口数据读取过程

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码（使用select实现）代码解释总结在 linux 系统里，我们可以借助 select、

阅读更多...

Linux挂载linux/Windows共享目录实现方式

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》：本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端（NFS）在服务器端安装 NFS创建要共享的目录修改 NFS 配

阅读更多...