Pulsar集成Debezium监听MySQL日志

2024-03-18 15:28

本文主要是介绍Pulsar集成Debezium监听MySQL日志,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

此处为docker部署方式

一.准备镜像和插件

pulsar镜像:这里使用最新版本apachepulsar/pulsar:latest,这里最新版是3.2.1,自己拉
插件:pulsar-io-debezium-mysql-3.2.1.nar,这里使用3.2.1版本的,也是最新版本的,保持一直。

pulsar-io-debezium-xxx-xxx.nar,这个是在Apache pulsar离线下载包里面找到,具体为:https://archive.apache.org/dist/pulsar/pulsar-3.2.1/connectors/,此处是pulsar与debezium集成的插件,具体的数据库找对应的。

二.准备文件

1.MySQL开启binlog(MySQL如果docker启动不用开启,不知道为啥)

subo vim /etc/my.cnf[mysqld]  // 添加下面三行
server_id=1
log-bin=mysql-bin
binlog_format=row

2.配置source-config.yaml(文件名可自定义)

示例:

tenant: "public" # 租户,可自定义
namespace: "default" # 命名空间,可自定义
name: "debezium-mysql-source" # source名,可自定义
topicName: "debezium-mysql-topic" # topic名,可自定义
archive: "data/pulsar-io-debezium-mysql-2.9.1.nar" # 上传的nar文件的存放位置,data目录,名字可自定义,位置在plusar目录下第一层,与bin目录平齐parallelism: 1 # 不用改configs:database.hostname: "118.195.***.***" # 数据库ipdatabase.port: "3306" # 数据库portdatabase.serverTimezone: "GMT+8" # # 数据库市区,可以没有这一条database.user: "root" # 数据库用户名database.password: "123456" # 数据库密码database.server.id: "1" # 唯一值,可自定义database.server.name: "dbserver1" # 服务名,可自定义,对应查询topic的第一截database.include.list:"demo_esb" # 需要访问的数据库## database.exclude.list: "demo_dap" # 不需要访问的数据库,可以没有这一条table.include.list:"demo_esb.ack_sample,demo_esb.aac_sample" # 需要访问的数据表,可以没有这一条## table.exclude.list:"demo_esb.ack sample_test" # 不需要访问的数据表,可以没有这一条column.include.list:"demo_esb.ack_sample.s_ID,demo_esb.ack_sample.s_coDE" # 需要访问的列,可以没有这一条##column.exclude.list:"demo_esb.ack_sample.s TEsri # 不需要访问的列,可以没有这一条## include.schema.changes:true" # 包含schema的改变,可以没有这一条database.history: "org.apache.pulsar.io.debezium.PulsarDatabaseHistory" # 不用改database.history.pulsar.topic: "my-history-topic" # topic名,可自定义database.history.pulsar.service.url: "pulsar://118.195.***.***:6651,118.195.***.***:6652,118.195.***.***:6653" # pulsar集群服务地址,自己修改key.converter: "org.apache.kafka.connect.json.JsonConverter" # 不用改value.converter: "org.apache.kafka.connect.json.JsonConverter" # 不用改pulsar.service.url: "pulsar://118.195.***.***:6651,118.195.***.***:6652,118.195.***.***:6653" # pulsar集群服务地址,自己修改,同上offset.storage.topic: "offset-topic" # topic名,可自定义

实际使用:

tenant: "public"
namespace: "default"
name: "debezium-mysql-source"
topicName: "debezium-mysql-topic"
archive: "data/pulsar-io-debezium-mysql-3.2.1.nar" # 上传的nar文件的存放位置parallelism: 1configs:database.hostname: "192.168.8.112"database.port: "3306"database.serverTimezone: "GMT+8"database.user: "root"database.password: "root"database.server.id: "2"database.server.name: "b"database.include.list: "a"database.history: "org.apache.pulsar.io.debezium.PulsarDatabaseHistory"database.history.pulsar.topic: "my-history-topic"database.history.pulsar.service.url: "pulsar://localhost:6650"key.converter: "org.apache.kafka.connect.json.JsonConverter"value.converter: "org.apache.kafka.connect.json.JsonConverter"pulsar.service.url: "pulsar://localhost:6650"offset.storage.topic: "offset-mysql-topic"

source运行之后,监控的topic,共由三截构成:
第一截:database.server.name的值
第二截:database.include.list的值,即数据库名
第三截:该数据库中表名
即:topicserver_name.database_name.table_name

三、启动

1.MySQL启动

docker run --name mysql -d -p 3306:3306 -e MYSQL_ROOT_PASSWORD=root mysql:8.0.36

此处docker启动,数据卷自己挂载。外部服务(开启binlog)的话,自己启动即可。

2.pulsar启动

docker run --name pulsar -d -p 6650:6650 -p 8080:8080 apachepulsar/pulsar:latest bin/pulsar standalone

此处单机版启动,集群启动,自己配置。

3.debezium插件启动

a.pulsar-io-debezium文件放在data下(其他目录下也可以)

docker cp ./pulsar-io-debezium-mysql-3.2.1.nar 981c770b0f87:/pulsar/data/pulsar-io-debezium-mysql-3.2.1.nar

需要用数据卷挂载方式,自己整

b.source-config.yaml文件放在conf下(其他目录下也可以)

docker cp ./source-config.yaml 981c770b0f87:/pulsar/conf/source-config.yaml

需要用数据卷挂载方式,自己整

c.启动连接器

进入pulsar目录下

./bin/pulsar-admin source localrun --source-config-file conf/source-config.yaml

四、测试

1.查看 pulsar topic

./bin/pulsar-admin topics list public/default

2.消费设置的topic消息

./bin/pulsar-client consume -s "first-subscription" persistent://public/default/b.a.t_user -n 0

3.MySQL中增改删数据,观察消费输出

这篇关于Pulsar集成Debezium监听MySQL日志的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/822784

相关文章

MySQL 中的 CAST 函数详解及常见用法

《MySQL中的CAST函数详解及常见用法》CAST函数是MySQL中用于数据类型转换的重要函数,它允许你将一个值从一种数据类型转换为另一种数据类型,本文给大家介绍MySQL中的CAST... 目录mysql 中的 CAST 函数详解一、基本语法二、支持的数据类型三、常见用法示例1. 字符串转数字2. 数字

Mysql实现范围分区表(新增、删除、重组、查看)

《Mysql实现范围分区表(新增、删除、重组、查看)》MySQL分区表的四种类型(范围、哈希、列表、键值),主要介绍了范围分区的创建、查询、添加、删除及重组织操作,具有一定的参考价值,感兴趣的可以了解... 目录一、mysql分区表分类二、范围分区(Range Partitioning1、新建分区表:2、分

MySQL 定时新增分区的实现示例

《MySQL定时新增分区的实现示例》本文主要介绍了通过存储过程和定时任务实现MySQL分区的自动创建,解决大数据量下手动维护的繁琐问题,具有一定的参考价值,感兴趣的可以了解一下... mysql创建好分区之后,有时候会需要自动创建分区。比如,一些表数据量非常大,有些数据是热点数据,按照日期分区MululbU

SQL Server配置管理器无法打开的四种解决方法

《SQLServer配置管理器无法打开的四种解决方法》本文总结了SQLServer配置管理器无法打开的四种解决方法,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录方法一:桌面图标进入方法二:运行窗口进入检查版本号对照表php方法三:查找文件路径方法四:检查 S

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

MySQL中查找重复值的实现

《MySQL中查找重复值的实现》查找重复值是一项常见需求,比如在数据清理、数据分析、数据质量检查等场景下,我们常常需要找出表中某列或多列的重复值,具有一定的参考价值,感兴趣的可以了解一下... 目录技术背景实现步骤方法一:使用GROUP BY和HAVING子句方法二:仅返回重复值方法三:返回完整记录方法四:

从入门到精通MySQL联合查询

《从入门到精通MySQL联合查询》:本文主要介绍从入门到精通MySQL联合查询,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下... 目录摘要1. 多表联合查询时mysql内部原理2. 内连接3. 外连接4. 自连接5. 子查询6. 合并查询7. 插入查询结果摘要前面我们学习了数据库设计时要满

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

解读GC日志中的各项指标用法

《解读GC日志中的各项指标用法》:本文主要介绍GC日志中的各项指标用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、基础 GC 日志格式(以 G1 为例)1. Minor GC 日志2. Full GC 日志二、关键指标解析1. GC 类型与触发原因2. 堆

MySQL查询JSON数组字段包含特定字符串的方法

《MySQL查询JSON数组字段包含特定字符串的方法》在MySQL数据库中,当某个字段存储的是JSON数组,需要查询数组中包含特定字符串的记录时传统的LIKE语句无法直接使用,下面小编就为大家介绍两种... 目录问题背景解决方案对比1. 精确匹配方案(推荐)2. 模糊匹配方案参数化查询示例使用场景建议性能优