Canal解决select count(*)执行慢的问题

2024-05-15 12:44

本文主要是介绍Canal解决select count(*)执行慢的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 前言

count 的常用方式,使用 count(*)来统计数据条数,但是 innodb 没有存储数据总数,所以执行起来就会很慢。

  1. 可以使用 expalin sql 来返回预估行数,expalin select count(*)....., 通过预估的方式,统计数据条数。
  2. 可以使用 redis 存储记录总数,或者一个额外的表来存储数据条数。

用了 Redis 来维持总数,那么就会涉及数据一致性的问题:

1. 如果数据短时间不一致但是业务可以接受的话,那么就可以考虑异步刷新 Redis 上的总数。

2. 使用 Canal 之类的工具监听 MySQL binlog,然后刷新 Redis 上的总数。

 这篇文章就来说说Canal

Canal的应用 

使用 canal 工具监听 MySQL binlog 并实时刷新 Redis 是一个常见的需求,特别是在需要将数据库变化同步到缓存系统时。以下是详细的步骤和相关代码示例来实现这一目标。 

1. 安装 Canal

Canal 是阿里巴巴开源的一个高性能 MySQL binlog 增量订阅 & 消费组件。首先,需要下载并安装 Canal。

安装步骤:
  • 访问 Canal 官方 GitHub 仓库: GitHub - alibaba/canal: 阿里巴巴 MySQL binlog 增量订阅&消费组件
  • 下载并解压 Canal Server。
  • 修改 canal.propertiesinstance.properties 配置文件,根据你的 MySQL 配置进行修改。

2. 配置 Canal

instance.properties 文件中,设置 MySQL 连接信息,例如:

canal.instance.mysql.slaveId=1234
canal.instance.master.address=127.0.0.1:3306
canal.instance.dbUsername=root
canal.instance.dbPassword=your_password
canal.instance.connectionCharset=UTF-8
canal.instance.defaultDatabaseName=test_db
canal.instance.filter.regex=test_db\\..*

3. 启动 Canal Server

在命令行中,进入 Canal 目录并启动 Canal Server:

sh bin/startup.sh

4. 编写 Canal Client

Canal 提供了 Java 客户端 API,用于消费 binlog 数据。你需要编写一个 Canal Client 来监听 binlog 并将变化的数据写入 Redis。

引入依赖

在你的 pom.xml 文件中添加 Canal 和 Redis 的依赖:

<dependencies><dependency><groupId>com.alibaba.otter</groupId><artifactId>canal.client</artifactId><version>1.1.5</version></dependency><dependency><groupId>redis.clients</groupId><artifactId>jedis</artifactId><version>3.3.0</version></dependency>
</dependencies>
编写 Canal Client 代码

以下是一个简单的 Canal Client 示例,它会将数据库变更同步到 Redis:

import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.client.CanalConnectors;
import com.alibaba.otter.canal.protocol.CanalEntry;
import com.alibaba.otter.canal.protocol.Message;
import redis.clients.jedis.Jedis;import java.net.InetSocketAddress;
import java.util.List;public class CanalClient {public static void main(String[] args) {// 创建 Canal 连接CanalConnector connector = CanalConnectors.newSingleConnector(new InetSocketAddress("127.0.0.1", 11111), "example", "", "");try (Jedis jedis = new Jedis("localhost", 6379)) {connector.connect();connector.subscribe(".*\\..*");connector.rollback();while (true) {Message message = connector.getWithoutAck(100);long batchId = message.getId();int size = message.getEntries().size();if (batchId != -1 && size > 0) {processEntries(message.getEntries(), jedis);}connector.ack(batchId);}} finally {connector.disconnect();}}private static void processEntries(List<CanalEntry.Entry> entries, Jedis jedis) {for (CanalEntry.Entry entry : entries) {if (entry.getEntryType() == CanalEntry.EntryType.ROWDATA) {try {CanalEntry.RowChange rowChange = CanalEntry.RowChange.parseFrom(entry.getStoreValue());CanalEntry.EventType eventType = rowChange.getEventType();for (CanalEntry.RowData rowData : rowChange.getRowDatasList()) {if (eventType == CanalEntry.EventType.DELETE) {handleDelete(rowData.getBeforeColumnsList(), jedis);} else if (eventType == CanalEntry.EventType.INSERT) {handleInsert(rowData.getAfterColumnsList(), jedis);} else {handleUpdate(rowData.getBeforeColumnsList(), rowData.getAfterColumnsList(), jedis);}}} catch (Exception e) {throw new RuntimeException("ERROR: " + entry.toString(), e);}}}}private static void handleInsert(List<CanalEntry.Column> columns, Jedis jedis) {// Example: Save the inserted row to RedisString key = null;for (CanalEntry.Column column : columns) {if ("id".equals(column.getName())) {key = "user:" + column.getValue();break;}}if (key != null) {for (CanalEntry.Column column : columns) {jedis.hset(key, column.getName(), column.getValue());}}}private static void handleDelete(List<CanalEntry.Column> columns, Jedis jedis) {// Example: Delete the row from RedisString key = null;for (CanalEntry.Column column : columns) {if ("id".equals(column.getName())) {key = "user:" + column.getValue();break;}}if (key != null) {jedis.del(key);}}private static void handleUpdate(List<CanalEntry.Column> beforeColumns, List<CanalEntry.Column> afterColumns, Jedis jedis) {// Example: Update the row in RedisString key = null;for (CanalEntry.Column column : afterColumns) {if ("id".equals(column.getName())) {key = "user:" + column.getValue();break;}}if (key != null) {for (CanalEntry.Column column : afterColumns) {jedis.hset(key, column.getName(), column.getValue());}}}
}

5. 运行 Canal Client

编译并运行 Canal Client,它会监听 MySQL binlog 变更,并将变更实时同步到 Redis。

 

总结

通过上述步骤,你可以实现使用 Canal 工具监听 MySQL binlog,并实时刷新 Redis 的功能。这种方式可以确保数据库和缓存的一致性,适用于高性能、高实时性的数据同步场景。

这篇关于Canal解决select count(*)执行慢的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/991860

相关文章

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

IDEA和GIT关于文件中LF和CRLF问题及解决

《IDEA和GIT关于文件中LF和CRLF问题及解决》文章总结:因IDEA默认使用CRLF换行符导致Shell脚本在Linux运行报错,需在编辑器和Git中统一为LF,通过调整Git的core.aut... 目录问题描述问题思考解决过程总结问题描述项目软件安装shell脚本上git仓库管理,但拉取后,上l

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

解决docker目录内存不足扩容处理方案

《解决docker目录内存不足扩容处理方案》文章介绍了Docker存储目录迁移方法:因系统盘空间不足,需将Docker数据迁移到更大磁盘(如/home/docker),通过修改daemon.json配... 目录1、查看服务器所有磁盘的使用情况2、查看docker镜像和容器存储目录的空间大小3、停止dock

idea npm install很慢问题及解决(nodejs)

《ideanpminstall很慢问题及解决(nodejs)》npm安装速度慢可通过配置国内镜像源(如淘宝)、清理缓存及切换工具解决,建议设置全局镜像(npmconfigsetregistryht... 目录idea npm install很慢(nodejs)配置国内镜像源清理缓存总结idea npm in

pycharm跑python项目易出错的问题总结

《pycharm跑python项目易出错的问题总结》:本文主要介绍pycharm跑python项目易出错问题的相关资料,当你在PyCharm中运行Python程序时遇到报错,可以按照以下步骤进行排... 1. 一定不要在pycharm终端里面创建环境安装别人的项目子模块等,有可能出现的问题就是你不报错都安装

idea突然报错Malformed \uxxxx encoding问题及解决

《idea突然报错Malformeduxxxxencoding问题及解决》Maven项目在切换Git分支时报错,提示project元素为描述符根元素,解决方法:删除Maven仓库中的resolv... 目www.chinasem.cn录问题解决方式总结问题idea 上的 maven China编程项目突然报错,是

java中ssh2执行多条命令的四种方法

《java中ssh2执行多条命令的四种方法》本文主要介绍了java中ssh2执行多条命令的四种方法,包括分号分隔、管道分隔、EOF块、脚本调用,可确保环境配置生效,提升操作效率,具有一定的参考价值,感... 目录1 使用分号隔开2 使用管道符号隔开3 使用写EOF的方式4 使用脚本的方式大家平时有没有遇到自

在Ubuntu上打不开GitHub的完整解决方法

《在Ubuntu上打不开GitHub的完整解决方法》当你满心欢喜打开Ubuntu准备推送代码时,突然发现终端里的gitpush卡成狗,浏览器里的GitHub页面直接变成Whoathere!警告页面... 目录一、那些年我们遇到的"红色惊叹号"二、三大症状快速诊断症状1:浏览器直接无法访问症状2:终端操作异常

mybatis直接执行完整sql及踩坑解决

《mybatis直接执行完整sql及踩坑解决》MyBatis可通过select标签执行动态SQL,DQL用ListLinkedHashMap接收结果,DML用int处理,注意防御SQL注入,优先使用#... 目录myBATiFBNZQs直接执行完整sql及踩坑select语句采用count、insert、u