ClickHousez中如何定时清理过期数据库?

2024-09-02 07:12

本文主要是介绍ClickHousez中如何定时清理过期数据库?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、脚本清理

要在ClickHouse中自动删除过期的数据库,你可以使用ClickHouse的SQL命令结合外部脚本(如Shell脚本)和计划任务(如cron)来实现。下面是一个示例,展示如何创建一个Shell脚本来检查数据库的创建时间,并根据设定的时间阈值来删除过期的数据库。

步骤 1: 创建 Shell 脚本
首先,创建一个Shell脚本,用于检查ClickHouse中的数据库,并根据创建时间来删除过期的数据库。

示例脚本
创建一个名为 delete_expired_databases.sh 的文件,并添加以下内容:

#!/bin/bash

设置要检查的数据库前缀

DATABASE_PREFIX=my_database_

设置过期时间(天)

EXPIRATION_DAYS=30

获取当前时间戳

CURRENT_TIME=$(date +%s)

获取所有符合前缀的数据库

DATABASES= ( c l i c k h o u s e − c l i e n t − − q u e r y " S E L E C T n a m e F R O M s y s t e m . d a t a b a s e s W H E R E n a m e L I K E ′ (clickhouse-client --query "SELECT name FROM system.databases WHERE name LIKE ' (clickhouseclientquery"SELECTnameFROMsystem.databasesWHEREnameLIKEDATABASE_PREFIX%'")

遍历数据库

for DB in KaTeX parse error: Expected 'EOF', got '#' at position 19: …ABASES; do #̲ 获取数据库的创建时间 …(clickhouse-client --query “SELECT created_at FROM system.databases WHERE name = ‘$DB’”)

# 计算时间差
TIME_DIFF=$(( ($CURRENT_TIME - $(date -d "$CREATE_TIME" +%s)) / 86400 ))# 检查是否过期
if [ $TIME_DIFF -gt $EXPIRATION_DAYS ]; thenecho "Database $DB is expired. Deleting..."clickhouse-client --query "DROP DATABASE IF EXISTS $DB"
fi

done
步骤 2: 给脚本添加执行权限
确保脚本具有执行权限:

chmod +x delete_expired_databases.sh
步骤 3: 定期执行脚本
你可以使用Linux的cron来定期执行这个脚本。例如,如果你想每天凌晨2点执行这个脚本,可以将以下行添加到crontab:

用crontab -e 来编辑文件

检查是否安装了crontab命令
rpm -qa | grep crontab
如果提示未安装请自行安装,crontab安装包在系统光盘里面的pacekage文件夹crontabs安装包。执行命令,如下图所示,表示安装了crontab命令

第一次要选择linux编辑crontab方式,一般选择第二个

root@iZuf682dbngh2ck4cq9kluZ:/home/yulei# crontab -e
no crontab for root - using an empty one

Select an editor. To change later, run ‘select-editor’.

  1. /bin/nano <---- easiest
  2. /usr/bin/vim.basic
  3. /usr/bin/vim.tiny
  4. /bin/ed

Choose 1-4 [1]: 2
crontab: installing new crontab
添加cron定时任务
0 2 * * * /path/to/delete_expired_databases.sh

二、JAVA代码定时任务清理机制

1、查询过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");//一开始必须填一个已经存在的数据库String jdbcUrl = "jdbc:clickhouse://ip:8123/default";ClickHouseProperties properties = new ClickHouseProperties();properties.setUser("default");properties.setPassword("");properties.setSocketTimeout(30000);ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式ClickHouseConnection conn = dataSou.getConnection();ClickHouseStatement stat = conn.createStatement();ResultSet rs= stat.executeQuery("SELECT name FROM system.databases WHERE name LIKE 'webfunny_db_%'");while(rs.next()) {String dbName = rs.getString("name");if(dbName.contains("_")){String dbNameNew = dbName.substring((dbName.lastIndexOf("_") + 1), dbName.length());//20240222152127819String thirdDaysDate = DateUtil.getTimeStampByDays(30);if (FebsUtil.match("\\-?\\d+", dbNameNew) && Long.parseLong(dbNameNew) < Long.parseLong(thirdDaysDate)){deleteCHDbNameList.add(dbName);}}}//打开创建的数据库stat.close();conn.close();

2、清理过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");//一开始必须填一个已经存在的数据库String jdbcUrl = "jdbc:clickhouse://ip:8123/default";ClickHouseProperties properties = new ClickHouseProperties();properties.setUser("default");properties.setPassword("");properties.setSocketTimeout(30000);ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式ClickHouseConnection conn = dataSou.getConnection();ClickHouseStatement stat = conn.createStatement();for (String dbName : deleteCHDbNameList) {stat.execute("DROP DATABASE IF EXISTS " + dbName);}//打开创建的数据库stat.close();conn.close();

注意事项
备份数据:在执行任何删除操作之前,请确保你已经备份了重要数据。
测试脚本:在生产环境中执行任何脚本之前,请务必在测试环境中彻底测试。
权限管理:确保执行脚本的用户有足够的权限来删除数据库。
监控和日志:设置适当的监控和日志记录,以便追踪删除操作的状态和结果。

好了感兴趣的同学可以直接访问webfunny进行实践操作
在这里插入图片描述

这篇关于ClickHousez中如何定时清理过期数据库?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1129342

相关文章

MySQL数据库约束深入详解

《MySQL数据库约束深入详解》:本文主要介绍MySQL数据库约束,在MySQL数据库中,约束是用来限制进入表中的数据类型的一种技术,通过使用约束,可以确保数据的准确性、完整性和可靠性,需要的朋友... 目录一、数据库约束的概念二、约束类型三、NOT NULL 非空约束四、DEFAULT 默认值约束五、UN

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删

redis过期key的删除策略介绍

《redis过期key的删除策略介绍》:本文主要介绍redis过期key的删除策略,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录第一种策略:被动删除第二种策略:定期删除第三种策略:强制删除关于big key的清理UNLINK命令FLUSHALL/FLUSHDB命

Spring Boot 集成 Quartz并使用Cron 表达式实现定时任务

《SpringBoot集成Quartz并使用Cron表达式实现定时任务》本篇文章介绍了如何在SpringBoot中集成Quartz进行定时任务调度,并通过Cron表达式控制任务... 目录前言1. 添加 Quartz 依赖2. 创建 Quartz 任务3. 配置 Quartz 任务调度4. 启动 Sprin

数据库面试必备之MySQL中的乐观锁与悲观锁

《数据库面试必备之MySQL中的乐观锁与悲观锁》:本文主要介绍数据库面试必备之MySQL中乐观锁与悲观锁的相关资料,乐观锁适用于读多写少的场景,通过版本号检查避免冲突,而悲观锁适用于写多读少且对数... 目录一、引言二、乐观锁(一)原理(二)应用场景(三)示例代码三、悲观锁(一)原理(二)应用场景(三)示例

python logging模块详解及其日志定时清理方式

《pythonlogging模块详解及其日志定时清理方式》:本文主要介绍pythonlogging模块详解及其日志定时清理方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录python logging模块及日志定时清理1.创建logger对象2.logging.basicCo

Node.js 数据库 CRUD 项目示例详解(完美解决方案)

《Node.js数据库CRUD项目示例详解(完美解决方案)》:本文主要介绍Node.js数据库CRUD项目示例详解(完美解决方案),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考... 目录项目结构1. 初始化项目2. 配置数据库连接 (config/db.js)3. 创建模型 (models/

SpringQuartz定时任务核心组件JobDetail与Trigger配置

《SpringQuartz定时任务核心组件JobDetail与Trigger配置》Spring框架与Quartz调度器的集成提供了强大而灵活的定时任务解决方案,本文主要介绍了SpringQuartz定... 目录引言一、Spring Quartz基础架构1.1 核心组件概述1.2 Spring集成优势二、J

java实现延迟/超时/定时问题

《java实现延迟/超时/定时问题》:本文主要介绍java实现延迟/超时/定时问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java实现延迟/超时/定时java 每间隔5秒执行一次,一共执行5次然后结束scheduleAtFixedRate 和 schedu

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA