ClickHousez中如何定时清理过期数据库?

2024-09-02 07:12

本文主要是介绍ClickHousez中如何定时清理过期数据库?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、脚本清理

要在ClickHouse中自动删除过期的数据库,你可以使用ClickHouse的SQL命令结合外部脚本(如Shell脚本)和计划任务(如cron)来实现。下面是一个示例,展示如何创建一个Shell脚本来检查数据库的创建时间,并根据设定的时间阈值来删除过期的数据库。

步骤 1: 创建 Shell 脚本
首先,创建一个Shell脚本,用于检查ClickHouse中的数据库,并根据创建时间来删除过期的数据库。

示例脚本
创建一个名为 delete_expired_databases.sh 的文件,并添加以下内容:

#!/bin/bash

设置要检查的数据库前缀

DATABASE_PREFIX=my_database_

设置过期时间(天)

EXPIRATION_DAYS=30

获取当前时间戳

CURRENT_TIME=$(date +%s)

获取所有符合前缀的数据库

DATABASES= ( c l i c k h o u s e − c l i e n t − − q u e r y " S E L E C T n a m e F R O M s y s t e m . d a t a b a s e s W H E R E n a m e L I K E ′ (clickhouse-client --query "SELECT name FROM system.databases WHERE name LIKE ' (clickhouseclientquery"SELECTnameFROMsystem.databasesWHEREnameLIKEDATABASE_PREFIX%'")

遍历数据库

for DB in KaTeX parse error: Expected 'EOF', got '#' at position 19: …ABASES; do #̲ 获取数据库的创建时间 …(clickhouse-client --query “SELECT created_at FROM system.databases WHERE name = ‘$DB’”)

# 计算时间差
TIME_DIFF=$(( ($CURRENT_TIME - $(date -d "$CREATE_TIME" +%s)) / 86400 ))# 检查是否过期
if [ $TIME_DIFF -gt $EXPIRATION_DAYS ]; thenecho "Database $DB is expired. Deleting..."clickhouse-client --query "DROP DATABASE IF EXISTS $DB"
fi

done
步骤 2: 给脚本添加执行权限
确保脚本具有执行权限:

chmod +x delete_expired_databases.sh
步骤 3: 定期执行脚本
你可以使用Linux的cron来定期执行这个脚本。例如,如果你想每天凌晨2点执行这个脚本,可以将以下行添加到crontab:

用crontab -e 来编辑文件

检查是否安装了crontab命令
rpm -qa | grep crontab
如果提示未安装请自行安装,crontab安装包在系统光盘里面的pacekage文件夹crontabs安装包。执行命令,如下图所示,表示安装了crontab命令

第一次要选择linux编辑crontab方式,一般选择第二个

root@iZuf682dbngh2ck4cq9kluZ:/home/yulei# crontab -e
no crontab for root - using an empty one

Select an editor. To change later, run ‘select-editor’.

  1. /bin/nano <---- easiest
  2. /usr/bin/vim.basic
  3. /usr/bin/vim.tiny
  4. /bin/ed

Choose 1-4 [1]: 2
crontab: installing new crontab
添加cron定时任务
0 2 * * * /path/to/delete_expired_databases.sh

二、JAVA代码定时任务清理机制

1、查询过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");//一开始必须填一个已经存在的数据库String jdbcUrl = "jdbc:clickhouse://ip:8123/default";ClickHouseProperties properties = new ClickHouseProperties();properties.setUser("default");properties.setPassword("");properties.setSocketTimeout(30000);ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式ClickHouseConnection conn = dataSou.getConnection();ClickHouseStatement stat = conn.createStatement();ResultSet rs= stat.executeQuery("SELECT name FROM system.databases WHERE name LIKE 'webfunny_db_%'");while(rs.next()) {String dbName = rs.getString("name");if(dbName.contains("_")){String dbNameNew = dbName.substring((dbName.lastIndexOf("_") + 1), dbName.length());//20240222152127819String thirdDaysDate = DateUtil.getTimeStampByDays(30);if (FebsUtil.match("\\-?\\d+", dbNameNew) && Long.parseLong(dbNameNew) < Long.parseLong(thirdDaysDate)){deleteCHDbNameList.add(dbName);}}}//打开创建的数据库stat.close();conn.close();

2、清理过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");//一开始必须填一个已经存在的数据库String jdbcUrl = "jdbc:clickhouse://ip:8123/default";ClickHouseProperties properties = new ClickHouseProperties();properties.setUser("default");properties.setPassword("");properties.setSocketTimeout(30000);ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式ClickHouseConnection conn = dataSou.getConnection();ClickHouseStatement stat = conn.createStatement();for (String dbName : deleteCHDbNameList) {stat.execute("DROP DATABASE IF EXISTS " + dbName);}//打开创建的数据库stat.close();conn.close();

注意事项
备份数据:在执行任何删除操作之前,请确保你已经备份了重要数据。
测试脚本:在生产环境中执行任何脚本之前,请务必在测试环境中彻底测试。
权限管理:确保执行脚本的用户有足够的权限来删除数据库。
监控和日志:设置适当的监控和日志记录,以便追踪删除操作的状态和结果。

好了感兴趣的同学可以直接访问webfunny进行实践操作
在这里插入图片描述

这篇关于ClickHousez中如何定时清理过期数据库?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1129342

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

Spring定时任务之fixedRateString的实现示例

《Spring定时任务之fixedRateString的实现示例》本文主要介绍了Spring定时任务之fixedRateString的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录从毫秒到 Duration:为何要改变?核心:Java.time.Duration.parse

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面:本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

MySQL批量替换数据库字符集的实用方法(附详细代码)

《MySQL批量替换数据库字符集的实用方法(附详细代码)》当需要修改数据库编码和字符集时,通常需要对其下属的所有表及表中所有字段进行修改,下面:本文主要介绍MySQL批量替换数据库字符集的实用方法... 目录前言为什么要批量修改字符集?整体脚本脚本逻辑解析1. 设置目标参数2. 生成修改表默认字符集的语句3

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

如何通过try-catch判断数据库唯一键字段是否重复

《如何通过try-catch判断数据库唯一键字段是否重复》在MyBatis+MySQL中,通过try-catch捕获唯一约束异常可避免重复数据查询,优点是减少数据库交互、提升并发安全,缺点是异常处理开... 目录1、原理2、怎么理解“异常走的是数据库错误路径,开销比普通逻辑分支稍高”?1. 普通逻辑分支 v

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1

使用shardingsphere实现mysql数据库分片方式

《使用shardingsphere实现mysql数据库分片方式》本文介绍如何使用ShardingSphere-JDBC在SpringBoot中实现MySQL水平分库,涵盖分片策略、路由算法及零侵入配置... 目录一、ShardingSphere 简介1.1 对比1.2 核心概念1.3 Sharding-Sp