Sqoop批量把MySQL数据导入到HBase

2024-06-06 13:58

本文主要是介绍Sqoop批量把MySQL数据导入到HBase,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、简介

只是为了方便

二、Sqoop安装

https://blog.csdn.net/u011374856/article/details/

三、MySQL单表导入HBase

1、新建脚本

vi mysql_hbase.sh

2、编辑脚本,两个参数,第一个HBase表名称前缀(方便批量删除),第二个MySQL表名称

$SQOOP_HOME/bin/sqoop import \
--connect jdbc:mysql://127.0.0.1:3306/test \
--driver com.mysql.cj.jdbc.Driver \
--username root \
--password 123456 \
--table $2 \
--hbase-table $1_$2 \
--column-family info \
--hbase-create-table \
--hbase-row-key id \
--hbase-bulkload

3、修改权限

chmod 777 mysql_hbase.sh

4、执行脚本验证

例如:把MySQL中 test 表导入到 HBase,HBase表名称为woniu_test

./mysql_hbase.sh woniu test

5、自己去HBase中验证结果

四、HBase批量删除表

1、新建脚本

vi hbase_drop_table.sh

2、编辑脚本,一个参数,批量删除HBase表名称前缀

#删除表临时文件目录
FILE_NAME="/woniu/shell/drop_table_tmp.txt"#删除临时文件
rm -rf $FILE_NAMEecho $1#写数据
#禁用表
echo disable_all  "'"$1".*'" >> $FILE_NAME
#删除表
echo drop_all "'"$1".*'" >> $FILE_NAME
#退出
echo exit >> $FILE_NAME#进入HBase的bin目录
cd $HBASE_HOME/bin#开启HBase的shell
./hbase shell $FILE_NAME

3、修改权限

chmod 777 hbase_drop_table.sh

4、执行脚本

例如:把HBase表名称前缀为woniu的批量删除

./hbase_drop_table.sh woniu

5、自己去HBase中验证结果

五、生成批量导入脚本

1、通过Navicat连接MySQL数据库

2、查询所有表名称

select CONCAT('./mysql_hbase.sh ','woniu ',table_name) shell from information_schema.tables where table_schema='test'

3、查询结果导出为mysql_hbase_batch.txt文本,注意:不要列的标题

4、把mysql_hbase_batch.txt文本中所有双引号替换为空

5、新建脚本

vi mysql_hbase_batch.sh

6、把mysql_hbase_batch.txt 全部复制到 mysql_hbase_batch.sh

7、修改权限

chmod 777 mysql_hbase_batch.sh

8、执行批量导入,注意:如果重新导入,先执行批量删除

./mysql_hbase_batch.sh

六、HBase验证结果

这篇关于Sqoop批量把MySQL数据导入到HBase的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1036309

相关文章

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

SQL Server 中的 WITH (NOLOCK) 示例详解

《SQLServer中的WITH(NOLOCK)示例详解》SQLServer中的WITH(NOLOCK)是一种表提示,等同于READUNCOMMITTED隔离级别,允许查询在不获取共享锁的情... 目录SQL Server 中的 WITH (NOLOCK) 详解一、WITH (NOLOCK) 的本质二、工作

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也