将TPC-DS数据加载到MariaDB中

2023-11-03 14:59
文章标签 数据 加载 ds mariadb tpc

本文主要是介绍将TPC-DS数据加载到MariaDB中,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

将TPC-DS数据加载到MariaDB中

环境:

  • ubuntu 18.04
  • MariaDB 10.1.29-MariaDB-6
  • TPC-DS v2.7

第一步 下载TPC-DS工具

  • 访问此页面并按要求下载TPC-DS工具

  • 到相应目录下解压文件

    unzip tpc-ds-tool.zip

第二步 建立dsdgen&dsqgen

#安装相关依赖
sudo apt-get install gcc make
  • 进入tools目录,执行make命令

    zhouj@ubuntu:~/v2.7.0/tools$ ./dsdgen -scale 5 -force
    
  • 生成1G数据

    ./dsdgen -DIR /home/zhouj/Desktop/datas -SCALE 1

第三步 生成原始文本数据,并在MariaDB上创建数据库和表

  • 创建一个数据库
sudo mysql -e "create database tpcds"
  • 在数据库下创建表

    sudo mysql -Dtpcds <tpcds.sql
  • 显示表

    sudo mysql -Dtpcds -e "show tables"

    第四步 将数据加载到MariaDB

编写脚本1.sh如下:

DIR=/home/zhouj/Desktop/datas
ls $DIR/*.dat | while read file; dopipe=$file.pipemkfifo $pipetable=`basename $file .dat | sed -e 's/_[0-9]_[0-9]//'`echo $file $tableLANG=C && sed -e 's_^|_\\N|_g' -e 's_||_|\\N|_g' -e 's_||_|\\N|_g' $file > $pipe & \mysql --local-infile -Dtpcds -e \"load data local infile '$pipe' replace into table $table character set latin1 fields terminated by '|'"rm -f $pipedone

编写脚本2.sh如下:

for i in `ls /home/zhouj/v2.7.0/query_templates/query*`;
doecho "define _END= \"\";" >> $i

编写脚本3.sh如下:

for i in `ls /home/zhouj/v2.7.0/query_templates/query*`;
do./dsqgen -template `basename $i` -directory /home/zhouj/v2.7.0/query_templates -dialect oracle -scale 5 #> /home/zhouj/v2.7.0/sql/`basename $i`mv /home/zhouj/v2.7.0/tools/query_0.sql /home/zhouj/sql/`basename $i`done
  • 授权,执行对应脚本
sudo chmod +x 1.sh
sudo chmod +x 2.sh
sudo chmod +x 3.sh
sudo ./1.sh
sudo ./2.sh
sudo ./3.sh

第五步 执行SQL语句

  • 进入MariaDB

    zhouj@ubuntu:~/v2.7.0/tools$ sudo mysql -u root -p tpcds
    

    执行命令:

MariaDB [tpcds]>  /home/zhouj/v2.7.0/tools/merge.sql

部分执行结果如下:
部分结果

参考

感谢以下大神,您的分享使我少走弯路:
[1] 蘑菇丁:https://blog.csdn.net/haoxiaoyan/article/details/60570771
[2]蘑菇丁:https://blog.csdn.net/haoxiaoyan/article/details/71515008
[3]Dongwon’s Tech Blog:http://eastcirclek.blogspot.com/

ps:如有不当之处,请指正。

这篇关于将TPC-DS数据加载到MariaDB中的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/338957

相关文章

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

pandas数据的合并concat()和merge()方式

《pandas数据的合并concat()和merge()方式》Pandas中concat沿轴合并数据框(行或列),merge基于键连接(内/外/左/右),concat用于纵向或横向拼接,merge用于... 目录concat() 轴向连接合并(1) join='outer',axis=0(2)join='o

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速