解析oracle的DDL语句生成高斯内表及表字段主键配置

2024-04-11 01:44

本文主要是介绍解析oracle的DDL语句生成高斯内表及表字段主键配置,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

oracle的DDL语句如下:

CREATE TABLE TPPROD.CONFIG (NO VARCHAR2(50),CONFIGCODE VARCHAR2(400),CONFIGVALUE VARCHAR2(400),CONSTRAINT PK_GUENDORASSISTCONFIG PRIMARY KEY (NO,CONFIGCODE)
);
CREATE UNIQUE INDEX PK_GUENDORASSISTCONFIG ON TPPROD.GUENDORASSISTCONFIG (NO,CONFIGCODE);

解析oracle表生成高斯内表入口:Oracle2GaussCreateMana.scala

package com.tpiods.sqoop.oracle2gaussimport java.io.{File, FileInputStream, PrintWriter}
/*** 输入: oracle建表语句* 输出: gauss内表建表语句*/
object Oracle2GaussCreateMana {def main(args: Array[String]): Unit = {// 指定输入sql语句的文件val input = "ods_etl/src/main/resources/work0409_test/test_tab.sql"val lines = scala.io.Source.fromInputStream(new FileInputStream(input)).getLines()val str = readSql(lines)val str1 = replaceSql(str)val str2 = addTeacCols3(str1)// 指定输出sql语句的文件val output1 = "ods_etl/src/main/resources/work0409_test/test_tab_mana.sql"val writer = new PrintWriter(new File(output1))writer.write(str2)writer.close()}/*** 处理建表语句的转换逻辑* @param lines* @return*/def readSql(lines: Iterator[String]): String = {val sb = new StringBuildervar colCnt = 0var pkCols: String = ""for (line <- lines if line != null) {if (line.startsWith("CREATE TABLE") || line.startsWith("  CREATE TABLE") || line.startsWith("  CREATE TABLE")) {colCnt = colCnt + 1val tabName = line.split("\\.")(1).replaceAll(" ", "").replaceAll("\\(", "")if (sb.length >= 1) {sb.append(s"""|set search_path = ods;|drop table if exists ${tabName};|create table if not exists ${tabName} (\t\n""".stripMargin)} else {sb.append(s"""|set search_path = ods;|drop table if exists ${tabName};|create table if not exists ${tabName} (\t\n""".stripMargin)}}if (line.startsWith("\t\"")  || line.startsWith("\t")) {val split = line.split("\\s+")if (!("CONSTRAINT" == split(1)) && split.length >= 3) {if (colCnt == 1) {sb.append(" ").append(split(1)).append("\t").append(split(2)).append("\n")} else {sb.append(",").append(split(1)).append("\t").append(split(2)).append("\n")}}colCnt = 0}if (line.startsWith("   (") || line.startsWith(" (    ")) {val split = line.split("\\s+")sb.append(split(2)).append("\t").append(split(3)).append("\n")}if (line.indexOf("PRIMARY KEY ")> 0) {pkCols = line.split("PRIMARY KEY ")(1)}if (line.startsWith(");") || line.endsWith("MOVEMENT  |") || line.startsWith("   )")) {
//        sb.append(
//          s""") WITH (orientation=column, compression=low)
//            |DISTRIBUTE BY HASH${pkCols}
//            |;
//            |""".stripMargin)// 不按主键做hash,则打开下面这段代码sb.append(s""");|""".stripMargin)}}sb.toString()}/*** oracle数据类型替换成gauss对应的数据类型* @param str* @return*/def replaceSql(str: String): String = {str.toLowerCase().replaceAll("\"", "").replaceAll("number\\(\\*+,\\d*\\)", "number").replaceAll(",\n", "\n").replaceAll("\\b" + "nchar" + "\\b", "char").replaceAll("\\b" + "varchar2|nvarchar2" + "\\b", "varchar").replaceAll("\\b" + "long" + "\\b", "text")}/**** @param lines2 读入字段类型替换后的sql* @return 业务字段之后增加技术字段*/def addTeacCols(lines2: String): String = {lines2.replaceAll("\\) with",""",oper	varchar|,mtime	numeric(38,5)|,source_sys	varchar|,etl_time	varchar|,etl_date	varchar|)|with""".stripMargin)}/***不按主键做hash,调用该方法* @param lines2 读入字段类型替换后的sql* @return 业务字段之后增加技术字段*/def addTeacCols2(lines2: String): String = {lines2.replaceAll("\\);",""",oper	varchar|,mtime	numeric(38,5)|,source_sys	varchar|,etl_time	varchar|,etl_date	varchar|);|""".stripMargin)}/*** 按主键做hash* @param lines2 读入字段类型替换后的sql* @return 业务字段之前增加技术字段*/def addTeacCols3(lines2: String): String = {lines2.replaceAll("\t\n","""| tabname varchar|,oper	varchar|,mtime	numeric(38,5)|,source_sys	varchar|,etl_time	varchar|,etl_date	varchar|,""".stripMargin)}/*** 不按主键做hash,调用这个方法* @param lines2 读入字段类型替换后的sql* @return 业务字段之前增加技术字段*/def addTeacCols4(lines2: String): String = {lines2.replaceAll("\t\n","""| tabname varchar|,oper	varchar|,mtime	numeric(38,5)|,source_sys	varchar|,etl_time	varchar|,etl_date	varchar|,""".stripMargin)}
}

运行以上代码,输出如下:

set search_path = ods;
drop table if exists config;
create table if not exists config (tabname varchar
,oper	varchar
,mtime	numeric(38,5)
,source_sys	varchar
,etl_time	varchar
,etl_date	varchar
, no	varchar(50)
,configcode	varchar(400)
,configvalue	varchar(400)
);

解析oracle表生成表名字段主键配置入口:OracleGeneTabColsPk.scala

package com.tpiods.sqoop.oracle2gaussimport java.io.{File, FileInputStream, PrintWriter}
/*** 输入: oracle源系统建表语句* 输出: 表名|列名...|主键*/
object OracleGeneTabColsPk {def main(args: Array[String]): Unit = {// 指定输入sql语句的文件val input = "ods_etl/src/main/resources/work0409_test/test_tab.sql"val lines = scala.io.Source.fromInputStream(new FileInputStream(input)).getLines()val str = readSql(lines)// 指定输出sql语句的文件val output = "ods_etl/src/main/resources/work0409_test/test_tab_tabcolspk.txt"val writer = new PrintWriter(new File(output))writer.write(str)writer.close()}def readSql(lines: Iterator[String]): String = {val sb = new StringBuildervar tableName: String = nullfor (tempString <- lines if tempString != null) {if (tempString.startsWith("CREATE TABLE") || tempString.startsWith("  CREATE TABLE")) {tableName = tempString.split("\\.")(1).replaceAll(" ", "")sb.append("\n").append(tableName).append("|")} else if (tempString.indexOf("PRIMARY KEY") >= 0) {val pkName = tempString.split("\\(")(1).replaceAll(" ", "").replaceAll("\\)", "")sb.append("|").append(pkName)}else if (tempString.startsWith("   (") || tempString.startsWith(" (    ")) {val split = tempString.split("\\s+")sb.append(split(2)).append(",")}else if (tempString.startsWith("\t\"") || tempString.startsWith("\t")) {val split = tempString.split("\\s+")if (!("CONSTRAINT" == split(1)) && split.length >= 3) {sb.append(split(1)).append(",")}}}val sb2 = sb.toString().toLowerCase().replaceAll("\"", "").replaceAll(",\n", "\n").replaceAll(",\\|", "\\|").replaceAll("\\(\\|", "\\|")if (sb2.endsWith(",")) {sb2.substring(0, sb2.length() - 1)} else {sb2}}}

运行以上代码,输出如下:

config|no,configcode,configvalue|no,configcode

这篇关于解析oracle的DDL语句生成高斯内表及表字段主键配置的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/892748

相关文章

gitlab安装及邮箱配置和常用使用方式

《gitlab安装及邮箱配置和常用使用方式》:本文主要介绍gitlab安装及邮箱配置和常用使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装GitLab2.配置GitLab邮件服务3.GitLab的账号注册邮箱验证及其分组4.gitlab分支和标签的

MySQL MCP 服务器安装配置最佳实践

《MySQLMCP服务器安装配置最佳实践》本文介绍MySQLMCP服务器的安装配置方法,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录mysql MCP 服务器安装配置指南简介功能特点安装方法数据库配置使用MCP Inspector进行调试开发指

python常见环境管理工具超全解析

《python常见环境管理工具超全解析》在Python开发中,管理多个项目及其依赖项通常是一个挑战,下面:本文主要介绍python常见环境管理工具的相关资料,文中通过代码介绍的非常详细,需要的朋友... 目录1. conda2. pip3. uvuv 工具自动创建和管理环境的特点4. setup.py5.

全面解析HTML5中Checkbox标签

《全面解析HTML5中Checkbox标签》Checkbox是HTML5中非常重要的表单元素之一,通过合理使用其属性和样式自定义方法,可以为用户提供丰富多样的交互体验,这篇文章给大家介绍HTML5中C... 在html5中,Checkbox(复选框)是一种常用的表单元素,允许用户在一组选项中选择多个项目。本

Redis Cluster模式配置

《RedisCluster模式配置》:本文主要介绍RedisCluster模式配置,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录分片 一、分片的本质与核心价值二、分片实现方案对比 ‌三、分片算法详解1. ‌范围分片(顺序分片)‌2. ‌哈希分片3. ‌虚

SpringBoot项目配置logback-spring.xml屏蔽特定路径的日志

《SpringBoot项目配置logback-spring.xml屏蔽特定路径的日志》在SpringBoot项目中,使用logback-spring.xml配置屏蔽特定路径的日志有两种常用方式,文中的... 目录方案一:基础配置(直接关闭目标路径日志)方案二:结合 Spring Profile 按环境屏蔽关

Python包管理工具核心指令uvx举例详细解析

《Python包管理工具核心指令uvx举例详细解析》:本文主要介绍Python包管理工具核心指令uvx的相关资料,uvx是uv工具链中用于临时运行Python命令行工具的高效执行器,依托Rust实... 目录一、uvx 的定位与核心功能二、uvx 的典型应用场景三、uvx 与传统工具对比四、uvx 的技术实

Maven 配置中的 <mirror>绕过 HTTP 阻断机制的方法

《Maven配置中的<mirror>绕过HTTP阻断机制的方法》:本文主要介绍Maven配置中的<mirror>绕过HTTP阻断机制的方法,本文给大家分享问题原因及解决方案,感兴趣的朋友一... 目录一、问题场景:升级 Maven 后构建失败二、解决方案:通过 <mirror> 配置覆盖默认行为1. 配置示

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

《SpringBoot排查和解决JSON解析错误(400BadRequest)的方法》在开发SpringBootRESTfulAPI时,客户端与服务端的数据交互通常使用JSON格式,然而,JSON... 目录问题背景1. 问题描述2. 错误分析解决方案1. 手动重新输入jsON2. 使用工具清理JSON3.

Springboot3+将ID转为JSON字符串的详细配置方案

《Springboot3+将ID转为JSON字符串的详细配置方案》:本文主要介绍纯后端实现Long/BigIntegerID转为JSON字符串的详细配置方案,s基于SpringBoot3+和Spr... 目录1. 添加依赖2. 全局 Jackson 配置3. 精准控制(可选)4. OpenAPI (Spri