sqlserver 数据迁移之bcp

2023-10-31 15:04

本文主要是介绍sqlserver 数据迁移之bcp,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

BCP(Bulk Copy Program)是 SQL Server 中用于大量数据导入和导出的工具。在进行数据迁移时,我们可以使用 BCP 来提高数据迁移的效率和性能。以下是一些优化 BCP 的常见方法:

1.使用合适的数据类型:

在导出和导入数据时,确保使用正确的数据类型。使用较小的数据类型可以减少数据传输的大小,从而提高迁移速度。

2.指定合适的字符集:

在导出和导入数据时,指定适当的字符集可以避免字符转换和编码问题。使用正确的字符集可以提高数据迁移的准确性和效率。

3.分批处理数据:

如果数据量较大,可以将数据分成多个批次进行迁移。这样可以减少一次性加载的数据量,降低内存消耗,并提高迁移速度。

使用并行迁移:

4.BCP 支持并行迁移,可以同时将数据导入到多个目标表中。通过设置合适的并行度,可以提高数据迁移的速度

调整缓冲区大小:

5.BCP 使用缓冲区来存储要导入或导出的数据。适当调整缓冲区的大小可以提高数据迁移的效率。较大的缓冲区可以减少磁盘 I/O 操作的次数,从而提高迁移速度。

6.禁用错误检查:

在导入和导出数据时,可以禁用错误检查以提高迁移速度。但是请注意,禁用错误检查可能会导致数据完整性问题,因此请谨慎使用。

7.使用压缩选项:

BCP 支持压缩选项,可以在导入和导出数据时压缩数据。压缩可以减少数据传输的大小,从而提高迁移速度。

8.监控和优化性能:

在进行数据迁移时,可以使用性能监视工具来监控 BCP 的性能指标,如传输速度、内存使用等。根据监控结果,可以进一步优化 BCP 的配置和参数,以提高迁移性能。

下面提供操作示例

方法一:cmd-bcp语句

1、 win+r运行cmd
2、导出数据 
格式:bcp “sql语句” queryout “文件路径” -c -E -k -S IP地址 -U “用户名” -P “密码”
语句:
bcp "select 查询的字段名 from 表名 where  条件" queryout "D:\文件保存路径.txt" -c -E -k -S 数据库地址 -U "用户名" -P "密码"
​

执行成功:

这里的速度还是挺快的,一秒能从亿级数据中迁移十二万左右

3、导入数据
格式:bcp 模式名.表名 in “文件路径” -c -E -k -S IP地址 -d 数据库名 -U “用户名” -P “密码”
语句示例:
bcp 导入的表名 in "D:\存储的路径.txt" -c -E -k -S 数据库地址 -d 数据库名 -U "用户名" -P "密码"4、迁移思路迁移老表数据drop原表新表改名成老表名

方法二:C#调用cmd

优点:可以改成定时任务定期执行,执行比较方便,日志可自定义,比较详细

#region 使用bcp迁移数据/// <summary>/// bcp迁移数据/// </summary>public void BcpDataMigration(string qid){try{string allrowsql = "select count(*) from 表名";DataTable allrowdata = DBHelper.QueryToDataTable(allrowsql);int allrow = Convert.ToInt32(allrowdata.Rows[0][0]);
​//导出表数据string exprotanswersql = "bcp \" select 字段名 from 表名 where  条件 \" queryout \"D:\\存储路径.txt\" -c -E -k -S 数据库地址 -U \"用户名\" -P \"密码\"";cmdrun(exprotanswersql);//将数据导入新表string importanswersql = "bcp 表名 in \"D:\\存储路径.txt\" -c -E -k -S 数据库地址 -d 数据库名 -U \"用户名\" -P \"密码\"";cmdrun(importanswersql);//这里采用分页的方式删除数据,每次删一千万,使用set rowcount不记录日志int deleterow = 10000000;var delcount = Math.Ceiling(Convert.ToDecimal(Convert.ToDecimal(allrow) / deleterow));for (int i = 0; i < delcount; i++){string upsql = "set rowcount " + deleterow + " delete  from 表名 where  条件";Logger.Info("【数据迁移】:删除语句:" + upsql + "");DBHelper.NoQuery(upsql);Logger.Info("【数据迁移】:其他日志信息");} }catch (Exception){
​throw;}
​}
​
​public void cmdrun(string cmd) {
​//string str = Console.ReadLine();
​System.Diagnostics.Process p = new System.Diagnostics.Process();p.StartInfo.FileName = "cmd.exe";p.StartInfo.UseShellExecute = false;    //是否使用操作系统shell启动p.StartInfo.RedirectStandardInput = true;//接受来自调用程序的输入信息p.StartInfo.RedirectStandardOutput = true;//由调用程序获取输出信息p.StartInfo.RedirectStandardError = true;//重定向标准错误输出p.StartInfo.CreateNoWindow = true;//不显示程序窗口p.Start();//启动程序
​//向cmd窗口发送输入信息p.StandardInput.WriteLine(cmd + "&exit");
​p.StandardInput.AutoFlush = true;//p.StandardInput.WriteLine("exit");//向标准输入写入要执行的命令。这里使用&是批处理命令的符号,表示前面一个命令不管是否执行成功都执行后面(exit)命令,如果不执行exit命令,后面调用ReadToEnd()方法会假死//同类的符号还有&&和||前者表示必须前一个命令执行成功才会执行后面的命令,后者表示必须前一个命令执行失败才会执行后面的命令//获取cmd窗口的输出信息string output = p.StandardOutput.ReadToEnd();p.WaitForExit();//等待程序执行完退出进程p.Close(); Console.WriteLine(output);}#endregion

这篇关于sqlserver 数据迁移之bcp的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/316200

相关文章

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

pandas数据的合并concat()和merge()方式

《pandas数据的合并concat()和merge()方式》Pandas中concat沿轴合并数据框(行或列),merge基于键连接(内/外/左/右),concat用于纵向或横向拼接,merge用于... 目录concat() 轴向连接合并(1) join='outer',axis=0(2)join='o

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一