解决pymysql.err.DataError (1406, “Data too long for column ‘remark‘ at row 1419“)

2023-10-09 21:20

本文主要是介绍解决pymysql.err.DataError (1406, “Data too long for column ‘remark‘ at row 1419“),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 问题背景

在向数据库导入大批量数据的时候报错:

DataError: (pymysql.err.DataError) (1406, "Data too long for column 'remark' at row 1419")

相关代码:

import pandas as pd
from sqlalchemy import create_engine
from urllib.parse import quote_plus as urlquote
import pymysqluserName = "xxxx"
password = "xxxxx"
dbHost = "your ip xxx.xxx.xxx.xxx"
dbName = "your dbname"
dbPort = 3306# charset=utf8mb4为utf8的超集,兼容utf8,可存储emoji表情等非常规数据
conn = f'mysql+pymysql://{userName}:{urlquote(password)}@{dbHost}:{dbPort}/{dbName}?charset=utf8mb4'
engine = create_engine(conn,max_overflow=50,  # 超过连接池大小外最多创建的连接pool_size=50,  # 连接池大小pool_timeout=5,  # 池中没有线程最多等待的时间,否则报错pool_recycle=-1,  # 多久之后对线程池中的线程进行一次连接的回收(重置)encoding='utf-8',echo=False
)pd.io.sql.to_sql(data_df, name="db_table1", con=engine, if_exists="append", index=False)
engine.dispose()

2. 分析

百度上有很多解决办法,但是都不适合自己的问题情况。

  • 有的办法是让修改MySQL数据库的严格模式,就是修改sql_mode参数 STRICT_TRANS_TABLES,但我认为不合适,尤其是在线上生产数据库,严格模式可以确保数据的基本规范性,把严格模式去掉后的数据库不就是垃圾场了么,什么数据都能往里面塞;如果是数据库是自己测试的,那就无所谓了。
  • 还有的办法是让修改字符集,但巧了,我的数据库字符集是这样的,没得改。
    charset
    所以,还得自己来。

2.1 看数据

看报错,第1419行数据的 ‘remark’ 字段太长,先看看数据是什么样子吧。

data_df['remark'][1410:1420]

datadf
搞笑,报错明显跟实际数据不一致。莫名其妙。
会不会和写入时候的数据量有关系,这次写入的数据有41298条。
volume
会不会是单次写入的数据量超过 sqlalchemy 的限制,只是猜想,也没功夫去细究sqlalchemy的源码了,先把数据拆分再写入试试。

2.2 数据拆分写入

部分代码:
code
结果还是报错了,现象和上次一样。明明报错行的字段数据为空,实在不行还有最后一招:我知道数据本来的样子,既然数据没错,那我就把报错那行的字段值截了。

ddd = data.get("remark", "---")
itm["remark"] = ddd[:255] if len(ddd) > 255 else ddd

好了,搞定收工!

2.3 写在最后

我的解决方法只是提供个参考,看到这篇博客的朋友如果有新的发现可以留言,不要照搬我的思路哦,毕竟我是在知道真实数据的情况下做出的操作。

这篇关于解决pymysql.err.DataError (1406, “Data too long for column ‘remark‘ at row 1419“)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/175656

相关文章

Spring三级缓存解决循环依赖的解析过程

《Spring三级缓存解决循环依赖的解析过程》:本文主要介绍Spring三级缓存解决循环依赖的解析过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、循环依赖场景二、三级缓存定义三、解决流程(以ServiceA和ServiceB为例)四、关键机制详解五、设计约

解决tomcat启动时报Junit相关错误java.lang.ClassNotFoundException: org.junit.Test问题

《解决tomcat启动时报Junit相关错误java.lang.ClassNotFoundException:org.junit.Test问题》:本文主要介绍解决tomcat启动时报Junit相... 目录tomcat启动时报Junit相关错误Java.lang.ClassNotFoundException

解决Maven项目报错:failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.13.0的问题

《解决Maven项目报错:failedtoexecutegoalorg.apache.maven.plugins:maven-compiler-plugin:3.13.0的问题》这篇文章主要介... 目录Maven项目报错:failed to execute goal org.apache.maven.pl

Android 12解决push framework.jar无法开机的方法小结

《Android12解决pushframework.jar无法开机的方法小结》:本文主要介绍在Android12中解决pushframework.jar无法开机的方法,包括编译指令、框架层和s... 目录1. android 编译指令1.1 framework层的编译指令1.2 替换framework.ja

SQLyog中DELIMITER执行存储过程时出现前置缩进问题的解决方法

《SQLyog中DELIMITER执行存储过程时出现前置缩进问题的解决方法》在SQLyog中执行存储过程时出现的前置缩进问题,实际上反映了SQLyog对SQL语句解析的一个特殊行为,本文给大家介绍了详... 目录问题根源正确写法示例永久解决方案为什么命令行不受影响?最佳实践建议问题根源SQLyog的语句分

Java NoClassDefFoundError运行时错误分析解决

《JavaNoClassDefFoundError运行时错误分析解决》在Java开发中,NoClassDefFoundError是一种常见的运行时错误,它通常表明Java虚拟机在尝试加载一个类时未能... 目录前言一、问题分析二、报错原因三、解决思路检查类路径配置检查依赖库检查类文件调试类加载器问题四、常见

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav

MyBatis模糊查询报错:ParserException: not supported.pos 问题解决

《MyBatis模糊查询报错:ParserException:notsupported.pos问题解决》本文主要介绍了MyBatis模糊查询报错:ParserException:notsuppo... 目录问题描述问题根源错误SQL解析逻辑深层原因分析三种解决方案方案一:使用CONCAT函数(推荐)方案二:

IntelliJ IDEA 中配置 Spring MVC 环境的详细步骤及问题解决

《IntelliJIDEA中配置SpringMVC环境的详细步骤及问题解决》:本文主要介绍IntelliJIDEA中配置SpringMVC环境的详细步骤及问题解决,本文分步骤结合实例给大... 目录步骤 1:创建 Maven Web 项目步骤 2:添加 Spring MVC 依赖1、保存后执行2、将新的依赖

Spring 中的循环引用问题解决方法

《Spring中的循环引用问题解决方法》:本文主要介绍Spring中的循环引用问题解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录什么是循环引用?循环依赖三级缓存解决循环依赖二级缓存三级缓存本章来聊聊Spring 中的循环引用问题该如何解决。这里聊