本文主要是介绍pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
csv文件原本以utf-8编码形式保存,但是中间我用wps打开编辑了,然后再用pandas读取发现报错:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 59: invalid start byte
之后我 设置 read_csv() encoding='gbk',发现又报错了:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 51329: invalid start byte
之后我尝试了设置 encoding='utf-8-sig' encoding = ‘gb2312’ encoding='gb18030' encoding="ISO-8859-1" 等等,发现还是报错UnicodeDecodeError
我又在文件顶部声明:
# -*-coding:utf-8-*-
声明文件为utf-8编码格式,还是不行,最后用vscode打开该csv文件从新以utf-8编码保存,Bug解决。这个Bug是由于多个软件(我用了wps)先后编辑导致编码混乱,重新用编辑器(vscode、pycharm等等)以uft8或者gbk编码从新保存就行了。
这篇关于pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!