python 读取中文CSV 'gbk' codec can't decode bytes in position 2-3:illegal multibyte sequence,,读取中文的文档如Ex
python 读取中文CSV 'gbk' codec can't decode bytes in position 2-3:illegal multibyte sequence,,读取中文的文档如Ex
读取中文的文档如Excel,CSV文件,需要中文编码 如gbk 解码才能转Unicode;然而 数据混合类型,读CSV文件就会出错,经管Excel正常。
UnicodeDecodeError :‘gbk‘ codec can‘t decode bytes in position 2-3:illegal multibyte sequence
意思是:将一个字符串,通过gbk的方式,去解码,想要获得Unicode字符串,结果出错了
解决方法:处理的字符的确是gb2312,但是其中夹杂的部分特殊字符,是gb2312编码中所没有的。
如果有些特殊字符是GB18030中有的,但是是gb2312中没有的,则用gb2312去解码,也比较会出错。 所以,此种情况,可以尝试用和当前编码(gb2312)兼容的但所包含字符更多的编码(gb18030)去解码,或许就可以了。
GB2312,GBK,GB18030,是兼容的,包含的字符个数:GB2312 < GBK < GB18030
来自 <http://blog.csdn.net/junkichan/article/details/51913845>
python 读取中文CSV 'gbk' codec can't decode bytes in position 2-3:illegal multibyte sequence
相关内容
- python3.6执行pip3时 Unable to create process using '&q
- python tkinter学习——布局,pythontkinter布局,目录一、pa
- Python基本知识 os.path.join与split() 函数,pythonos.path.join
- python3 中 and 和 or 运算规律,python3or,一、包含一个逻辑
- python random 的用法,pythonrandom用法,python ran
- 玩了下opencv的aruco(python版),opencvaruco,简单的玩了下
- python学习之遇到得基础报错,python学习基础报,error01:
- python 环境下 安装 gdal,pythongdal,起因:需要做一个城市
- Python 002- 爬虫爬取淘宝上耳机的信息,python002-,参照:
- “本办法学python” ex49,本办法学pythonex49,1.创建目录结
评论关闭