Python字符编码不能完全转换想问下为什么,python字符编码转换,是这样的,文件从mac端
Python字符编码不能完全转换想问下为什么,python字符编码转换,是这样的,文件从mac端
是这样的,文件从mac端传到windows端会导致文件名(中文)乱码。于是我想写个python脚本来改下文件名的编码,代码如下:
pythondef convert_gbk_to_utf8(): for file in os.listdir(ROOT_PATH): new_file = file.encode("gbk", "ignore").decode("utf-8", "ignore") os.renames(os.path.join(ROOT_PATH, file), os.path.join(ROOT_PATH, new_file))
结果差强人意,有部分文件名转化的不完整。想问下为什么?
乱码的文件名
鏁堟灉鍥_K11.1_璐圭敤鏄庣粏_鏈彁浜よ璐_.png鏁堟灉鍥_K11.2_璐圭敤鏄庣粏_濉啓璺ˉ璐_png
调用os.listdir()打印出来的文件名
def convert_gbk_to_utf8():
for file in os.listdir(ROOT_PATH):
new_file = file.encode("gbk", "ignore").decode("utf-8", "ignore")
os.renames(os.path.join(ROOT_PATH, file), os.path.join(ROOT_PATH, new_file))
看题意,楼主应该是想让编码方式从gbk 转为utf8 在Python中 如果想从一种编码方式转向另一种编码方式 是以unicode 作为中间码的 将某种编码方式转为unicode码 用的是decode而不是encode。encode 是将unicode码转为一种具体的编码方式 所以楼主上述代码中 new_file = file.encode("gbk", "ignore").decode("utf-8", "ignore") 这一句变为 new_file = file.decode("gbk", "ignore").encode("utf-8", "ignore")应该就行了
原文件名不是 gbk 编码的吧?试试 gb18030。
参考:Chinese in Mac OS X 10.7 Lion
似乎有奇怪的字符混进来了:
>>> xsel | iconv -t gb18030效果K11.1_费用明细_未提交计.png效果K11.2_费用明细_填写路桥png
看上去没问题,但是在 Vim 中查看时发现:
不要使用 errors='ignore',除非你很明确地知道并且想要这么做。
编橙之家文章,
相关内容
- Python排序选择排序、插入排序和希尔排序不是很理解,
- Python模块循环引用规范是怎么样的,python模块引用规范
- Sublime Text 2运行python报WindowsError错误原因是什么,pyth
- 问python文本内除空格方法,问python文本空格,比如:I[空
- Python判断用户IP安全合法性的方法是?,pythonip,如题,
- Discuz scrapy模拟登录Python源码如何写,scrapypython,向 Dis
- Python爬取百度指数数据思路,python爬指数思路,百度指数
- Python程序Sublime Text 3快捷键定义问题,pythonsublime,因为之
- 关于在android平台使用Python代码的小问题,androidpython,
- Python2版本列表推导二维数组问题求助,python2二维数组
评论关闭