用python pyquery采集淘宝遇到的编码问题,pythonpyquery,代码在这里:http:/


代码在这里:http://pastebin.com/mdizARWA 现在的问题是:插入数据库的全是乱码 采集到的数据是gbk的,插入数据库的时候要转成utf8的,试过decode encode各种模式,都无法解决乱码的问题,文件的编码是utf-8 无bom的。

问题已经解决: 用requests抓取到网页内容,会自动分析编码,再交给pyquery处理

编橙之家文章,

评论关闭