Python 捉虫unicode及utf-8转中文问题求解，pythonunicode,我爬的网页源码顶端写的是

文章由Byrx.net分享于2019-03-23 08:03:56评论（99）

Python 捉虫unicode及utf-8转中文问题求解，pythonunicode,我爬的网页源码顶端写的是

我爬的网页源码顶端写的是 <meta charset="utf-8">
我在浏览器打开源码看到我想要的信息也是中文，
不过在urllib2.urlopen(url).read()输出来的却是类似于
陈颖
这种unicode编码
然后我使用 .encode('utf-8')也没有效果。。
请问该怎么转成中文？
（我的python程序是coding:utf-8）

&#开头都是HTTP转义的，可以用HTTPParser解码啊
import HTMLParser h = HTMLParser.HTMLParser() print h.unescape("陈颖").encode("utf-8") 陈颖
那可以试试这样：
>>> h = HTMLParser.HTMLParser()>>> import HTMLParser>>> h = HTMLParser.HTMLParser()>>> print h.unescape('陈颖')陈颖

编橙之家文章，

热门文章：

求助关于python装饰器返回值语法问题，pytho
Python数据库语句查询生成与占位符使用技巧的
Java程序调用python脚本，脚本日志如何输入到
Python正则表达生成器问题，python表达生成器
Jinja2可以把None值显示为空字符串吗?，jinja2
Python 修改裁剪图片尺寸形状用什么方法，,如

Python 捉虫unicode及utf-8转中文问题求解，pythonunicode,我爬的网页源码顶端写的是

Python 捉虫unicode及utf-8转中文问题求解，pythonunicode,我爬的网页源码顶端写的是

相关内容

最新python问答

python~HOT