python BeautifulSoup设置页面编码的方法,pythonsoup
python BeautifulSoup设置页面编码的方法,pythonsoup
在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。
复制代码 代码如下:
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://www.163.com');
soup = BeautifulSoup(page,from_encoding="gb2312")
print soup.originalEncoding
print soup.prettify()
红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么
相关内容
- 对于Python中线程问题的简单讲解,python线程讲解
- 详解Python2.x中对Unicode编码的使用,python2.xunicode
- 举例讲解Python中is和id的用法,pythonisid用法
- 用Python编写一个简单的Lisp解释器的教程,pythonlisp解释
- Python中设置变量作为默认值时容易遇到的错误,python默
- Python新手在作用域方面经常容易碰到的问题,python新手
- 给Python初学者的一些编程技巧,python编程技巧
- 《Python之禅》中对于Python编程过程中的一些建议,pyt
- 对于Python的Django框架使用的一些实用建议,pythondjango
- 几个提升Python运行效率的方法之间的对比,python效率
评论关闭