Python抓取分享页面的源代码示例,python抓取,本文章是关于利用Pyth


本文章是关于利用Python方法来抓取某网站分享页面中的源码方法示例。需要大家注意的是Python抓取分享页面的源代码示例,是要在运行时导入BeautifulSoup.py文件后才可以使用。

Python抓取分享页面的源代码示例,需要用到python urllib2模块方法,及BeautifulSoup模块。

源码如下:

#coding:utf-8import urllib2from BeautifulSoup import BeautifulSoup'''www.iplaypy.com'''#definedef readPage(Url):    page = urllib2.urlopen(Url).read()    pageContent = BeautifulSoup(page)    OSC_Content = pageContent.find("div",{'id':'OSC_Content'})    preHandleCode = OSC_Content.find('pre').next    print preHandleCode    '''页面的url需指定'''  #call  readPage('http://www.xxxxxx.net/code/snippet_580365_11857')

这里的目标网站已经隐藏,大家可针对自己要抓取的目标站,参考本python源码适当修改。

编橙之家文章,

评论关闭