python抓取网页及网页上所有连接的演示代码，python抓取,import urlli

文章由Byrx.net分享于2019-03-23 08:03:19评论（499）

python抓取网页及网页上所有连接的演示代码，python抓取,import urlli

import urllib, htmllib, formatter, re, sysurl = sys.argv[1]website = urllib.urlopen("http://"+url)data = website.read()website.close()format = formatter.AbstractFormatter(formatter.NullWriter())ptext = htmllib.HTMLParser(format)ptext.feed(data)links = []links = ptext.anchorlistfor link in links:   if re.search('http', link) != None:      print(link)      website = urllib.urlopen(link)      data = website.read()      website.close()      ptext = htmllib.HTMLParser(format)      ptext.feed(data)      morelinks = ptext.anchorlist      for alink in morelinks:         if re.search('http', alink) != None:            links.append(alink)

热门文章：

批量下载图片，图片,#!/usr/bin/e
Learn Python By Practice — string，pythonpractice,虽然
Python 封装的一个FTP功能，python封装ftp,from c
八皇后问题实现，皇后实现,效率较低import
python实现的代码行数统计代码，python代码行数
xiami music，xiami,#!/usr/bin/e

python抓取网页及网页上所有连接的演示代码，python抓取,import urlli

python抓取网页及网页上所有连接的演示代码，python抓取,import urlli

相关内容

最新python源码实例

python~HOT