页面url的可连接性，页面url连接性,import reimp

文章由Byrx.net分享于2019-03-23 08:03:10评论（70）

页面url的可连接性，页面url连接性,import reimp

import reimport urllibimport urllib2from bs4 import BeautifulSoupprint 'nihao'url = "http://zhiqq.com"s = urllib2.urlopen('http://zhiqq.com')s = s.read()htm = unicode(s,'gb2312','ignore').encode('utf-8','ignore')soup = BeautifulSoup(htm)sou = soup.prettify()f = open('C:/sou.txt','w')f.write(sou)n = 0for link in soup.find_all('a'):    print link.get('href')    print n    n = n+1    try:        urllib2.urlopen(link.get('href')).getcode()    except:        print "*******connect failed"        continue#该片段来自于http://byrx.net

热门文章：

Python 冒泡排序，python冒泡排序,num = [23,2,
Python hashlib模块，pythonhashlib模块,hashlib是个专
Python 动态规划算法,计算单词距离，python算法
scrapy 在不同的抓取级别的Request之间传递参数
python通过xlrd模块读写Excel文件，pythonxlrd,一、
python标准算法实现数组全排列代码，python标准

页面url的可连接性，页面url连接性,import reimp

页面url的可连接性，页面url连接性,import reimp

相关内容

最新python源码实例

python~HOT