Python抓取百度查询结果,python抓取查询结果,抓取百度查询结果#win
Python抓取百度查询结果,python抓取查询结果,抓取百度查询结果#win
抓取百度查询结果
#win python 2.7.ximport re,sys,urllib,codecsxh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)match = rc.finditer(xh)rcr = re.compile(r'<[^>]+>',re.I)f = codecs.open("xiaohei.txt", "w", "utf-8")for i in rc.finditer(xh): ss = i.group(0) s1 = rcr.sub('',ss) print (s1) f.write(s1)f.close()
相关内容
- imghdr确定图片类型,,[Python]代码im
- python访问hbase数据,python访问hbase,python访问hbas
- Python Windows 桌面备份,python备份,[Python]代码#
- 显示zip里面的文件列表,显示zip文件列表,[Python]代码
- 获取今天日期的指定格式,获取日期指定格式,[Python]代
- python刷新Squid和TrafficServer脚本,squidtrafficserver,cacheref
- python smtp 邮件发送,pythonsmtp,[Python]代码#c
- window下调用api列出当前所有进程,windowapi列出当前,[P
- python arp欺骗伪造网关代码,pythonarp伪造网关,#coding:ut
- 一个简单的MySQLdb封装类(3.2),mysqldb封装类3.2,[Python]代码
评论关闭