Python制作 百度贴吧小爬虫.V0.1,python.v0.1,Python制作 百度贴
Python制作 百度贴吧小爬虫.V0.1,python.v0.1,Python制作 百度贴
Python制作 百度贴吧小爬虫.V0.1,这是一个教程的代码
# coding:utf-8
import string, urllib2
def baidu_tieba(url,begin_page,end_page):
for i in range(begin_page, end_page):
sName = string.zfill(i,5) + '.html' # 自动填充成六位地 文件名
print '正在下载第' + str(i) + '个网页,并将其储存为' + sName + '.... ..'
f = open(sName,'w+')
m = urllib2.urlopen(url + str(i)).read()
f.write(m)
f.close()
# =======在这里输入参数=====
# 这是某百度贴吧的一个帖子的地址
'''
bdurl = 'http://tieba.baidu.com/p/2857700864?pn=' # ?pn=是自己加入的
iPostBegin = 1
iPostEnd = 10
'''
bdurl = str(raw_input(u'请输入贴吧地址,后面加?去掉pn=的数字:\n'))
begin_page = int(raw_input(u'请输入开始的页数:\n'))
end_page = int(raw_input(u'请输入终点的页数:\n'))
#===================================
#调用
baidu_tieba(bdurl,begin_page,end_page)
编橙之家文章,
相关内容
- 常见又实用的Python字符串操作小技巧,python字符串小技
- 按文件大小排序的python方法实现,文件大小排序python
- PycURL如何实现POST方法源码分享,pycurlpost,import pycur
- 阿拉伯数字转换成大写汉字的Python代码,阿拉伯python
- Python语言实现迅雷下载链接解析器源码,python下载链接
- python os模块获取文件夹大小的方法源代码,,用python o
- python语言求因数方法的实现源码,python因数,要想做到
- 把多图片合成GIF动图的python实现方法,,这是一个关于把
- Python实现自动生成目录树的方法示例源码,python自动生
- python随机数应用示例,python随机数示例,随机数应用的
评论关闭