百度贴吧小爬虫.v0.1,百度贴吧爬虫.v0.1,Python语言: 百度


Python语言: 百度贴吧小爬虫.v0.1#coding:utf-8#---------------------------------------# 百度贴吧小爬虫 # 编程语言 : Python 2.5#---------------------------------------# 简介 : 偶尔看百度贴吧,想保存下来慢慢看,于是有了这个小软件#        输入带分页的地址,去掉最后面的数字,设置一下起、末贴数即可下载。#---------------------------------------import string, urllib#定义 bd(百度)函数def bd(url,PostBegin,PostEnd):        for i in range(PostBegin, PostEnd ,50):        sName = string.zfill(i,6) + '.html'        print 'working..... ' + sName        f = open( string.zfill(sName,6),'w+')        m = urllib.urlopen(url + str(i)).read()        f.write(m)        f.close()#-------- 在这里输入参数  ------------------# 这个是《青囊尸衣》百度贴吧的地址。bdurl = '<a href="http://tieba.baidu.com/f?z=360426363&ct=335544320&lm=0&sc=0&rn=50&tn=baiduPostBrowser&word=%C7%E0%C4%D2%CA%AC%D2%C2&pn=">http://tieba.baidu.com/f?z=360426363&ct=335544320&lm=0&sc=0&rn=50&tn=baiduPostBrowser&word=%C7%E0%C4%D2%CA%AC%D2%C2&pn='iPostBegin = 1150iPostEnd = 1200#-------- 在这里输入参数  ------------------#调用bd(bdurl,iPostBegin,iPostEnd)#该片段来自于http://byrx.net

评论关闭