一个用python写的用命令行看糗百的小工具,python,最近正在学习正则表达式,
一个用python写的用命令行看糗百的小工具,python,最近正在学习正则表达式,
最近正在学习正则表达式,抛弃了bs4,写了一个用命令行看糗百的小爬虫(爬了糗百最近7天最热门的糗事儿),还算是比较好用的,经过了精心的排版,阅读起来轻松无压力,代码开源在这里,大家相互学习。
#!/usr/bin/python#coding:utf-8import urllib2import re#定义程序主函数def qiubai(page): url = "http://www.qiushibaike.com/week/page/%d" % page re_qb = re.compile(r'detail.*?<a.*?>(.*?)<.*?title="(.*?)">\\s*(.*?)\\s*?</',re.DOTALL) html = urllib2.urlopen(url).read() my_qiubai = re_qb.findall(html) n = len(my_qiubai) for i in range(n): for k in range(3): print my_qiubai[i][k] s = raw_input("回车继续") if s == "q": exit() print "-"*40#定义程序循环体def for_qb(): for page in range(int(p),280): print "-"*18 + "第" + str(page) + "页" + "-"*18 qiubai(page)#该部分代码的目是为了设计的严谨,尽可能的使程序不发生崩溃def if_qb(): global p p = raw_input("输入要看的页数1~280:") if p == "q": exit() elif not p.isdigit() or p =="0" or int(p) > 280: if_qb() else: for_qb()print "-"*40print "糗百命令行版——Byron"print "一入糗百深似海,从此节操是路人"print '输入"q"退出程序'print "-"*40if_qb()#该片段来自于http://byrx.net
相关内容
- 简单多线程字典暴力破解web表单,暴力破解web表单,py
- Python下的一些随机化算法,Python随机化算法,# -*- codin
- 多线程批量自动备份交换机配置,多线程批量交换机
- python 多线程!,python多线程,import threa
- 如何将doc转换成html,doc转换成html,用此标题在Google上
- 迷宫成程序,迷宫程序,原本是checkio上的
- 寻找递增最长子序列,递增长子序列,找n个正整数的序
- 新鲜出炉的网页UI山寨脚本,新鲜出炉ui山寨,会下载网
- Python读取html中指定元素生成excle文件,,#coding=gbki
- 抓取豆瓣各类型电影的链接和评论,按评分排列,豆瓣
评论关闭