一个用python写的用命令行看糗百的小工具,python,最近正在学习正则表达式,


最近正在学习正则表达式,抛弃了bs4,写了一个用命令行看糗百的小爬虫(爬了糗百最近7天最热门的糗事儿),还算是比较好用的,经过了精心的排版,阅读起来轻松无压力,代码开源在这里,大家相互学习。

#!/usr/bin/python#coding:utf-8import urllib2import re#定义程序主函数def qiubai(page):    url = "http://www.qiushibaike.com/week/page/%d" % page    re_qb = re.compile(r'detail.*?<a.*?>(.*?)<.*?title="(.*?)">\\s*(.*?)\\s*?</',re.DOTALL)    html = urllib2.urlopen(url).read()    my_qiubai = re_qb.findall(html)    n = len(my_qiubai)    for i in range(n):        for k in range(3):            print my_qiubai[i][k]        s = raw_input("回车继续")        if s == "q":            exit()        print "-"*40#定义程序循环体def for_qb():    for page in range(int(p),280):        print "-"*18 + "第" + str(page) + "页" + "-"*18        qiubai(page)#该部分代码的目是为了设计的严谨,尽可能的使程序不发生崩溃def if_qb():    global p    p = raw_input("输入要看的页数1~280:")    if p == "q":        exit()    elif not p.isdigit() or p =="0" or int(p) > 280:        if_qb()    else:        for_qb()print "-"*40print "糗百命令行版——Byron"print "一入糗百深似海,从此节操是路人"print '输入"q"退出程序'print "-"*40if_qb()#该片段来自于http://byrx.net

评论关闭