使用Python爬取腾讯房产的新闻，用的Python库：requests 、re、time、BeautifulSoup ????，,import req

文章由Byrx.net分享于2021-05-16 03:05:50评论（174）

使用Python爬取腾讯房产的新闻，用的Python库：requests 、re、time、BeautifulSoup ????，,import req

import requestsimport reimport timefrom bs4 import BeautifulSouptoday = time.strftime(‘%Y-%m-%d‘,time.localtime(time.time()))one_url = ‘http://hz.house.qq.com‘    #用来构建新的URL的链接url = ‘http://hz.house.qq.com/zxlist/bdxw.htm‘      #需要爬取的网址html = requests.get(url)html.encoding = html.apparent_encodingreg = re.compile(r‘<a target="_blank" class="tit f-l f16 blue" href="(.*?)">(.*?)</a><span class="tm f-r gray">(.*?)</span>‘)html_lis = re.findall(reg,html.text)for html_li in html_lis:    new_url = one_url + html_li[0]    new_time = html_li[2][0:10]             #分割获取到的新闻日期，对比今天的日期和获取到的新闻日期，相同的话就打印出来，不相同就跳过不打印    if new_time == today:        print(html_li[1],new_url)        new_html = requests.get(new_url)                    soup = BeautifulSoup(new_html.text,‘html.parser‘)        contents = soup.find_all(‘p‘,style="TEXT-INDENT: 2em")        for content in contents:            if content.string != None:                print(content.string)            else:                continue        print(‘----------------------------下一篇新闻----------------------------‘)    else:        break#可以建立函数来介绍代码的重复

使用Python爬取腾讯房产的新闻，用的Python库：requests 、re、time、BeautifulSoup ????

热门文章：

使用Python爬取腾讯房产的新闻，用的Python库：requests 、re、time、BeautifulSoup ????，,import req

使用Python爬取腾讯房产的新闻，用的Python库：requests 、re、time、BeautifulSoup ????，,import req

相关内容

最新python教程

python~HOT