Python判断rss是否更新过用什么方法,python判断rss更新,最近在写一个python
Python判断rss是否更新过用什么方法,python判断rss更新,最近在写一个python
最近在写一个python程序要把一些rss中的文章不断获取下来
但不知道怎么判断rss是否更新过,只获取那些更新出来的文章
目前的想法是对每一个rss存一个最新文章的时间,下一次把所有更新的文章获取下来,然后更新这个最新时间
对了还有另外一个问题,就是感觉rss中的文章数没有网页上多,貌似好几天才有新的,但网页上是每天都有的,是什么原因?
理论上来说,rss在http header应该返回一个last-modified或者etag(atom),可以通过这个来判断
python的feedparser中,可以这样用
import feedparserd = feedparser.parse(rss_url)d = feedparser.parse(rss_url, modified=d.modified, etag=d.etag)d.status # 304d.feed # {}
如果没有更新的话,第二次就不会获取到东西
lz,求这个程序代码!毕设题目是这个,想请教楼主大大帮帮忙,零基础,如何快速做完这个项目,蟹蟹
rss不是有guid嘛,把最新的guid存一个,再爬的时候判断一下呗,rss有没有更新那是别人服务端程序自己的事,你也控制不了
编橙之家文章,
相关内容
- Python udp监听线程不能正常启用,pythonudp监听线程,想实
- 想用python抓万达订票信息求个思路,python万达,想在万达
- Python引用非当前目录模块实现方法问题,python当前目录
- 请问python nginx与uwsgi部署Django项目显示两个相同进程是
- 求解斐波那契数列用for计算方法实现的原理,斐波那契
- Python2.3中dump和load应该选哪个json库,python2.3json,为了向
- python书里的函数参数用[]这样写是有何作用?,python书里
- 有没有好的python微博爬虫相关文章推荐,python爬虫,需求
- python3.5里有汉字乱码ascii问题,print也出错如图,python3
- Python大神看下我爬虫下载文档思路可行吗,python大神
评论关闭