Scrapy框架怎么直接读数据库中的URL地址进行抓取呢?,scrapyurl,比如我爬去了豆瓣的Top
Scrapy框架怎么直接读数据库中的URL地址进行抓取呢?,scrapyurl,比如我爬去了豆瓣的Top
比如我爬去了豆瓣的Top100页面,将每本书的详情页面的URL存入MongoDB中,然后我用Redis去重。然后从Redis中获取url去爬详细的数据。
现在有个问题
在Scrapy中,怎么处理MongoDB中url字段的值进入Redis。或许说。Scrapy怎么从数据库中获取url。
谢谢
在start_requests写不行吗?
比如
def start_requests(self):
r = Redis.Redis()while true: url = r.lpop('xxxx') yield scrapy.Request(url)
编橙之家文章,
相关内容
- django框架EmailMessage来发送邮件会有乱码,怎么解决?,
- python 中join()转义的问题,pythonjoin,t = ['[', '"
- Django框架自带了wsgi.py 为什么部署还需要uWSGI呢?,dj
- python autopy3 出现异常ValueError: Point out of bounds,autopy3v
- python 源码混淆一般用什么比较工具好?,python源码,pyt
- python 收到的数据是b'\x81\x84t\xdeL\x16\x00\xbb这种数据怎么
- celery可以动态的添加任务吗,celery动态任务,celery可以动
- python超速遍历文件夹下面三十几万个txt文档的处理,
- 关于Python类中super的问题?,python类super问题,In [1]: cl
- 用户名跟ID都可以登录的sql语句怎么样来写?,sql语句
评论关闭