scrapy采集数据过程中放回下载过大的页面，scrapy采集,添加以下代码到setti

文章由Byrx.net分享于2019-03-23 10:03:09评论（560）

scrapy采集数据过程中放回下载过大的页面，scrapy采集,添加以下代码到setti

添加以下代码到settings.py，myproject为你的项目名称

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.LimitSizeHTTPClientFactory'

                                自定义限制下载过大页面的模块

MAX_RESPONSE_SIZE = 1048576 # 1Mbfrom scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetterclass LimitSizePageGetter(ScrapyHTTPPageGetter):    def handleHeader(self, key, value):        ScrapyHTTPPageGetter.handleHeader(self, key, value)        if key.lower() == 'content-length' and int(value) > MAX_RESPONSE_SIZE:            self.connectionLost('oversized')class LimitSizeHTTPClientFactory(ScrapyHTTPClientFactory):     protocol = LimitSizePageGetter

热门文章：

python字典（dict）操作详解，pythondict,1、创建
Python加pyGame设计的简单拼图游戏，pythonpygam
python计算指定多少天后的日期，python天后日期
python通过MD5文件校验来查找重复内容的文件，
xapian通过python实现的简单排序代码，xapianpy
python操作mongodb根据_id查询数据的代码，mong

scrapy采集数据过程中放回下载过大的页面，scrapy采集,添加以下代码到setti

scrapy采集数据过程中放回下载过大的页面，scrapy采集,添加以下代码到setti

相关内容

最新python源码实例

python~HOT