scrapy1.5自定义下载文件名称

爬坑总结

百度上搜了好多地方 都是少些了在setting.py的配置 然后看着老版本的文档走了不少弯路、其实文档上说的还是比较清楚的、比百度出来的结果好多了

1、配置

在setting.py中加入以下代码,其实创建的时候就已经自动添加了只不过系统默认注释掉了 打开就好了

ITEM_PIPELINES = {
   'enduction.pipelines.EnductionPipeline': 300,
}

2、编写代码

编写pipelines代码

    def get_media_requests(self, item, info):
        print('-----')
        for file_urls in item['file_urls']:
            yield scrapy.Request(file_urls, meta={'item': item})

    def file_path(self, request, response=None, info=None):
        item = request.meta['item']  # 通过上面的meta传递过来item
        down_file_name = './full/{0}.zip'.format(item['title'])
        return down_file_name

3、注意

系统默认会有process_item函数、一定要注释掉,否则系统不会调用get_media_requests 方法。这个地方所有的教程都没写,坑爹以为没事。结果爬坑爬的类死了

    def process_item(self, item, spider):
        pass
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,447评论 25 708
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,973评论 19 139
  • 这世上,总有那么一两个想到就会心烦的人。 有时候会想凭什么呢?你凭什么对我这样,凭什么这样想当然的认为我是什么样的...
    嘉一粒阅读 231评论 1 0
  • 2017-1-11 撒义种的,得实在的果效。(箴言十一章18节下) 投资人生有许多方式,没有一项比得上热爱追...
    斐斐feifei阅读 1,056评论 0 0