Python爬取pdf（优化版2）v3.0

平均用时为第二个版本的0.5 - 2/3。

import requests
res = requests.get('http://lxml.de/lxmldoc-4.1.1.pdf', stream=True)
with open('./lxml.pdf', 'wb') as f:
    for chunk in res.iter_content(chunk_size=10 * 1024 * 1024):
        if chunk:
            f.write(chunk)

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Spring Cloud
Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具（例如配置管理，服务发现，断路器，智...
卡卡罗2017阅读 134,841评论 18赞 139
行测大礼包—（数字推理题725道详解）
【1】7，9，-1，5，( ) A、4；B、2；C、-1；D、-3 分析:选D，7+9=16；9+（-1）=8；（...
Alex_bingo阅读 19,081评论 1赞 19
Python pandas 0.23.1 Indexing and Selecting Dat...
最近在写个性化推荐的论文，经常用到Python来处理数据，被pandas和numpy中的数据选取和索引问题绕的比较...
shuhanrainbow阅读 4,582评论 6赞 19
[Intellij IDEA Plugin]获取Terminal
肖浩呗阅读 2,010评论 1赞 0
九月，再见
这个九月，用一个词语概括，那应该是“忙碌”吧！开学季，各个孩子卯足了劲，定目标，下决心，...
我爱囡囡和仔仔阅读 387评论 2赞 1

1赞2赞

赞赏

手机看全文