python爬取pdf

哈哈哈练习爬虫技术，去到了lxml的官网去看那个document
看到那个可以pdf的标准就点开了。
想到res.content可以得到二进制文件信息，大概所有的数据都是可以爬的（图片也是可以的）。pdf类似，估计也是可以这么爬的。于是我就写了下面的这么一段代码。

还算不错，成功了~

代码也很简单~

import requests
res = requests.get('http://lxml.de/lxmldoc-4.1.1.pdf')
res.encoding = res.apparent_encoding
with open('./a.pdf', 'wb') as f:
    f.write(res.content)

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Android - 收藏集
Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
passiontim阅读 175,087评论 25赞 709
github地址，欢迎大家提交更新。
github地址，欢迎大家提交更新。 express() express()用来创建一个Express的程序。ex...
Programmer客栈阅读 7,457评论 0赞 1
从今往后，你是我心底的温柔
小时候以为爱是电光石火如醉如痴长大后才知道爱一个人不是那么简单的事你走，我不拦你你来，大风大雨我也去...
白茶清欢心依旧阅读 3,077评论 0赞 0
看完《初次爱你，请多关照》这本书啦
分享一段有趣的，哈哈哈哈哈哈……
诗水年华阅读 2,515评论 2赞 0
【连载】《剑兰花开》第一卷《执剑斗魔》第四节《文武之道》
2011年2月4日小雨星期五今天是大年初三，远处此起彼伏的鞭炮声不断提醒人们春节...
卿真阅读 2,695评论 2赞 2

3赞4赞

赞赏

手机看全文