源代码发布在github : get_tumblr_likes
一、介绍
本项目使用 python 编写,分析 tumblr 账户中喜欢的内容,给出资源链接,并下载。
其中 test.json
是一份 tumblr 返回的喜欢数据的 json 示例,提取里面图片和视频的资源地址后下载,下载的内容如下图。
二、使用方法
首先,你需要通过 tumblr API 来获取账户喜欢内容。这个过程是需要通过 OAuth 认证的,具体可参看这个网页
得到认证后可以通过脚本来获取资源内容,也可以通过这个网页来查询,结果会通过 json 的形式返回
-
保存你得到的 json 数据,命名为
test.json
,执行命令python json_parse.py
,这可以从 json 文件中提取出资源的真正链接,并存为url_list.txt
文件
- 执行
python download.py
,之后资源文件就会挨个下载到 download 文件夹下
三、其他
-
由于众所周知的原因,tumblr 的资源地址是不能直接下载的,因此需要设置代理。测试时使用 ssr 代理本地连接,因此
download.py
中有PROXIES = { "http": "http://127.0.0.1:1080", "https": "https://127.0.0.1:1080" }
,如果是在可直接访问 tumblr 的 VPS 上运行,可对代码做如下修改。# r = requests.get(url,proxies=PROXIES) # use proxy r = requests.get(url) # directly access
这个项目下载的是账户中的喜欢内容,因此需要进行认证。如果是下载某个账户发布的内容,可使用tumblr-crawler,再次感谢 tumblr-crawler 项目