登录注册写文章

批量下载网页中的资源

批量下载网页中的资源

比如我们想下载某个课程的所有lecture的pdf/pptx资料

https://www.uio.no/studier/emner/matnat/its/TEK4500/h20/lectures/

https://github.com/LiYing0/CS_Gra-HITsz/tree/master/研一上/密码学

手动下载每一个链接非常的低效
下面教一下如何用shell命令完成这项工作

右键查看网页源码或者按F12，得到资源的网页元素块

右键复制元素

image.png

粘贴到本地文本文件中

接下来可以打开git bash运行我们的shell命令

git bash

在网页可以curl下来的情况下，也可以省略复制到本地文本文件中的这一步
直接curl资源所在的网页

curl https://www.uio.no/studier/emner/matnat/its/TEK4500/h20/lectures/

image.png

总的来说四部曲：

curl 或者 cat 网页源代码的文本文件
grep "pdf|pptx"
awk -F '"' '{print $数字}'
(去重)排序

第3步补充说明：
网页里面的分割符如果用 "
aaa"bbb"ccc
如果想截取bbb的话，数字填2

没带https的情形

对于资源地址没显示完整的情形，有时候需要手动补充完整
方法是在print后面添加需要补充的内容，比如

cat 1.txt | grep 'pdf|pptx' | awk -F '"' '{print "http://github.com" $10}'

最后可以用IDM批量下载

IDM

在任务栏点选从剪贴板添加批量下载

大功告成~

最后编辑于：2022.02.04 18:02:06

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

相见恨晚！批量下载网页图片的工具，我只服这个...
工具控丨励志网罗各种神器提高工作、学习效率。12.14 如果你和我一样曾经苦苦寻找批量下载网页图片的工具，看这篇就...
玲子Cdy2018阅读 1,402评论 2赞 10
Python 实现简单的爬虫功能 -----批量下载网页中的图片
我使用的是macPro , mac 自带了python2.7 , 我自己下载了pytho3.6根据操作进行安装后,...
十二月的水瓶座阅读 1,500评论 0赞 0
《自媒体人必备chrome插件》第十一期：图片助手-批量下载网页图片！
以 Chrome/Firefox 为代表的浏览器，以其兼容稳定性和强大的扩展性，帮助人们极大地提高了工作效率。为...
晚六早八阅读 7,714评论 0赞 1
批量下载网页上的图片，这个免费工具可以帮你
无论是工作还是生活，我们有的时候总会想把这个网页上所有的照片都下载下来，玩代码的只需要写个爬虫就能轻松搞定，懂电脑...
墨夫言之阅读 2,146评论 0赞 0
快速批量下载网页中全部链接
网上冲浪的时候，一顿操作之下发现一个新宝藏，想把所有链接都DOWN下来好好学（吃）习（灰）一波。然鹅没有找到全部下...
馨不累阅读 27,362评论 0赞 5

赞1赞

赞赏

手机看全文