java爬虫(及常用数据结构)

类与类之间的关系
项目目录结构
终端显示爬取的结果

我的Java爬虫代码

从爬虫项目中体会常用数据结构的用法 //

未完待续。。。。。

Queue // 放在 队列中浏览的新闻。。 poll() add()

LinkedList // Queue<NewsWithRelated> newsQueue = new LinkedList<NewsWithRelated>();


Set // 标记 已经访问过的 URL add()

HashSet // Set<String> visited = new HashSet<>();


ArrayList // 存储 扫描到的内容 (多态) add()


HashMap // put() entrySet()


Map


==============================================================
jsoup : jsoup is an open-source Java library designed to parse, extract, and manipulate data stored in HTML documents.
==============================================================

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容