简单的java爬虫程序（入门）

首先做好准备工作：
了解正则表达式中基本的Select的用法:
此处引用楼主查到的资料
http://www.tuicool.com/articles/ZnyMvu
第一个爬虫：无验证码的简单爬虫
楼主是中南财经政法大学的，就拿本校教务处作为例子，我们的目的是获取教务通知中的标题和超链接
网址：http://jwc.zuel.edu.cn/

要获取的目的信息

首先查看网页源码，楼主用的是谷歌，F12就可以看到源码。

前端源码

接下来重点！！！！PO出JAVA源码
<code>
//你要爬的网页地址
String url="http://jwc.zuel.edu.cn/";
//核心代码，链接到该网页
Connection connection=Jsoup.connect(url); Document Content=connection.get();
//获取指定位置的信息，该Demo中是新闻标题和时间 Elements links=Content.select("[class=Article_Title]"); Elements Date=Content.select("[class=Article_PublishDate]");
//首先显示了8个新闻，用一个for循环 for(int i=0;i<8;i++) {
//得到所需字符串
String webContent=links.select("a").get(i).text();
String webDate=Date.get(i).text();
//得到超链接的代码比较特殊这里进行标注
String herf=links.select("a").get(i).attr("abs:href");
System.out.println(herf);
str[i2]=webContent; str[i2+1]=webDate;
strings[i]=herf;
}
for(int m=0;m<16;m++)
{
System.out.println(str[m]);
System.out.println(str[++m]);
}
</code>
下面是结果图（改一改就可以应用到JSP和微信中也是可以，是不是很棒！）：

20160909125113149.png

最后编辑于：2017.12.04 03:11:23

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

简单的java爬虫程序（入门）

简单的java爬虫程序（入门）

相关阅读更多精彩内容

友情链接更多精彩内容