1.我采集的是新浪博客的页面 新浪博客/s/articlelist_1765896480_0_1.html 新浪博客换成blog.sina.com.cn 方便演示。
2.在栏目选择你要采集的栏目
在博客分页列表要注意页面数据的变化要选择你需要采集的页面
3.然后就是要采集他的页面链接了
<div id="sina_keyword_ad_area2" class="articalContent newfont_family">
[!--newstext--]
</div>
4.然后就是正文标题和文章内容了
<title>[!--title--]</title>
<div id="sina_keyword_ad_area2" class="articalContent newfont_family">
[!--newstext--]
</div>
5.接下来就测试文章是否采集成功了
在采集审核中查看如果是空白说明采集失败,从我说的上面几点开始检查