04_简单的爬虫cheerio基于node.js

基于node.js

1、 先去安装 cheerio模块

2、且要获取http 或者 https

3、var url = "http//:www.news/baidu.com"

4、通过 http.get()去获取

http.get(url,function(response){

// 4.1开始爬数据

var str =""; //(存储数据)

response.on("data",function(chunk){

str+=chunk;

})

//4.2、结束

response.on("end",function(){

// 为实例化渲染数据 cheerio

// decodeEntities:false  解码

var $ = cheerio.load(str, decodeEntities:false);

var arr = []; //真的数据

//(ul li)去查看你要想数据的class或者id名,用法同jq

$("ul li ").each(function(){

arr.push({

title:$(this).find('.gname').html(),

img:$(this).find('a').html(),

xj: $(this).find(".xj b").html(),

yj:$(this).find(".yj em").html()

});

})

console.log(arr); //打印出自己的

可以在这里去写 在mongoDB插入数据的代码第四步4

就可以把爬到的数据放到数据库之中

})

})

文章同步上一片

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 单例模式 适用场景:可能会在场景中使用到对象,但只有一个实例,加载时并不主动创建,需要时才创建 最常见的单例模式,...
    Obeing阅读 2,104评论 1 10
  • 工厂模式类似于现实生活中的工厂可以产生大量相似的商品,去做同样的事情,实现同样的效果;这时候需要使用工厂模式。简单...
    舟渔行舟阅读 7,842评论 2 17
  • 数组方法里push、pop、shift、unshift、join、split分别是什么作用。(*) (push、p...
    coolheadedY阅读 746评论 0 0
  • 以下是常用的代码收集,学习用。转自豪情博客园 1. PC - js 返回指定范围的随机数(m-n之间)的公式 re...
    自由加咖啡阅读 1,026评论 0 1
  • 1.简书 koa是由Express原班人马打造,致力于成为一个更小、更富有表现力、更健壮的Web框架。使用koa编...
    不去解释阅读 2,711评论 0 11