cheerio 是nodejs特别为服务端定制的,能够快速灵活的对JQuery核心进行实现,工作于DOM模型上,并且解析、操作、呈送都很高效
//示例
var html = '<ul id="fruits">' +
' <li class="apple">Apple</li>' +
' <li class="orange">Orange</li>' +
' <li class="pear">Pear</li>' +
'</ul>';
-
.load
引入我们要解析的html
var cheerio = require('cheerio');
$ = cheerio.load(html);
-
选择器(selectors)
$(selector,[context],[root])
(context、root通常会省略)
$('.apple')
//选择器定位到class=“apple”
$('ul .pear')
//选择器定位到ul中class = “pear”
$('li[class = orange]')
//选择器定位到liclass=“orange”
- 属性操作(attr)
.attr(name[,value])
获取和设置属性
第二个参数是可选的。当第二个参数不存在时表示获取属性的值,当有带有第二个参数时,表示设置属性的值。如果设置一个属性的值设置为null ,则删除该属性
$('ul').attr('id');
//获取ul的id属性名
$('apple').attr('id','favorite').html;
//class为apple的添加了个id为favorite
.removeAttr(name)
移除属性
- class操作
.hasClass(className)
判断元素class中是否包含className
.addClass(className)
给元素添加className的样式名
removeClass(className)
将元素上className的样式名移除,当className为空时则移除所有样式名 - DOM操作
.append(content)
作为最后一个子元素插入
prepend(content)
作为第一个子元素插入
.after(content)
插入某一元素后面
.before(content)
插入某一元素前面
.empty()
清空节点,移除所有字节点
.html()
获取节点的html内容,传入参数时设置该元素的html结构
.text()
获取节点的所有文本内容
查找元素
.find()
查找符合选择条件的元素
$('#fruits').find('li').length; //=> 3
.parent()
获取元素的父元素
.next()
获取元素的下一个兄弟元素
.perv()
获取元素的上一个兄弟元素
.children([selector])
获取元素的孩子节点
.siblings()
获取元素的所有同级元素(包括本身)
.filter(seletor/function(index))
在cheerio对象集合中进行条件筛选
.fist()
获取cheerio集合中第一个cheerio对象
.last()
cheerio最后一个对象
.eq(i)
根据索引值i获取cheerio的对象(i为负值时表示从尾部开始索引)
.clone()
对cheerio对象进行复制
.eacn(function(index,element){……})
遍历每个元素
.map(function(index,element){……})
对每一个元素进行处理并返回一个值
$.root
对顶级DOM进行操作
$.contains(container,contained)
判断container是否有contained