非常规介绍
由于对爬虫的喜欢,以及xpath对html强有力的解析,还有从浏览器中查找html节点的方便性,使得xpath用作爬虫的分析就很给力了
查阅xpath教程,都是写xpath对xml的解析示例,而且基本都是copy 再三
本教程的章节不会太多,主要讲解xpath的语法,以及讲解如何最快的获取html中需要的数据
主要内容都是用xpath分析html的页面结构
常规介绍如下
XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
在您继续学习之前,应该对下面的知识有基本的了解:
- HTML / XHTML
- XML / XML 命名空间
什么是 XPath?
- XPath 使用路径表达式在 XML 文档中进行导航
- XPath 包含一个标准函数库
- XPath 是 XSLT 中的主要元素
- XPath 是一个 W3C 标准
XPath 路径表达式
XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
XPath 是 W3C 标准
- XPath 于 1999 年 11 月 16 日 成为 W3C 标准。
- XPath 被设计为供 XSLT、XPointer 以及其他 XML 解析软件使用。
!放在最后
以上就是本篇文章的全部介绍内容了
如果文章中有什么错误或者建议修改的地方,欢迎留言纠正和回复
如果你喜欢本篇文章,不妨关注一下我们的公众号,每周更新两篇原创技术文档,都是干货