利用BeautifulSoup获得静态页面中的信息

一、利用页面中标签的名称和属性查找标签


二、通过标签在文档中的位置来查找标签

要查找标签在一个静态页面中的位置,首先要知道“导航树”的概念。当我们用浏览器(如 ie edge)打开一个静态页面后,点击浏览器右上角的“更多”时,会出现“开发人员工具”选项,点击后就可以看到页面的html代码了,它是以一棵树的形式存在的,我们管它叫“导航树”。

1、子标签

这里只说思想不写代码(实在是因为编辑器写代码太魔怔了),子标签就是父标签的下一层,比如table标签,它的下一层子标签就是 所有的tr标签,那么tr标签中所有内容,包括标签也会被打印出来

2、兄弟标签(包括next_siblings 和 previous_siblings)

兄弟标签就是和这个标签具有相同名字的标签(不包含它自己)

3、如何找父亲标签

父亲标签和子标签是对应的,就是子标签的上一层标签。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容