使用 lxml 的 xpath 功能

import requests
from lxml import etree
 
# requests 包
testurl = "http://www.cnblogs.com/chenyansu/"
s = requests.get(testurl)
 
# lxml 无法处理响应文件,用 .content 输出正文
s = s.content
 
# lxml 包
# 将对象转化为 html
s = etree.HTML(s)
 
# html 拥有 xpath 方法
x = s.xpath('//*[@id="main"]/div[3]/div[2]')
print(x)
 
print('---------------------------')
# 循环输出x内容
for child in x:
    print(child.text)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容