import requests
from lxml import etree
# requests 包
testurl = "http://www.cnblogs.com/chenyansu/"
s = requests.get(testurl)
# lxml 无法处理响应文件,用 .content 输出正文
s = s.content
# lxml 包
# 将对象转化为 html
s = etree.HTML(s)
# html 拥有 xpath 方法
x = s.xpath('//*[@id="main"]/div[3]/div[2]')
print(x)
print('---------------------------')
# 循环输出x内容
for child in x:
print(child.text)
使用 lxml 的 xpath 功能
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 文 / 余三肾 1. H在同学群里发了一张自拍照,照片上他仍是那么富态老肉横秋,背景是我老家新化县公安局的大门口。...
- 独立思考的基础是掌握足够的信息, 以及拥有很强的判断力。 -完- ©严正法律声明 本文版权受我国相关法律及适用之国...