Python xpath 获取指定页面中指定区域的html代码

依赖:pip install lxml requests

主要思想是利用xpath获取到指定区域的Element对象,然后再将Element对象传给etree.tostring(),即可得到指定区域的html代码,看一下需求:

1、我们要得到 http://www.w3school.com.cn/ w3c首页中的这个位置的html代码:

image.png

看一下页面源码是这样的
image.png

2、下面开始编码:

from lxml import etree
import requests

res=requests.get('http://www.w3school.com.cn/')
tree=etree.HTML(res.content)
div=tree.xpath('//div[@id="d1"]')[0]
div_str=etree.tostring(div,encoding='utf-8')
print div_str

3、结果如下:


image.png

4、成功获取到了指定区域的html代码。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • XPath语法和lxml模块 什么是XPath? xpath(XML Path Language)是一门在XML和...
    徐弱西阅读 4,451评论 0 1
  • 我今年26岁了,我还没有男朋友,说没有喜欢的人是不可能的,我是一个正常人,但是我确实没有遇到,可以共度一生的人,甚...
    蒋王子阅读 503评论 0 0
  • 我记得当时,我是被鸟叫声吵醒的。声音很是清脆明亮,那种亮度如射线般穿透夜色直入人眼的月光,让人为之一振,然后便飘飘...
    美熊熊阅读 3,335评论 0 1