lxml只支持xpath1.0,不支持xpath2.0

lxml只支持xpath1.0,不支持xpath2.0,所以很多功能用不到,比如:

#xpath1.0
#连接所有YES。除了NO之外
sel = etree.HTML('<div>Yes1 <em>SonYes2 </em> Yes3<p>No</p></div>')
#xpath1.0无法直接在规则中连接字符串数组,需要在外面使用join
lst = sel.xpath('//div//text()[not(parent::p)]')
print "".join(lst)

#结果Yes1 SonYes2  Yes3
#xpath2.0
#连接所有YES。除了NO之外
sel = etree.HTML('<div>Yes1 <em>SonYes2 </em> Yes3<p>No</p></div>')
#如果是xpath2.0就很简单,直接使用内置函数string-join,就可以了
print sel.xpath('string-join(//div//text()[not(parent::p)], "")')

#结果Yes1 SonYes2  Yes3
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 176,062评论 25 709
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,058评论 19 139
  • 最近在写个性化推荐的论文,经常用到Python来处理数据,被pandas和numpy中的数据选取和索引问题绕的比较...
    shuhanrainbow阅读 10,046评论 6 19
  • 2017年1月19日 星期三 阴小雨 读经内容: 1.《黄帝内经 灵枢》终始第9—3 法野; 2.《诗经 小雅 伐...
    育心丽谦林莉英阅读 1,576评论 1 1
  • 在想要记录一点什么的时候,就真的脑海里也搜不出一点什么。好比一大堆想要说的话,虽然已经成吨的囤积在你心中落灰许久,...
    酸豆角阅读 1,351评论 0 0

友情链接更多精彩内容