最近安排让协助开发/维护爬虫工具类,主要涉及到网页内容的获取,主要使用python+xPath作为解析库,初次认识,感觉还不错!
https://www.w3.org/TR/xpath/all/
https://www.jianshu.com/p/85a3004b5c06
https://gitee.com/heyclock/doc/blob/master/一些小工具_小插件/chrome_Xpath_v2.0.2.zip- 支持Google浏览器的下xPath插件
安装方法(转载):
将【.crx】后缀的文件拖拽至谷歌浏览器开发者模式下的扩展程序管理页签时,报错【CRX_HEADER_INVALID】,即此插件无效的错误。
安装失败的原因
原因在于谷歌浏览器在新版本中添加对第三方插件的限制,会对文件中的文件头进行官方校验,非官方渠道的插件不允许安装。意思就是,只允许从谷歌的官方商店安装插件。
解决的办法(偷鸡的做法)
解决的办法是将【.crx】后缀的文件改为【.rar】后缀,然后用解压工具解压到某个文件夹,最后通过谷歌浏览器提供的【加载已解压的扩展程序】按钮功能,选择先前解压好的文件夹,即可完成本地第三方Chrome插件的安装。
非常简单。
"你说你喜欢下雨,可是你在下雨的时候打伞。"
你要去做一个大人,不要回头,不要难过。