爬取ajax异步网页数据

ajax是通过javascript访问服务器获得数据的方式,数据并不会直接体现在html源码中,而且很大可能在源码中不能发现数据访问的链接,这就很棘手了,

这里以苹果的招聘主页为例 https://jobs.apple.com/us/search
它的jobs list是使用ajax加载的,
打开Chrome开发者工具,
View > Developer > Developer Tools

developer_tools.png

选择Network选项然后选取XHR,

屏幕快照 2017-03-11 下午6.48.33.png

点击刷新,就会看到有 .json 或者 .xml文件这就是我们寻找的数据文件

在Response 中是数据内容,在Headers中可以发现数据文件的URL,

headers.png

然后编写脚本抓取数据就行了,
可以参考以前的爬取58上的手机号码

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 看到标题时,有些同学可能会想:“我已经用xhr成功地发过很多个Ajax请求了,对它的基本操作已经算挺熟练了。” 我...
    前端渣渣阅读 11,178评论 1 12
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,270评论 19 139
  • Ajax和XMLHttpRequest 我们通常将Ajax等同于XMLHttpRequest,但细究起来它们两个是...
    changxiaonan阅读 6,824评论 0 2
  • 本文详细介绍了 XMLHttpRequest 相关知识,涉及内容: AJAX、XMLHTTP、XMLHttpReq...
    semlinker阅读 14,703评论 2 18
  • win7操作系统python3,前提是环境变量设置好了,打开cmd 安装完毕后,你可以立即打开 cmd 然后创建你...
    springye阅读 2,732评论 0 0

友情链接更多精彩内容