python爬取简历模板

前言

    自从学了python爬虫后就想去找一份爬虫的工作,但是简历如何写作是个问题,就想到了何不用爬虫去爬取别人的简历模板一看,找了一些网站最后看最准了站长之家

一、分析网页结构

    进入到站长之家,我们可以看到免费的offer一共有426页之多,把这些全部爬下来也足够使用了吧,



我们右键检查,选中一份简历,明显可以看到进入这份简历的链接,然后点击这个链接进入到这份简历的页面里。


往下翻可以看到下面有很多下载的地址,什么福建,山东,江苏,广东,厦门等,随便点击一个都可以下载的,还是右键检查一下,选中一个下载的地址,也可以看到下载的链接就在这里面。


好了,我们接下来的工作就好办了,只要把这两个链接用正则取到,在请求不就好了吗,就这么简单。

二、编写python代码

    我们先请求站长之家的链接获取到网页源代码,在用正则提取出第一个链接就好了。


在请求这个链接,提取出下载链接,在请求下载链接就可以下载到本地了。



好了,小伙伴是不是觉得很简单,感觉python爬虫就是这样,只要找到了链接,在用正则提取就行了,思路要清晰。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,931评论 25 709
  • 用两张图告诉你,为什么你的 App 会卡顿? - Android - 掘金 Cover 有什么料? 从这篇文章中你...
    hw1212阅读 14,465评论 2 59
  • 注册简书之后一直都没写东西啊,一个是没时间,另外对markdown这种新型的写作方式不熟练啊,第一篇文章就小小的写...
    小小芹阅读 3,584评论 0 1
  • 我是一个极度自卑的人。 熟知我的人看到这句,肯定要来一句:骗人吧! 也是,性格爽朗任何时候都哈哈哈的我,看着也不像...
    脱俗儿阅读 1,358评论 0 0