python 爬取BOSS直聘网页信息

一、目标定义

1、目标理解

(1)通过爬取网页信息,练习并掌握python网页爬虫的基本命令操作。

(2)分析爬取的数据,通过关键指标反映互联网行业就业趋势和现象。

2、指标定义

(1)互联网职业的城市分布图。

(2)职位需求最多的TOP 50的公司分布图。

(3)相关职位的最低和最高薪资对比图。

(4)相关职位主要需要的专业技能有哪些。

二、数据爬取

1、原始数据

关键指标分析源数据

2、加工数据

加工后的数据


三、数据整理

1、数据变换

城市维度的岗位需求


公司职位需求



最低与最高平均薪资

四、数据可视化

五、数据建模

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容