前言:
数据分析相关的知识已经学了一段时间了,但是一直没有做过完整的项目分析。在思考后我选择了现阶段最关心的方向——数据分析师职位招聘信息数据,作为第一个项目的具体实践。在这个项目中涉及到了几个我比较关心的问题,在其解决后为我未来的求职规划提供了很不错的参考,于是准备将其分享出来。在其中亦有我分析过程中遇到的问题,一并记录下来作为反思。
本文的目的:
本文主要为了解决以下几个问题:
1. 哪一些城市对于数据分析师的需求量较大?
2. 数据分析师的薪酬大概有多少?
3. 哪些城市的数据分析师薪资处于相对较高的水平?
4. 数据分析师薪资随学历、经验是如何变化的(是否满足学历越高、经验越高薪资越高这一现象)?
正文:
一、数据的获取和处理
(1)数据的获取:
数据来自2018年6月7日拉勾网搜索“数据分析师”这个职业的招聘信息,爬取的工具为八爪鱼采集器(好吧我不会爬虫,另:这不是广告)。
获得的信息类目有招聘单位、招聘岗位、薪资、工作地区(城市)、工作地址、经验要求、学历要求以及职位类别等共450条数据
(2)数据的处理:
数据只有450条,因此采用Excel进行数据的预处理,处理过程中主要包含以下过程:
1)薪资:薪资的数据多为类似于“8k-20k”这样的区间范围,为便于分析对其的处理是提取薪资的上下限以及平均
2)去除了“职位类别”中的实习项目;
二、分析过程
问题一:哪些城市对于数据分析师的需求量较大:
对于这个问题,我对于其的分析主要度量为数量,即每个城市对于这个职位的招聘数量,对其做简单的可视化如下图:
可以发现,数据分析师的需求较大的区域主要在于北上广这三个经济较为发达的位置。北京独占鳌头,占据较大一部分的份额;三角区域紧随其后,上海、杭州、苏州等地也具有相当一部分的需求;珠三角区域的深圳,广州也具有一定的需求量。升下的就是零零散散的分布,例如武汉、长沙等地区就只有零零散散的几个需求。
小结:
数据分析师这份直接的需求主要集中于北上广等一线城市,杭州亦是一个不错的选择。在求职时可以广泛的考虑这三个区域,对于其他的城市由于需求量较小不利于广泛的选择。
问题二:数据分析师的薪酬大概有多少、哪些城市的数据分析师薪资处于相对较高的水平?
对于这个问题有如下两个方面:
1. 薪资主要的分布如何
2.不同城市的薪资水平如何
首先进行第一个方面问题的研究,即薪资分布问题:
我根据薪资进行了可视化的操作,得到了如下的直方图
可以清晰的发现数据分析师的薪资5k-30k区间内,这是一个较大的区间范围。另外对于15-17.5这个区间出现了突低的情况,对此我重新查看了数据,在15k-17.5k这个区间前后的区间其薪资描述有大部分为10k-20k这样范围较广的区间,对于此类区间的平均使其处于中间位置恰好位于12.5-15k这个区间范围。对于这个问题我重新划分了直方图中箱的宽度,制作新的直方图如下。
可以发现薪资的分布呈右偏分布,只有较少数的人可以拿到30k以上的高薪。但是薪资范围处于6k-20k范围内,是十分令人期待的。
第二个方面,不同城市薪资之间的分布如何:
首先我按照地区将平均薪资的均值进行了可视化处理,在进行分析的时候发觉两个问题:首先是薪资的均值亦受到较大和较小值的影响,对分析的判断造成不利;另外一个就是若某一个城市只有很少的职位,但是薪资较高,不具有普遍性,会让人错误的认为这个城市具有较高的选择性。如下图中珠海的薪资搞过了上海深圳等地,而根据上文的分析得知珠海仅有一个在招岗位,因此并不能很好的反应正常的薪资分布。
对于上述问题,我重新制作了箱线图如下:
经过对比分析可以发现,在需求较大的几个城市诸如北京、上海、深圳、杭州等地中,北京的整体薪资水平处于较高位置,其中位数大约在20k——处于全国的首位;其次为上海和杭州。对于深圳出现的均值较高且中位数较低的情况,可以得出其中可能有几个较高薪酬的岗位拉高均值的结论。
小结:数据分析师的薪资总体来说是十分令人期待的,其广泛分布于9k-20k并且几个需求量较大的城市薪资范围也处于较高的水平。
第三个问题:数据分析师薪资随学历、经验是如何变化的(数据分析师对学历、经验的要求)
以学历作为度量:
首先在如今时间段并未发现对博士学历的需求
可以发现学历的要求极大多数为本科及以上,基本可以判定学历为本科及以上可以算作入行的基本条件。大专及以上的要求处于第二个位置,但是我相信在能力相差不大且对企业的待遇要求差距不大的情况下,企业会优先选择学历高的求职者,硕士及以上学历对于求职者来说具有较高的竞争力。
通过箱线图亦可以发现,硕士及以上学历的求职者可以拿到相对较高的薪资,其薪资的中位数及平均数皆处于相对较高的水平,而本科及以上的学历与硕士及以上相比略少。
工作经验的要求:
对于经验的要求,市场对于1-3年经验以及3-5年经验的数据分析师要求是最多的。对于经验不限这一项,可能在其招聘的JD中会有具体的经验要求,在此不便于具体分析。经验5-10年的成熟数据分析师需求量是较少的,成熟的数据分析师为一个公司中较为重要的财富,因此一般不会出现大规模的辞职、招聘现象。另外5-10年或者10年以上的数据分析师可能会通过其他的途径进行招聘,因此在此无法进行较为明确的分析。
在薪资这一方面,基本符合经验越高,薪资越高这一现象,并且随着经验的增加薪资处于阶梯上升的程度。成熟的数据分析师薪资能达到20-30k这一水平。
小结:
数据分析师这份职业多以本科生作为基础学历的要求,学历处于大专的求职者竞争压力是十分大的。这份职业对于业务能力是具有一定的要求的,对于没有经验的求职者来说,这会是十分不利的方面。
结论:
经过上述的分析,现在的到了如下的几个结论:
1.数据分析师职位的需求主要集中于北上广深这几个区域,对于求职者来说这几个区域意味着更多的机会;
2. 数据分析师的薪资主要集中于6-20k这个范围中,并且有小部分人可以得到十分高的报酬。
3. 以薪资为度量,若选择城市的话北京市最好的选择,京城不仅机会众多,其薪资也是出于相对较高的水平。
4. 数据分析师对于学历是有一定要求的,以大专学历作为最低,并且以本科为最主要的招聘要求。若求职者具有硕士及以上的学历并定会有很好的竞争力。
5. 对于数据分析师的经验要求这方面,1-3年经验的分析师需求量是最大的,3-5年经验的分析师也有较大的需求。
总结与反思:
1.数据的获取是使用的爬虫软件,获得的字段相对来说还是较少的,例如缺少数据分析师应该掌握的技能等类目,以后开始逐步进行爬虫的学习,以方便获取更为细致的数据。
2.经过分析可以基本选定去求职的城市。于我个人来说更倾向于北京。
3.对于一个数据分析师来说需要的不仅仅是发现问题的现象,更注重的应该是追求其深层次的原因,因此需要进行更多的思考和研究。