洞见世界(1): 拉勾网大数据告诉你, 会计最高月薪达33k!

image.png

前言:

小李是个很有上进心的女孩, 老板让她了解下会计这个行业的薪资情况, 她不清楚怎么去做, 所以找了笔者, 当当当, 然后这一份薪资报告就出来了_.(小李为虚拟人物)

by 璀璨者张健, 专注于爬虫和数据分析, App/Web/小程序, 区块链等领域

简述:

首先说明这篇文章的数据来源,是爬虫爬取了拉勾网"数据分析师"这一职位信息所得来的。并且主要分析了数据分析师总体薪酬情况、不同城市薪酬分布、不同学历薪酬分布、北京上海工作等地经验薪酬分布情况、薪资最高的20个职位, 平均薪资最高的10个公司。 前面的内容多的是数据处理, 想看结果的可以直接跳到分析结论!

阅读大纲:

  • 数据分析报告

  • 分析结论

  • 思考总结

  • 数据采集(附录)

  • 数据清洗与处理(附录)

第一部分: 拉勾网会计职位分析报告

数据分析

  • 总体薪酬情况
image

从上面的图中,大部分职位集中在4k~14k之前, 10k左右的职位最多, 高薪的职位相对较少, 薪资特别低的有1k,2k,3k这三个薪资级别, 这三个薪资级别应该是 实例 岗位

  • 不同城市薪酬分布情况
image

北京市薪酬分布中位数大约在8.8k,居全国首位。其次是杭州、乌鲁木齐,上海, 深圳, 可以看出对于会计职位来说, 薪资最高的是北上深杭和乌鲁木齐, 北上广杭是国内的大城市, 而乌鲁木齐的薪资中位数在8k, 可能的原因是这个城市治安不好, 职位多, 但是人少

  • 不同学历的薪酬分布
image

我们可以看出, 学历对于薪资的影响还是很大的, 本科与大专的薪资差距在2k左右, 差不多在20%左右,会计专业对于学历的要求比较低, 没有哪家公司要求硕士学位或者博士学位

  • 北京上海深圳杭州职位不同薪酬分布情况

如果你想去北京和上海这两个城市发展的朋友们,用数据告诉你去哪个城市应该怎么发展

image

从图中我们能够得出,在北京会计的职位是较多的, 然后发展的方向是会计主管, 高级会计和会计经理, 薪资都在10k以上, 其中会计经理薪资达到了15k

杭州, 上海, 广州, 深圳基本都差不多, 会计这种基础岗位最多, 然后是会计主管, 值得特殊注意的是, 深圳还有全盘会计和成本会计

• 不同年限对于薪资的分布情况

image

通过以上图表可以看出, 应届毕业生的薪资较低, 一般为4.4k, 刚开始工作的1-3年的薪资为6.3k, 3-5年的薪资为8.4k, 5-10年的为10k左右, 也有的薪资较高, 达到33k左右, 但是这个岗位通过左侧的职位个数可以看出, 只有一个类似岗位, 不具有代表性

• 不同规模的公司对于薪资的分布情况

image

通过图表我们可以看出, 小公司一般开的薪资比较低, 例如15人左右的公司平均薪资在5k左右, 而大规模的公司, 例如大于150人以上的公司, 平均薪资在8k左右

• 不同的融资轮次对于薪资的影响

image

我们可以看出, 天使轮和未融资, 以及不需要融资能给的薪资为6k~7k, 融资中C轮工资给能的薪资是最多的

  • 薪资最高的10个职位
image

我们可以看出, 晨光科技能给出差不多25k到42k的薪资, 能给出高薪的岗位基本上是会计经理, 会计主管, 主板会计, 高级会计

• 平均薪资最高的10个公司

image

我们可以看出, 能给出高薪的几个公司为 晨光科技, 孔夫子旧书网, 青云, 熊猫直播, 药帮忙, 上上签

分析结论

从总体薪酬分布情况上,会计这一职业工资普遍较高的,大多人是在4k-14k之间每月,但是这个数据之后拉勾网的薪资, 可能智联招聘或者51job数据更准确一些

从不同城市薪资分布情况得出,在北京工作的数据分析师工资中位数在8k左右,全国之首。其次是杭州上海深圳,如果要发展的话,还是北、上、深、杭比较好啊。

从不同学历薪资情况得出,学历越高发展所获得工资是越高,其中有大专和本科差距在2k左右

分析北上深杭的数据分析师职位需求数量,北京以135个获得最高。

思考总结

今天这篇文章进行了更新,主要是用爬虫获得了会计职位信息,然后通过excel清洗数据, 然后通过excel的透视表分析数据, 通过excel的图表实现数据可视化

下载资源

福利1: 如果想要拉勾网会计职位的数据, 请加我微信

福利2: python爬虫源码(github)

https://github.com/quietjolt/lagou-spider

第二部分: 干货 - python爬虫爬取拉勾网数据

数据采集

    这篇文章的数据来源是拉勾网,  获取数据的过程是通过python实现爬虫程序, 从而获取了所需数据, 本文主要分析了拉勾网  '会计'  这个职位的总体薪资情况, 不同城市薪资, 不同学历, 重点城市的薪资分析,  数据量差不多在500条数据左右,  而根据接口中获取的值, 可以看出,  会计类岗位在拉勾网约在2720条左右, 数据覆盖率为 18%

登录拉勾网,在顶端输入框内输入"会计",点击搜索, 点击之后就能看到我们需要的数据, 如下图所示

image
image

其实这个爬虫部分的代码写的比较简单,运用知识主要是for循环,另外拉勾网对于我们请求的响应结果是json格式,也简化了我们的操作。操作的过程肯定会存在莫名的错误,大家要学会搜索并要有耐心啊。

爬虫的代码比较简单, 主要用的的是python语言, requests库用于获取数据, pyquery用户解析html, pymysql用于保存数据.

爬虫源码请到github下载:

下载地址: https://github.com/quietjolt/lagou-spider

这个步骤最后获取的导出的是csv格式的数据, 这种格式的数据可以在excel中导入, 然后去使用, 如图所示(如果需要数据, 请直接联系作者)

image

数据的清洗与处理

刚才获取的数据, 主要的问题就是薪资的格式是类似 7k-15k这种形式的数据, 这种形式难以通过数学化的方式分析, 所以我们需要做一下数据的清洗, 从7k-15k这种形式获取最低薪资, 最高薪资, 还有平均薪资, 平均薪资的计算方式是 (最低薪资 + 最高薪资 ) /2

image

这里处理薪资的做法是首先新加几个字段, 第一个字段bottomSalary表示最低薪资, topSalary表示最高信息, avgSalary表示平均薪资

然后通过excel的函数计算对应的值

bottomSalary的计算公式是 =LEFT(L2,FIND("-",L2)-2)

topSalary的计算公式是 =MID(L2,FIND("-",L2)+1,LEN(L2)-FIND("-",L2)-1)

avgSalary的计算公式是 =(M2+N2)/2

为了方便处理, 同时这是O列对应的数据的格式为数字, 小数位为0,

经过处理后数据如下所示

image

转载说明

转载请注明出处

作者:

作者: 璀璨者张健, 专注于爬虫, 数据分析, App/Web/小程序开发等领域

联系方式: QQ: 598694550, 微信 quietjolt

此处可以扫码关注我的公众号

image
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容