Excel 数据分析

Excel数据可视化

本文主要记录使用Excel进行数据分析,所使用的数据时一份招聘网站Excel

数据分析步骤


明确问题

Q1 哪些城市的工作机会更多?
Q2 各城市的平均薪资情况?
Q3 工作经验对工资的影响程度
Q4 数据分析工作对工作经验的要求以及主要分布

一、理解数据
采集到的数据别急切计算,先观察数据
共14个字段信息包括:
城市、公司全名、公司ID、公司简称、
公司大小、公司所在商区、职位所属 、
教育要求、公司所属领域 、职位ID、
职位福利、职位名称、薪水、工作年限要求

二、数据清洗
对字段数据进行初步清洗。公司ID和职位ID是数据的唯一标示,公司全名和公司简称则重复了,只需要留一个公司名称,后续的字段信息看需求是否保留。
删除重复值
本文分析的是数据分析职位多少,所以职位ID作为处理重复值的标示


通过条件格式选择重复值,标记重复值为浅红色,自定义排序查看重复值。


通过选择数据中的删除重复值,记得点扩展全表。

检查数据是否存在重复值,通过筛选工具,发现按颜色筛选是不可选的,说明重复值全部删除。

缺失值处理
数据的缺失值很大程度上影响分析结果。在Excel中可以通过选取该列查看右下角的计数,以此判别有无缺失。


城市字段的缺失值数量 = 职位ID字段数量减去城市字段总数



通过定位条件选择空值,输入上海同时按住Ctrl+Enter,完成输入。

数据拆分排列
根据薪水列,创建出新的三列数据,分别为最低工资、最高工资、平均工资,并按降序,从大到小排列,方便后续分析。

=INT(LEFT(H2,FIND("k",H2)-1))  --最低工资
=INT(MID(H2,FIND("-",H2)+1,LEN(H2)-FIND("-",H2)-1)) --最高工资
=AVERAGE(K2:L2) --平均工资


异常值处理和数据一致化
职位名称分类出千奇百怪,我们目标是数据分析师,只筛选出带有“数据分析”、“数据运营”、“分析师”等关键词的职位名称。

=IF(COUNT(FIND({"数据分析","数据处理","分析师"},G2)),"是","否")


然后把的数据筛选出来,复制粘贴到新表格中,重命名为数据清洁结果。

三、数据分析与可视化
创建数据透视表


Q1 哪些城市的工作机会更多?


城市为行字段,值为职位ID,降序排列处理

分析:
通过观察数据可以得出结论,数据分析岗位数量排名前四的是北京、上海、深圳、广州。

其中北京岗位数量远超第二名上海,所以北京的数据分析岗位需求属于全国最高,数据分析岗位在北上广深占据大部分。

Q2 各城市的平均薪资情况?
利用描述性分析,得到下表


数据透视表得到各个城市平均工资

分析:
从以上数据表和柱形图得出结论,统计5031个数据,其中数据分析师薪水均值为17K,中位数:15K,众数:15K,平均薪水排名前3的城市是北京、深圳、上海。

Q3 工作经验对工资的影响程度
数据透视表与折线图


分析:
从上表数据与折线图可以得出结论,数据分析师薪水随着工作年限的降低而降低,工作年限可以分为6个阶段,最低的应届毕业生平均薪水6.23K,工作1-3和3-5年平均薪水在12-17K的水平,5-10年及以上的达到20-30K的水平。

Q4 数据分析工作对工作经验的要求以及主要分布
数据透视表与饼形图



分析:
1-3年和3-5年工作年限要求占大部分,比较具有代表性,两者占比加总为68%。说明数据分析师招聘要求主要分布在1-5年的范围内。

分布报告
Q1 哪些城市的工作机会更多?
通过观察数据可以得出结论,数据分析岗位数量排名前四的是北京、上海、深圳、广州
其中北京岗位数量远超第二名上海,所以北京的数据分析岗位需求属于全国最高,数据分析岗位在北上广深占据大部分。

Q2 各城市的平均薪资情况?
统计5031个数据,其中数据分析师薪水均值为17K,中位数:15K,众数:15K,平均薪水排名前3的城市是北京、深圳、上海

Q3 工作经验对工资的影响程度
数据分析师薪水随着工作年限的降低而降低,工作年限可以分为6个阶段,最低的应届毕业生平均薪水6.23K,工作1-3和3-5年平均薪水在12-17K的水平,5-10年及以上的达到20-30K的水平。

Q4 数据分析工作对工作经验的要求以及主要分布
1-3年和3-5年工作年限要求占大部分,比较具有代表性,两者占比加总为68%。说明数据分析师招聘要求主要分布在1-5年的范围内

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容