基础篇(适用于初级数据分析师)
1)excel
关键知识点:excel基本函数(sumif,countif,left,rand等)、lookup(vlookup/hlookup),数据透视表
学习资源:《Excel高效办公:数据处理与分析》
2) sql
关键知识点:增删改查,特别是条件查询(where, group by, order by等)
学习资源:《SQL基础教程》
3)python
关键知识点:numpy,pandas,matplotib,seaborn包的熟练使用
注意,python可以干的事儿太多了,从web开发到算法模型,瞄准你的目标-数据分析,专注学这几个包就可以了
学习资源:《利用python进行数据分析》,主讲numpy和pandas用法,浏览一遍,用作工具书
4)数据可视化
商业数据可视化软件:比较好用的有PowerBI、FineBI、Tableau等
Python数据可视化:matplotlib数据可视化、saeborn数据可视化、pyecharts数据可视化
学习资源:《人人都是数据分析师》,主要介绍了Tableau的核心功能;
5)统计学
关键知识点:概率论、假设检验、分布(泊松、二项、正态等)、统计抽样等
学习资源:《深入浅出统计学》比较适合小白入门,书很厚,别怕,都是图
6)分析思维是数据分析师最最核心的竞争力,上面所学习的python、sql、机器学习知识等都是在工具层面,要想使用好他们,还需要分析思维的驾驭。对于分析思维的学习,我建议新人也是从读书开始,比较推荐的书:
数据分析类
《谁说菜鸟不会数据分析》、《精益数据分析》、《增长黑客》、《数据挖掘与数据化运营实战 思路、方法、技巧与应用》
产品思维类
如果是想要从事互联网行业的数据分析师的话,产品思维也是必须要具备的,面试考察点之一,推荐《从点子到产品:产品经理的价值观与方法论》、《俞军产品方法论》、《产品思维》
逻辑思维类
在面试中逻辑清晰的回答面试官的问题,会为你大大的加分,推荐《金字塔原理》、《学会提问》、《麦肯锡思维》
进阶篇(适用于中高级数据分析师、数据挖掘工程师)
1)数学知识
关键知识点:线性代数:线性代数:矩阵运算,矩阵特征(秩、迹、特征值特征矩阵、相似矩阵、正定矩阵、逆矩阵、非奇异、行列式)、线性相关,向量空间,向量范数,矩阵范数,最小二乘法,最大似然估计
微分:极限,导数,偏导数,泰勒展开,梯度下降法,牛顿法
凸优化:基本概念(凸集合,凸函数,上境图,凸组合,凸包),凸优化(拉格朗日对偶性,对偶问题,KKT条件,拉格朗日乘数法)
2)数据挖掘算法
关键知识点:分类、回归、聚类、关联规则挖掘、降维等
学习资源:
《统计学习方法》经典,主讲分类算法,偏理论推导
《机器学习实战》过瘾,对着《统计学习方法》来一套,保证你对理论明明白白
《机器学习》周志华老师的,也是经典
3)网络爬虫、SPSS、SAS、R语言等
学习资源:《SPSS统计分析基础教程》、《问卷数据分析-破解SPSS的六类分析思路》、《R语言实战》
4)网络爬虫、SPSS、SAS、R语言等
行业学习书籍篇
1.零售/电商类:《数据化管理:洞悉零售及电子商务运营》
2.游戏类:《游戏数据分析实战》
3.网站/广告优化:《网站分析实战》
4.咨询类:《活用数据:驱动业务的数据分析实战》
5.人力资源:《人力资源与大数据分析》
6.数据产品:《数据产品经理修炼手册》
7.金融:《消费金融真经》
8.增长黑客:《首席增长官》、《硅谷增长黑客:实战笔记》
9.管理类:《第五项修炼:学习型组织的艺术与实践》、《高效能人士的七个习惯》