大家好,我是计算机白痴娜。o(〃'▽'〃)o
大概三四个月前的某个晚上,娜娜酱我正瘫在沙发上美滋滋地玩着手机听着歌,忽然心头一紧:为什么网易云音乐的每日推荐歌单这么了解我的喜好?然而我却对这些每天推荐我们听什么、看什么、吃什么、买什么的App背后的数据世界一无所知?这个“想要在数据和算法的海洋里荡漾”的想法是如此强烈,以至于我最终竟然一步步走上了自学数据分析的歧途……
可我只会重启试试啊!(☄⊙ω⊙)☄
不过这怎么难得倒我足智多谋娜某人,一波花式搜索之后,果然搜到了一堆关于如何零基础自学数据分析的文章,但是定睛一看:滚呐 (っ °Д °;)っ!人家根本就不是零基础好吗!要不就是有计算机背景,会Java/C/C++等等各种我连名字都拼不起的语言,要不就是统计学出身的学霸,甚至还有正在读Data Analysis专业的大神推荐了一大波数据分析师必读书……(惊慌失措娜娜酱.jpg)
1.作为还没有过来的过来人给小伙伴们做个心理建设吧:
怎么说呢,一个坑都不想踩,半米弯路都不想走,指望顺着别人的经验从原点笔直地抵达终点的好事是不存在的,最重要的是赶紧开始and投入时间,前期什么都搜一点看一点学一点,过段时间差不多就摸到适合自己的路子了。就像很多人纠结做数据分析到底用R还是用Python,不知道选哪个所以迟迟无法开始怎么办?都去尝试一下啊!!不约出来了解一下怎么知道自己到底喜欢哪个姑娘呢!!这里没有任何编程基础的娜酱都学了一下发现python更好上手所以最终决定学python。事实上这两个工具各有利弊,大神们已经分析出一大堆了不赘述了,选自己喜欢的。
2.心理建设的差不多了,可以开始入门了,但是学什么以及怎么学呢?
目标导向,想做个数据分析师,有两个基础很重要:行业业务sense和分析技能。行业经验没办法,这也不是朝夕之间直接能学会的东西,所以主要还是学分析技能,这里又有两方面:一方面是统计知识基础,另一方面是数据分析技能(Excel/SAS/SQL/Python/R等等)。两个方面的学习可以同时开始。
对于像我这样耐性很渣的小伙伴来说,入门着实不推荐看书自学,生活已经好艰难了,我们就不要逼自己做这种很难坚持的事情了。ಠ_ಠ
(1)统计学基础:现在网络课程平台很多,统计学基础知识随便哪个平台上的数理统计课程作为入门就好。以后用到什么再有针对性的补充。推荐两个:
老师讲解很细致很扎实,统计部分结合了如何用python实现
Coursera:Basic Statistics,University of Amsterdam
举例非常生动,缺点是需要科学上网,并且对英语有一点点要求
(2.1)SQL:
w3schools.com(大概过了一遍基本的语句,熟悉一下操作)
(2.2)Python:
Coursera: Python for Everybody,University of Michigan
这是Coursera的专项课程,一共五门,前两门可以作为入门,缺点还是需要科学上网
用Python语言进行数据分析就一定会接触到NumPy。NumPy是支持Python语言的数值计算扩充库,其拥有强大的高维度数组处理与矩阵运算能力。
实验楼:Pandas 使用教程 & 实验楼:Pandas百题大冲关
了解了NumPy之后接下来就可以学习更强大的Pandas了,Pandas是基于NumPy的数据处理工具,我们可以通过它完成对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas拥有强大的缺失数据处理与数据透视功能,是数据预处理中的必备利器。
Matplotlib是支持Python语言的开源绘图库,支持丰富的绘图类型,有着简单的绘图方式以及完善的接口文档。过程分析中出图基本都靠Matplotlib了。
以上推荐都是免费就可以学习到的内容,为了对钱包稍微狠心一点娜娜选择了网易云课堂的数据分析师(python)微专业,主要是感觉这样一整套学比较系统,算是花钱买时间了,目前还在打怪升级中~另外DataCamp也很推荐~最后,给不看书不舒服斯基的小伙伴推荐这一本书:《利用Python进行数据分析》。这本书可以说是数据分析入门必读书,主要介绍了Python的3个库Numpy(数组),Pandas(数据分析)和Matplotlib(绘图)。目前国内的中文版的代码是基于Python2.7的,有些代码已经不能运行了。英文版的已经更新为3.0了,所以有条件建议看英文版。(如果有需要的话可以私下找我分享那个啥)
学完这几部分内容,娜姐我这就算是从数据幼儿园通关了!暂时还没有摔门!分享一点小小的心得:不要有做事必须完美无缺的强迫症,不需要在小细节上一直纠结浪费时间,要记得重点是把这一套知识结构搭起来,后面缺了东西查漏补缺就好,放松~也许前面不会的东西看到后面自然而然就解决了呢。后续娜娜酱会把自己在微专业上做过的一些小作业分享出来,请期待~
这是零基础入门数据分析系列的第一篇,可能你也会对《数据分析,从入门到放弃》感兴趣。