文章来源:成都科多大数据
作为数据分析的小白初学者,在开始正式学数据分析前,肯定都想先看看别人学习的经验。我的大概情况是,目前研二通信专业,本科专业测控,由于种种原因,对数据分析比较感兴趣,于是开始了独自摸索过程,这里总结我自学数据分析2个多月的经历。希望能给后面的初学者带来一些启发。
一、数据分析师的方向
先选择了正确的方向,再朝着这个方向努力是学习一个新领域的正确姿势,因此开始正式学习前,我首先查阅了大量资料,了解数据分析分为哪些方向,并明确自己想往哪个方向走。
1.数据分析的方向分类
数据分析可分为两类:一种偏向产品和运营,更加注重业务,主要工作包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等;另一种则更注重数据挖掘技术,门槛较高,需要扎实的算法能力和代码能力。(总结了@路人甲大神的说法)
2.数据分析的行业分类
1)互联网行业是数据分析应用最广的行业,是数据分析师理想的成长平台。
2)其次是咨询公司。相对来说,数据分析师在咨询公司成长的速度更快,专业也会更全面。3)再次是
3)金融行业,比如银行和证券等行业,该行业对数据分析的依赖需求,越来越大。4)最后是
4)电信行业,(移动、联通和电信),它们拥有海量的数据,在严峻的竞争下,也越来越重视数据分析,但进入这些公司的门槛比较高。
3.确定自己的方向由上可知数据分析大致分为两类:偏重业务和偏技术路线的,明显偏技术路线是很难速成的,鉴于我今年9月份要开始校招找工作,且自己对产品向很感兴趣,因而我选择了更偏向业务的数据分析。此外,自己最感兴趣的行业是互联网。
基于以上确定了我的最理想职位:互联网公司的偏向业务的数据分析。
此外,为了了解公司对该职位的最新要求,招聘数据分析实习生的互联网公司我都进行了网申,我知道以自己两个月所学还不能满足职位要求,只是为了做了一下笔试题,从而了解公司的数据分析到底偏重哪些技能,并进行有针对性的了解相应的知识。(目前我做过了阿里、京东、美团的数据分析实习生的笔试题,觉得这是个了解公司数据分析岗位最新要求的有效方法)
二.我是如何学习的?
结合公司的招聘要求,我是按照以下几个部分进行学习的:
1.统计学学习。
统计学是数据分析的基础,因而我选择从这个开始学习。
已有基础:大学我学过概率论统计学这门课,学的还不错。
看完书籍:《深入浅出统计学》、《从零进阶!数据分析的统计基础》
花费时间:共计11天每天上午3个小时,一共33个小时。
推荐书籍:《从零进阶!数据分析的统计基础》
推荐理由:
前面很多高赞答案推荐《深入浅出统计学》,因而开始的时候我选用的这本,已将整本书看完,感觉重点不够突出,太过啰嗦以至于浪费时间,逻辑不是很连贯,尤其是假设检验那一章写的太绕了,后来又入手看完了《从零进阶!数据分析的统计基础》这本书,这本书每一节有相应的少量习题和配套答案可巩固,逻辑和重点都非常清晰,有了对比之后,强烈建议和我一样的小白初学者使用《从零进阶!数据分析的统计基础》这本书!
知识巩固:每看完一章,我都会进行总结梳理一章的内容,这样可以让知识结构化;此外,由于统计学有很多概念,都很生涩,为了加深印象,我列出了很多诸如置信水平、区间估计、假设检验、P值等概念,做成了几张图片,偶尔就给同学发过去,让她随机挑选一个,然后我再用通俗的语言给她解释下这个是什么东西。(这样做的好处既能加深自己的印象,又能模拟面试官的提问。一举两得。)
2. EXEL看完书籍:《谁说菜鸟不会数据分析》
共计时间:这个相对来说不怎么耗费脑子,而且鼓捣图表比较好玩,很有成就感。因而我是每天吃完下午饭后进行学习Excel,因为这个时候我的学习效率相对较低(比较高效的时间段,我用来学习Python)。EXcel学习共计13天,每天晚上7点到9点2个小时,共计26个小时。
读完感受:这本书不错,内容比较详细,且书中介绍了数据分析的一些常见方法,并重点介绍了EXEL的数据透视表,函数,各类图表适用场景及如何制作的内容,自己感觉比较适合我们初学者,可以先根据这本书学习EXEL。
巩固提升:由于菜鸟这本书对函数部分设计的比较少,所以我又跟着大神的专栏进行了学习,感觉这几篇文章整理的很好,所以在此列出。
第一篇数据分析—函数篇。主要简单讲解常用的函数,以及与之对应的SQL/Python函数。第二篇数据分析—技巧篇。主要简单讲解很有新价比的功能,提高工作效率。第三篇数据分析—实战篇。主要将前两篇的内容以实战方式进行,简单地进行了一次数据分析。数据源采用了真实的爬虫数据,是5000行数据分析师岗位数据。
碎片化学习
3.数据库
数据库基础
学习网站:基础知识我是跟着最多人推荐的这个网站学习的:SQL教程_w3cschool
个人感觉:这个教程条理清晰,比较适合我们小白初学者。
共计时间:查看了我的时间表,算了一下数据库基础知识部分,我一共花了30个小时
左右,感觉数据库还是比较容易上手的,不是很难,所以你们不要怕哈~
刷题:基础教程学完后,我用了这两套题刷题:
SQL练习题及答案(连接写法)
SQL练习题及答案(多次子查询)
因为基础知识跟着网站学习的时候,我学的比较粗糙,刷题才发现有很多知识漏点,所以又返回去查缺补漏,因而刷题时间耗费的时间很长,用了大概20多个小时。
强烈建议:学完数据库基础知识后一定要刷至少一套题,刷完后你会发现对数据库的理解深入了很多,然后那几天我睡觉的时候满脑子都是select......
4.业务学习
推荐书籍:《精益数据分析》、《增长黑客》、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》
个人感觉:学习一样新东西,不断感受它的有趣性才是持久性动力。所以我一般是看Python代码看烦了的时候,就会看一下这三本书,感受一下数据对运营和用户的作用,真的很有趣。由于都是利用这些碎时间看的,所以这三本书目前还没看完,但就目前所看,我觉得都很好,尤其是增长黑客附录里给了一些数据常用指标,很有用。至于《深入浅出数据分析》这本书,我看了两章之后放弃了,还是觉得太啰嗦了(仅是个人见解),因而没有读下去,可能我不太适合这种从大量言语中找重点的书籍。
碎片化学习:要了解公司是如何运营,产品是如何开发的,这些需要不断地积累和广泛的阅读。所以我利用自己玩手机的时间来训练这些思维,我关注了“互联网周刊”、“人人都是产品经理”、“逻辑思维”
这几个微信公众号(我认为这几个都很不错) ,偶尔在不想学习,玩手机的时候会看一下这几个的推送文章,但不是看完就算了,比如“人人都是产品经理”前一段时间推了一篇文章《美团和滴滴的战争,饿了么如何选择?》,我会先尝试着思考一下自己的答案,然后再看下文章里传达的看法,看完之后我会再试着从多角度去思考这个问题,并在去食堂吃饭的路上和同学讨论下这个问题,阐述下自己的看法。(真的觉得向别人讲述才是成长的最大利器!)
此外,我关注了喜马拉雅FM听书电台APP的PMCAFF产品社区专辑,这里面是每天解答一个围绕关于产品和运营的小问题,我列几个我有印象的:“微信消息为什么没有已读未读的提示?”、“微信和支付宝为什么一直没有加入启动页广告呢?”、“继短视频后,下一个流量风口会是什么?”,每个都很简短,只有3分钟到4分钟左右,非常简短又有趣,每天晚上睡觉前,趟床上睡不着的时候,我会选择听一个,感觉对我关于产品和运营的认识有很大提高。
5.Python学习
使用工具:Anaconda+Pycharm(或者Spyder也很好用)
如果还没有开始Python工具下载的初学者,切记不要直接装Python,推荐直接装Anaconda搭建起来的科学环境要方便很多。建议安装Anaconda+Pycharm来学习Python,尤其是对于学习数据分析的同学。(多次入坑的血泪之谈,避免很多麻烦啊!)
安装教程:和大多初学者一样,我在纠结于安装什么样的IDE,以及怎样安装上浪费了很长时间,终于安装成功。这其中差点在安装过程的繁琐中就放弃了学习,因而我写下了我的安装过程,非常详细,细致到了每一步安装过程的截图,希望能让后面的初学者不在安装上面浪费时间。
Python学习之工具准备——Anaconda+Pycharm的安装过程
学习网站:廖雪峰的Python3教程
学完感受:觉得整体都很好,比较适合我们小白学习,但是个别知识不够结构化,比如列表、元祖、字典、集合这几个知识点太分散了,我觉得放在一起学习讲述它们的联系与区别比较好。刚学完这几个,我全都混淆了,所以立马搜索了一下这几个相关知识,发现有人网上有博主总结的很好,立马清晰了很多。所以,这里我想说,不要单一靠一个学习资源(但前提是只以一个为主),遇到没搞懂的,立马百度补充。
进阶补充:由于数据分析需要熟悉Numpy、Pandas、Scrip、Matplotlib等常用的包,而廖老师的网站中缺乏这部分的内容,所以学完基础Python后,包的学习我是跟着一个视频学习的,目前刚进入这阶段的学习,所以无法提供什么有效信息,待我学完这部分,我再来评价吧。
6.基础算法和图表可视化
这两部分目前也还没开始学习,所以也无法提供有效信息。
三.最后的建议
1.时间管理
为了敦促自己的学习,我做了一个Excel时间管理表,其中包含了周计划和月计划,并记录了每天的进程,我觉得这个方法对我来说很有效,所以推荐给你们。
2. 碎片化学习
Python、统计学之类的还是要系统化学习,毕竟让我在等公交的时间看一个Python代码或者算一个概率题,我可能想打人!!。 但运营和产品等业务知识,还是可以利用我们的零碎时间来不断积累,其实只要将平时刷娱乐新闻的时间换成互联网消息就可以了,习惯了之后会发现,这些知识真的更有趣!
作为一个小白,讲述了自己这两个多月的学习历程,可能会有错误,仅供参考,非常感谢!想知道自己是不是适合做大数据,做套测试题验证一下吧!https://www.101test.com/cand/index?paperId=21VNJU