大数据技术学习

文章来源:成都科多大数据

作为数据分析的小白初学者,在开始正式学数据分析前,肯定都想先看看别人学习的经验。我的大概情况是,目前研二通信专业,本科专业测控,由于种种原因,对数据分析比较感兴趣,于是开始了独自摸索过程,这里总结我自学数据分析2个多月的经历。希望能给后面的初学者带来一些启发。

一、数据分析师的方向

  先选择了正确的方向,再朝着这个方向努力是学习一个新领域的正确姿势,因此开始正式学习前,我首先查阅了大量资料,了解数据分析分为哪些方向,并明确自己想往哪个方向走。

1.数据分析的方向分类

  数据分析可分为两类:一种偏向产品和运营,更加注重业务,主要工作包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等;另一种则更注重数据挖掘技术,门槛较高,需要扎实的算法能力和代码能力。(总结了@路人甲大神的说法)

2.数据分析的行业分类

1)互联网行业是数据分析应用最广的行业,是数据分析师理想的成长平台。

2)其次是咨询公司。相对来说,数据分析师在咨询公司成长的速度更快,专业也会更全面。3)再次是

3)金融行业,比如银行和证券等行业,该行业对数据分析的依赖需求,越来越大。4)最后是

4)电信行业,(移动、联通和电信),它们拥有海量的数据,在严峻的竞争下,也越来越重视数据分析,但进入这些公司的门槛比较高。

3.确定自己的方向由上可知数据分析大致分为两类:偏重业务和偏技术路线的,明显偏技术路线是很难速成的,鉴于我今年9月份要开始校招找工作,且自己对产品向很感兴趣,因而我选择了更偏向业务的数据分析。此外,自己最感兴趣的行业是互联网。

  基于以上确定了我的最理想职位:互联网公司的偏向业务的数据分析。

 此外,为了了解公司对该职位的最新要求,招聘数据分析实习生的互联网公司我都进行了网申,我知道以自己两个月所学还不能满足职位要求,只是为了做了一下笔试题,从而了解公司的数据分析到底偏重哪些技能,并进行有针对性的了解相应的知识。(目前我做过了阿里、京东、美团的数据分析实习生的笔试题,觉得这是个了解公司数据分析岗位最新要求的有效方法

二.我是如何学习的?

结合公司的招聘要求,我是按照以下几个部分进行学习的:

1.统计学学习。

统计学是数据分析的基础,因而我选择从这个开始学习。

已有基础:大学我学过概率论统计学这门课,学的还不错。

看完书籍:《深入浅出统计学》、《从零进阶!数据分析的统计基础》

花费时间:共计11天每天上午3个小时,一共33个小时。

推荐书籍:《从零进阶!数据分析的统计基础》

推荐理由:

前面很多高赞答案推荐《深入浅出统计学》,因而开始的时候我选用的这本,已将整本书看完,感觉重点不够突出,太过啰嗦以至于浪费时间,逻辑不是很连贯,尤其是假设检验那一章写的太绕了,后来又入手看完了《从零进阶!数据分析的统计基础》这本书,这本书每一节有相应的少量习题和配套答案可巩固,逻辑和重点都非常清晰,有了对比之后,强烈建议和我一样的小白初学者使用《从零进阶!数据分析的统计基础》这本书!

知识巩固:每看完一章,我都会进行总结梳理一章的内容,这样可以让知识结构化;此外,由于统计学有很多概念,都很生涩,为了加深印象,我列出了很多诸如置信水平、区间估计、假设检验、P值等概念,做成了几张图片,偶尔就给同学发过去,让她随机挑选一个,然后我再用通俗的语言给她解释下这个是什么东西。(这样做的好处既能加深自己的印象,又能模拟面试官的提问。一举两得。)

2. EXEL看完书籍:《谁说菜鸟不会数据分析》

共计时间:这个相对来说不怎么耗费脑子,而且鼓捣图表比较好玩,很有成就感。因而我是每天吃完下午饭后进行学习Excel,因为这个时候我的学习效率相对较低(比较高效的时间段,我用来学习Python)。EXcel学习共计13天,每天晚上7点到9点2个小时,共计26个小时

读完感受:这本书不错,内容比较详细,且书中介绍了数据分析的一些常见方法,并重点介绍了EXEL的数据透视表,函数,各类图表适用场景及如何制作的内容,自己感觉比较适合我们初学者,可以先根据这本书学习EXEL。

巩固提升:由于菜鸟这本书对函数部分设计的比较少,所以我又跟着大神的专栏进行了学习,感觉这几篇文章整理的很好,所以在此列出。

第一篇数据分析—函数篇。主要简单讲解常用的函数,以及与之对应的SQL/Python函数。第二篇数据分析—技巧篇。主要简单讲解很有新价比的功能,提高工作效率。第三篇数据分析—实战篇。主要将前两篇的内容以实战方式进行,简单地进行了一次数据分析。数据源采用了真实的爬虫数据,是5000行数据分析师岗位数据。

碎片化学习

3.数据库

数据库基础

学习网站:基础知识我是跟着最多人推荐的这个网站学习的:SQL教程_w3cschool

个人感觉:这个教程条理清晰,比较适合我们小白初学者。

共计时间:查看了我的时间表,算了一下数据库基础知识部分,我一共花了30个小时

左右,感觉数据库还是比较容易上手的,不是很难,所以你们不要怕哈~

刷题:基础教程学完后,我用了这两套题刷题:

SQL练习题及答案(连接写法)

SQL练习题及答案(多次子查询)

因为基础知识跟着网站学习的时候,我学的比较粗糙,刷题才发现有很多知识漏点,所以又返回去查缺补漏,因而刷题时间耗费的时间很长,用了大概20多个小时

强烈建议:学完数据库基础知识后一定要刷至少一套题,刷完后你会发现对数据库的理解深入了很多,然后那几天我睡觉的时候满脑子都是select......

4.业务学习

推荐书籍:《精益数据分析》、《增长黑客》、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》

个人感觉:学习一样新东西,不断感受它的有趣性才是持久性动力。所以我一般是看Python代码看烦了的时候,就会看一下这三本书,感受一下数据对运营和用户的作用,真的很有趣。由于都是利用这些碎时间看的,所以这三本书目前还没看完,但就目前所看,我觉得都很好,尤其是增长黑客附录里给了一些数据常用指标,很有用。至于《深入浅出数据分析》这本书,我看了两章之后放弃了,还是觉得太啰嗦了(仅是个人见解),因而没有读下去,可能我不太适合这种从大量言语中找重点的书籍。

碎片化学习:要了解公司是如何运营,产品是如何开发的,这些需要不断地积累和广泛的阅读。所以我利用自己玩手机的时间来训练这些思维,我关注了“互联网周刊”、“人人都是产品经理”、“逻辑思维”

这几个微信公众号(我认为这几个都很不错) ,偶尔在不想学习,玩手机的时候会看一下这几个的推送文章,但不是看完就算了,比如“人人都是产品经理”前一段时间推了一篇文章《美团和滴滴的战争,饿了么如何选择?》,我会先尝试着思考一下自己的答案,然后再看下文章里传达的看法,看完之后我会再试着从多角度去思考这个问题,并在去食堂吃饭的路上和同学讨论下这个问题,阐述下自己的看法。(真的觉得向别人讲述才是成长的最大利器!)

此外,我关注了喜马拉雅FM听书电台APP的PMCAFF产品社区专辑,这里面是每天解答一个围绕关于产品和运营的小问题,我列几个我有印象的:“微信消息为什么没有已读未读的提示?”、“微信和支付宝为什么一直没有加入启动页广告呢?”、“继短视频后,下一个流量风口会是什么?”,每个都很简短,只有3分钟到4分钟左右,非常简短又有趣,每天晚上睡觉前,趟床上睡不着的时候,我会选择听一个,感觉对我关于产品和运营的认识有很大提高。

5.Python学习

使用工具:Anaconda+Pycharm(或者Spyder也很好用)

如果还没有开始Python工具下载的初学者,切记不要直接装Python,推荐直接装Anaconda搭建起来的科学环境要方便很多。建议安装Anaconda+Pycharm来学习Python,尤其是对于学习数据分析的同学。(多次入坑的血泪之谈,避免很多麻烦啊!)

安装教程:和大多初学者一样,我在纠结于安装什么样的IDE,以及怎样安装上浪费了很长时间,终于安装成功。这其中差点在安装过程的繁琐中就放弃了学习,因而我写下了我的安装过程,非常详细,细致到了每一步安装过程的截图,希望能让后面的初学者不在安装上面浪费时间。

Python学习之工具准备——Anaconda+Pycharm的安装过程

学习网站:廖雪峰的Python3教程

学完感受:觉得整体都很好,比较适合我们小白学习,但是个别知识不够结构化,比如列表、元祖、字典、集合这几个知识点太分散了,我觉得放在一起学习讲述它们的联系与区别比较好。刚学完这几个,我全都混淆了,所以立马搜索了一下这几个相关知识,发现有人网上有博主总结的很好,立马清晰了很多。所以,这里我想说,不要单一靠一个学习资源(但前提是只以一个为主),遇到没搞懂的,立马百度补充。

进阶补充:由于数据分析需要熟悉Numpy、Pandas、Scrip、Matplotlib等常用的包,而廖老师的网站中缺乏这部分的内容,所以学完基础Python后,包的学习我是跟着一个视频学习的,目前刚进入这阶段的学习,所以无法提供什么有效信息,待我学完这部分,我再来评价吧。

6.基础算法和图表可视化

这两部分目前也还没开始学习,所以也无法提供有效信息。

三.最后的建议

1.时间管理

为了敦促自己的学习,我做了一个Excel时间管理表,其中包含了周计划和月计划,并记录了每天的进程,我觉得这个方法对我来说很有效,所以推荐给你们。

2. 碎片化学习

Python、统计学之类的还是要系统化学习,毕竟让我在等公交的时间看一个Python代码或者算一个概率题,我可能想打人!!。 但运营和产品等业务知识,还是可以利用我们的零碎时间来不断积累,其实只要将平时刷娱乐新闻的时间换成互联网消息就可以了,习惯了之后会发现,这些知识真的更有趣!

作为一个小白,讲述了自己这两个多月的学习历程,可能会有错误,仅供参考,非常感谢!想知道自己是不是适合做大数据,做套测试题验证一下吧!https://www.101test.com/cand/index?paperId=21VNJU

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容