许久没有动笔总结自己的学习工作,近日偶然看复习了一下《数据结构》之中的线性表,发现自己连许多基本概念也已遗忘,不觉有些失落。自从本科毕业以后,虽然也学习了不少知识,但却从来都没有对相关知识进行归类总结,更没有相关的备份,以至想要把他们从遗忘的角落捡起都感到有些困难。再者,过去的老同学也一直希望我可以总结一些方法技巧,以便日后方便分享交流。也罢,许多事情不去着手去做肯定是不会有着落的,看来是时候开始写一些工作学习总结了。
现在工作了近一年,也有了一些知识库,比如数据分析与挖掘方面的,PM方面的(刚刚开始接触),计算机运维(工作需要,断断续续学了一些),网站与爬虫(为了获取数据小试身手),以及其他一些在工作之中总结的一些办公方法与小工具。从这篇文章开始我会通过写作的方式一点点整理相关知识库,与阅读的朋友一同分享相关总结!
初识数据分析
身处于数据时代需要有一定的数据分析能力,今天的内容就从我们接手最多的数据分析(挖掘)开始,在今后的一段时间我打算一点点分享这两年来接触的主要数据分析工具,所掌握的数据分析方法,我是如何接触数据分析工作的,以及我在平时工作之中的点点滴滴,作为刚刚步入工作岗位的新人,还希望阅读文章的朋友可以多多指教。
工作之中,我们一般会有一些通用的数据分析流程,具体设计操作之中也会针对具体业务的不同进行相应的调整。一般而言,数据分析工作除了需要我们掌握相关工具的使用技能,还需要我们具有其他一些相关方面的知识,比如基本的统计学知识,具体业务的行业知识背景,常用的业务监控指标,数据分析报告撰写的技巧,当然还有许多的知识需要在日常工作之中总结学习。
以上是我们在一般工作之中可能会接触到的一般流程,现在我们进入问题,一般的统计分析人员新中的数据分析会有哪些呢?
Excel函数,透视表,画图,设置需要精通VBA;
精美的PPT制作;
简单的描述性统计,描述现状;
数学,特别是高等数学用处不多;
编程是程序员的事......
以上是一般统计分析人员的认识,当然也是现在相当一部分数据分析师群体的现状。但单纯的excel电子表格真的可以满足日益组长的业务需求,日益增长的数据量吗?在数据时代,肯定会有更好的解决方案。我认为新时代的业务数据分析师还可以是一个数据分析(行业)专家的角色,他们可以
结合实际业务,运用数据解决问题;
掌握一定的专业知识,包括计算机与数学统计知识;
可以通过数据分析来为决策提供支持;
甚至是一个重要角色的扮演:对未来进行预测。
在现实之中,我们总是需要知道:我们的产品更新是否达到了预期效果?流量发生波动的原因,究竟该怎么去控制成本,如何去预测未来的流量、收入,或者是成本。带着目标去深入探索,总会有一些收获的。
数据分析,也就是进行数据的收集,整理,分析,并依据数据做出评估预测。
对数据分析有一个初步的认识,我们可以从3个角度入手:数据分析与数据挖掘,工作中的数据分析,数据分析的学习。
首先是分析与挖掘的区别与联系,数据分析,业务大于技术,分析更多的是在产品及业务部门,在互联网公司,分析师可能大部分时间都在和产品以及UI进行交流,做出业务的解读;而数据挖掘,技术开发的成色更多,不过分析往往是进一步挖掘的基础,一个好的挖掘工程师需要有优秀的分析能力。当然数据分析与数据挖掘还是有通用的知识(数学统计,业务理解)与工具(SQL)。
其次是工作之中的数据分析,我们需要掌握统计,概率知识,有些地方还需要一些数据挖掘知识,比如对不同推广方式的有效性进行检验(方差分析),对广告位或者推广价进行制定(回归分析),商品推荐(关联分析)......在工具上,excel,SPSS,Google analysis,R不一而足,能有效解决实际问题的就是好工具。当然逻辑思维,沟通表达与组织协调能力也是尤为重要的!
数据分析学习部分我们留着下一期再讲,谢谢大家!