一直在说大数据、数据分析、数据挖掘等。开始系统的学习下,学习笔记如下:
1、数据分析:用适当的统计分析方法将收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
2、数据分析的类别:描述性数据分析、探索性数据分析、验证性数据分型
描述性数据分析:初级数据分析,常见的方法有对比分析法、平均分析法和交叉分析法。
探索性数据分析:侧重于在数据分析中发现新的特征,常见的方法有相关分析、因子分析和回归分析等。
验证性数据分析:侧重于检验已有假设的真伪证明,常见的方法有相关分析、因子分子和回归分析等。
3、数据分析的作用:现状分析、原因分析和预测分析
现状分析:告诉你过去发生了什么。通过日常周报来完成,如日报、周报和月报等形式。
原因分析:告诉你某一现状为什么发生。通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。
预测分析:告诉你将来会发生什么。通过专题分析来完成,通常在制定企业制度、年度等计划时进行,其开展的频度没有现状分析和原因分析高。
所以,什么时候开展什么样的数据分析,需要根据你的需求和目的来制定。
4、数据分析六部曲:明确分析目的和思路---数据收集---数据处理---数据分析---数据展现---报告撰写。
明确分析目的和确定思路:明确分析目的之前先问问自己为什么要开展数据分析?通过这次数据分析我要解决什么问题?分析目的确定之后梳理分析思路,搭建分析框架。把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析、需要从哪几个角度进行分析,采用哪些分析指标。
数据收集:按照确定的数据分析框架,收集相关数据的过程。这儿的数据分为第一手数据为可直接获取的数据,第二手数据为加工整理后得到的数据。数据来源包括数据库、公开出版物,互联网和市场调查。
数据处理:对收集到的数据进行加工处理,形成适合数据分析的样式。基本目的是从大量的,杂乱无章,难以理解的数据中,提取并推导出对解决问题有价值、有意义的数据。包括数据清洗,数据转换、数据提取和数据计算。
数据分析:使用适当的数据分析方法和工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。数据分析与数据处理的区别:数据处理与数据分析的基础,如果数据本身存在错误,那么即使采用最先进的数据分析方法,得到的结果也是错误的,不具备任何参考价值,甚至还会误导决策。数据分析与数据挖掘的关系:数据挖掘是一种高级的数据分析方法。数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式和规律。
数据展现:数据通过表格和图形的方式来呈现。常见的数据图表包括饼图、柱形图、条形图、折线图、散点图和雷达图等,也可对这些图表进一步加工整理,变为我们需要的图形,金字塔图,矩阵图、漏斗图,帕累托图等。
报告撰写:数据分析报告是对整个数据分析过程的一个总结和呈现。通过报告把数据分析的起因、经过、结果和建议完整的表现出来,供决策者参考。
5、数据分析的三大误区
分析目的不明确,为分析而分析
缺乏业务知识,分析结果偏离实际
一味追求使用高级分析方法,热衷研究模型
6、数据分析常用指标和术语
平均数
绝对数和相对数
百分比与百分点
频数与频率
比例与比率
倍数与番数
同比与环比
7、数据分析师的职业发展
前景广阔!!!
8、数据分析师的职业要求
懂业务
懂管理
懂分析
懂工具
懂设计
9、数据分析师的基本素质
态度严谨负责
好奇心强烈
逻辑思维清洗
擅长模仿学习
勇于创新