何谓数据分析
数据:也称观测值,是通过实验测量、观察、调查等方式获取的结果,常常以数量的形式展现出来
问:通过这些数据我们可以得到什么❓
答:我们可以将隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律——这个就是数据分析:数据分析能够帮助管理者进行判断和决策,以便制定适当策略与采取相应的行动。
举个🌰:企业的高层希望通过市场分析和研究,把握产品的市场发展和动向从而制定合理的产品研发和销售计划
备注:我们常说的数据分析是狭义的数据分析
狭义——数据分析
定义:根据分析目的,用适当的分析方法及工具,对数据进行处理和分析,提取有价值的信息,形成有效结论的过程
作用:主要三大作用——现状分析,原因分析,预测分析
方法:主要方法——对比分析、分组分析、结构分析、分布分析、交叉分析、矩阵分析、回归分析等常见分析方法
结果:数据分析一般都是得到一个指标统计量的结果,如总和,平均值、计数等,这些指标数据都需要与业务结合进行解读,才能发挥出数据的价值与作用
数据挖掘
定义:从大量数据中,通过统计学,机器学习,数据可视化方法,挖掘出未知但有价值的信息和知识的过程
作用:侧重解决四类问题——分类、聚类、关联和预测,数据挖掘的重点在于寻找未知的模式与规律(举个🌰:🍺和尿布)
方法:主要采用决策树、神经网络、关联规则、聚类分析、时间序列分析等统计学、及其学习等高级分析方法进行挖掘
结果:输出模型或规则,同时计算出模型得分或标签。模型得分如流失概率值,综合得分,相似度,预测值等,标签如流失与非流失,高中低价值用户、信用的优良中差等
数据分析的流程
1.1 明确分析目的:任何事情都要有一个目的,目标,整体事情的执行方向要确认,否则在后期数据处理的过程中容易迷失自己,觉的这个可以分析,那个也可以分析,结果到头来什么都没有分析出来。记住这句话:
一切都是以解决问题为中❤
1.2 明确分析思路:基于目的,开始梳理分析思路,搭建分析框架,同时要确保分析框架的体系化,使分析结果具有说服力
体系化——有逻辑,逻辑可自洽,开始的时候可能速度会慢一些,但坚持梳理多问自己”为什么“,逻辑性就会不断提升。此外,分析框架要结合实际业务,针对各个业务有相关的专业模型,这个模型在于日常积累,在你没有其他更好的方法,方法论很重要,比如
营销方面:4P,用户行为,STP理论,SWOT等
管理方法:PEST,5W2H,时间管理,生命周期,逻辑树,金字塔,SMART原则等
2 数据收集:
数据源:数据库,公开出版物,互联网,市场调查
3 数据处理
数据清洗——数据合并——数据抽取——数据计算——数据转换等
4 数据分析
分析方法+分析工具(Excel SPSS R Python等)
5 数据展现
谨记:图>表>文字,根据分析目的选择合适的图(下面的图也是看简书过程中看到的,觉得很好,放在这里供大家学习)
6 报告撰写
数据分析报告是对整个数据分析过程的一个总结与呈现,没有结论的数据分析不是好的数据分析。
数据分析的三大误区
默念 3遍:业务为王
1.分析目的不明确,为分析而分析
2.缺乏业务知识,分析结果偏离实际
3.一味追求实用高级分析方法,热衷于研究模型
数据分析师的要求
几个常用指标和术语
相对数=比较数值(比数)基础数值(基数)
百分点:不同时期以百分数的形式表示的相对指标的变动幅度
比例:总体中各部分的数值占全部数值的比重,通常反应总体的构成和结构
比率:不同类别数值的对比,整体中各部分直接的关系
番数:原来数量的2的N次方倍
同比:与历史同期进行比较得到的数值
环比:前一个统计周期进行比较得到的数值