数据分析
第一章 · 基本概念
什么是数据分析?
数据分析是指选用适当的统计分析方法,找到目标对象并进行分析,提取有用信息进行研究并形成结论的过程。
关键词
选用适当的统计分析方法 根据实际分析需求选用适当的统计分析方法
目标对象 根据统计分析方法确定目标对象
进行分析 保证过程的准确性
提取有用信息 排除干扰与无用信息,提取有用信息
深入研究 深入分析与研究
形成结论 弄清楚“说明了什么问题”
流程
选方法 --> 定对象 --> 做分析 --> 取信息 --> 细研究 --> 下结论
为什么要做数据分析?
C端思维
得到新用户
维护老用户
增加收益
B端思维
提高工作效率
提升用户体验
案例
电商平台的关注点
目的:盈利 - GMV = 成交量 x 客单价 = 流量数量 x 转化率 x 客单价
影响因素
流量数量
-
直接广告
网站弹窗
静态广告
线下投放
-
间接广告
微信公众号
新浪微博
社区论坛
-
搜索引擎
- 竞价排名
-
消息推送
EDM
短信
APP PUSH
转化率
-
引流
数量
质量
-
详情页
内容详尽
有吸引力
-
下单流程
简单易懂
操作便捷
客单价
产品定价
优惠促销
商品推荐
转化率:用户操作路径优化
数据分析过程中隐存的风险
-
分析方案
- 数据分析方案选择是否合理
-
数据来源
- 数据来源是否可靠
-
准确性
- 分析过程是否准确
第二章 · 数据分析常用工具
常见工具 | 能力体现 | 学习成本 |
---|---|---|
Excel | 数据统计/分析与可视化呈现 | 低 |
SQL | 数据库数据查询 | 高 |
原生埋点/MTA | 用户行为跟踪与分析 | 中 |
第三章 · 常见的数据分析方法
第一节 · 基础数据分析
概念:通过简单易懂的数据统计与分析工作,了解数据中传递出的客观规律,从而达到分析目的的一种简便方法。
基础数据分析流程
-
明确目的
- 明确出于什么原因要做此次数据分析,目的是为了解决什么问题或了解什么情况
-
数据采集
- 了解数据采集的基本方式,包括:数据库抓取、埋点数据、访谈与调查问卷等等
-
整理数据
- 数据整理是对源数据的系统加工,是数据分析工作的前置,包括:数据清洗,分类和整合
-
可视化呈现
- 将繁杂的数据表格基于观察需求转化为可视化图表,可以更便于数据观察与分析
-
分析总结
- 通过结果数据反映出来的客观信息,分析出在起初计划要解决的问题或了解当前某些业务相关情况
分析总结
-
看趋势
通过观察数据波动情况,观察目标数据的走向趋势情况,从而掌握样本数据的异常情况以及客观规律。
常用工具:趋势图、多列堆积柱形图
-
看分布
通过观察数据分布情况,观察目标数据再不同阶段的聚合程度,为数据分析提供客观依据。
常用工具:直方图、箱线图、正态分布、点图、柏拉图
-
看对比
通过观察两组或多组数据的对比情况,观察数据组间相近或差异较大的数据区间。
常用工具:折线图、堆积柱形图、相关与回归分析等
数据对比:平行比较、同比数据、环比数据
第二节 · 用户模型分析
什么是用户模型?
用户模型是对业务目标群体真实特征及属性的勾勒,是真实用户的虚拟代表。
目的:尽量减少主观臆测,了解他们的真实需求,从而知道如何更好的为不同类型用户提供定制化服务。
两种构建用户模型的方法
类型 | 方法 | 特点 |
---|---|---|
传统用户模型 | 通过对用户的访谈和观察等方法,得到目标信息 | 准确度高,但成本高 |
临时用户模型 | 通过行业专家或公开的市场调查数据来快速建模 | 准确度低,易偏颇,但成本低 |
两者可以结合,先通过经验或专家意见建立一个初始用户模型,之后再进行访谈或观察等方法来佐证和调整。
用户模型的执行流程
信息整理
方法:找共性,看差异
“共性”用来总结该群体的特征
“差异”用来论证分类的合理性
第三节 · 事件触发模型分析
什么是埋点
埋点:通过程序来记录用户与产品交互过程的相关数据
事件:用户在产品上的行为所获得的程序反馈。
埋点的作用
通过了解用户与产品的交互过程,来帮助产品决策、推动产品优化以及指导运营。
载体:买点包括在iOS、Andriod、H5、小程序等前端埋点,也包括后端业务埋点。
埋点的类型
-
基础埋点
-
页面访问数量(看总体趋势,预警,活动有效性分析)
- PV、UV
页面停留时长(内容是否完整看完)
-
-
全局埋点
- 全量埋点说明文档
-
关键数据埋点
广告位点击统计
推荐商品点击统计
全局埋点 - 全量埋点说明文档示例:
序号 | 页面名称 | pageKey | 动作名称 | actionKey |
---|---|---|---|---|
1 | 登录首界面 | login_first_page | 点击开启学习之旅 | click_openstudy |
2 | 点击勾选协议 | click_tick | ||
3 | 点击协议 | click_agreement | ||
4 | 协议页面 | agreement_page | 点击返回 | click_back |
5 | 点击我知道了 | click_iknow | ||
... | ... | ... | ... | ... |
优点:
数据量完整且全面
便于多维度分析
不足:
开发成本较高
前端工作压力大
关键数据埋点
通过指定数据埋点、取数。统计及分析,可以更有针对性的进行数据观察。
第四节 · 漏斗分析模型
什么是漏斗分析模型
漏斗分析模型是用来观察用户在使用产品过程中,多个关键行为之间的转化与流失。
漏斗模型的价值
有助于精细化运营&设计。
构建方式
-
整理目标结构框架
创建步骤:
- 明确观察目标
- 整理全部可触达目标页面的“入口”,即为流量流入
- 梳理核心路径。标定首要观察的路径
- 梳理可能存在的跳转“出口”,即为流失
- 使用脑图勾画出整体结构框架
选定待分析路径
-
确定相关参数变量
- 用户类型,包括:全量用户、活跃用户、普通会员用户、钻石会员用户、普通用户
- 时间段,包括:日、月、季度、半年、一年和自定义。
-
数据观察与比较
- 整体观察:关注转化的衰减情况,观察“陡减”区间
- 数据比较:不同变量同样路径间比较,观察数据差异
第五节 · 留存分析模型
什么是留存分析模型?
用来了解不同类型用户的参与量以及活跃程度的分析模型,涉及核心业务流程以及运营活动。
关键词:
参与量:观察不同时间点或不同时间段中,用户的参与数量。
活跃程度:关注单位群体在平台中的“依赖”程度(黏性)。
核心业务流程:产品“主线”。
运营活动:以平台为基础,发起的伴有不同目的的组织形式。
留存分析模型的价值
通过留存分析模型分析产品对用户的黏性,是评价产品对用户是否有价值的重要依据。
-
基础效用
评估产品挽留用户能力(黏性)
-
诊断能力
检验业务逻辑中的症结所在
-
效果评估
评估产品迭代调优的实际业务效果
如何计算近日留存量
第六节 · 路径分析模型
什么是路径分析模型?
观察某个人或某个样本群体再访问产品或平台时,针对每个页面和不同路径的访问次数及顺序进行数据统计与分析的模型。
关键词:
某个人:指个体用户
某个样本群体:指在某种条件下的抽样群体
次数:访问频次
顺序:访问的先后顺序
统计与分析:基于前期准备,通过统计与分析得出结论
路径分析模型的价值
全局路径与流失节点观察
-
了解个体及群体的整体路径
通过对用户使用路径的观察,可以了解用户的使用习惯以及用户是否可以很好的适应各个流程链路
-
可视化流失节点
通过对各个递进页面中数据衰减的观察,分析流失原因,制定优化方案。
分析方法
-
产品结构/框架/功能拆解
- 梳理结构框架,基于用户使用流程进行功能拆解
-
路径选定
- 基于数据观察的目的选定目标路径
-
数据统计与分析
- 观察数据递增与衰减情况,横向对比,根据差异分析问题所在
第七节 · 分布分析模型
什么是分布分析模型?
概念:对用户在平台中的消费频次、金额或活跃程度等行为进行分类分析的模型。
价值:
挖掘用户分布规律,优化产品及运营策略
核心用户筛选与分类,需求定制化
RFM分析模型
RFM主要根据客户活跃程度和平台交易金额贡献所做的分类。
近度:Recency,用字母R表示,代表客户最近一次的活跃距离目前的天数。在这部分客户中,有些优质客户值得通过一定的有效手段进行激活。
频度:Frequency,用字母F表示,代表客户过去某段时间内的活跃频率。针对消费频度较小且消费额较大的客户,可以推行一些运营策略刺激用户,增加消费频次。
额度:Monetary,用字母M表示,代表客户最近一次消费金额或某个时间段内平均消费金额。通过该项指标可以评估不同消费水平的用户分布情况。
类别 | R | F | M | 策略 |
---|---|---|---|---|
重要价值用户 | 高 | 高 | 高 | 保持现状 |
重要发展用户 | 高 | 低 | 高 | 提升频次 |
重要保持用户 | 低 | 高 | 高 | 激活用户 |
重要挽留用户 | 低 | 低 | 高 | 重点召回 |
一般价值用户 | 高 | 高 | 低 | 刺激消费 |
一般发展用户 | 高 | 低 | 低 | 挖掘需求 |
一般保持用户 | 低 | 高 | 低 | 流失召回 |
一般挽留用户 | 低 | 低 | 低 | 放弃维护 |
搭建步骤
-
数据抓取
- 通过编写SQL或研发人员协助取得待分析数据
-
定义区间
- 基于基础数据的分布情况,定义分析区间
-
RFM取值
- 对照“定义区间表”填写RFM的对应值
-
水平定义
- 基于RFM均值定义“高低”水平
-
用户分层
- 定义用户类型,将系统类型用户合并分析
-
策略制定
- 针对不同类型用户制定相应策略