在我们的工作当中经常会出现一个数据指标异常,突然增长或者突然下降的情况,这时老板都会让数据同学找一下数据变化的原因。数据同学会按照一定的业务逻辑关系去拆解这个指标,从而找到数据变化的原因。在这个过程中会比较依赖底层的数据指标系统,如果有完善成熟的数据指标系统,在数据波动异常的时候则可以快速定位变化的位置和原因,从而也体现了数据指标体系的重要性。接下来我们来聊聊数据指标体系。
一、数据管理存在的问题
1、指标口径不统一
实际工作中经常会遇到对于同一个业务场景和概念,大家的指标定义是一样的,但是统计的口径却不一样;还有大家的统计口径一致,但是名称却不一样,这样会导致大家的沟通很难在一个频道上,效率低下,最终出现数据偏差,影响业务判断和开展
2、指标体系不完整
这种情况一般在初创公司会比较多,因为业务快速发展,没有系统化去建设数据指标,更多的是某个业务发展了,然后维护当时所需指标,而每个业务部门又可能各自独立去维护,导致指标零散,没有系统化。在实际问题处理的过程当中缺乏整体考量以及其他业务指标的对比影响,可能会影响最终的业务决策
3、指标问题难溯源
由于指标的产出没有统一的输出源,导致产出的计算流程和规则不是清晰明了,无法通过血缘关系来跟踪溯源,导致排查费时费力
二、为什么要搭建数据指标体系
1)建立业务量化衡量的标准
2)减少重复工作,提高分析效率
3)帮助快速定位问题
主要就是针对上面的三个问题
三、数据指标体系搭建原则
1)搭建指标体系要有重点(第一关键指标、北极星指标)
2)搭建指标体系要有目标(解决什么具体的业务场景)
3)指标体系不是越全越好(和业务最贴切的才是最好的)
四、指标和维度
指标的定义:“指标”是量化衡量标准。
“会话数”指标是指总会话次数。“每次会话浏览页数”指标是指每次会话的平均网页浏览量
维度的定义:“维度”是指数据的属性。
举例来说,“城市”维度表示的是发起会话的城市,例如“巴黎”或“纽约”。“网页”维度表示的是用户浏览过的网页的网址
并不是每个指标都能与每个维度组合使用。每个维度和指标都有各自的数据范围,大多数情况下,只有将具有相同范围的维度和指标组合在一起才有意义。
PS:定义来自Google文档
五、数据指标体系搭建流程
1)业务调研、需求分析,确定核心业务所处阶段
了解目前业务产品的发展情况,制定贴合业务发展节奏的数据指标
2)明确统计指标和统计口径,定义北极星指标
抓住关键指标,且做到业务同步统一
3)指标分级,定义其他概括指标
拆解关键指标,监控关键指标的转化路径,便于快速定位发现问题
4)业务模块拆解
从业务模块出发,划分业务数据指标域
5)指标体系确认
业务端确认指标层级、血缘关系、指标定义
开发端确认明细模型和汇总模型设计(数仓事实表和维度表的开发)
六、数据指标体系搭建
在指标模型搭建的过程中其实没有特别高大上的模型和理论依托,主要是依赖于平时的积累和对业务的充分理解。个人在这个过程比较顺手是依赖业务域的划分加上指标分级来构建整个指标体系
举个例子:电商业务场景
业务域划分:
销售域:销售相关指标,GMV等
用户域:用户相关指标,DAU等
流量域:流量相关指标,UV等
商品域:商品相关指标,SKU数等
在各个细分指标域之上其实还有一个大盘综合指标,这个主要是给老板看的,也是整个公司经营重点关注的整体指标
数据指标分级
GMV = UV * 转化率 * 客单价
一级指标:GMV,整个公司的核心指标
二级指标:一级指标的路径指标,比如GMV可以不断的拆解,而GMV的波动主要受影响的三个关键点
三级指标:二级指标的路径指标,UV = 新UV + 老UV、转化率 = 新老用户转化率,不同场景转化率、客单价 :人均订单量、件单价
通过不断的拆分,将一个关键的业务一级指标拆分为多个二级和三级指标,这样在数据波动的时候可以快速的定位到问题并采取相应的措施解决
整个数据指标体系其实也是随着业务变化而变化的,核心目的是反映业务现状,方便各业务及时定位异常点就好。
七、指标模型
指标模型是建立在指标体系的基础上,在一个完整的指标体系基础之上,结合维度的组合,就可以建立对应的指标模型。
指标模型可以理解为指标和维度的组合,通过结构化的组合将指标和维度合在一起,实现数据的规范化展示和下钻。
八、指标管理系统
指标管理系统是在指标体系和指标模型的基础上去开发的一个管理系统,主要是为了方便管理我们的指标和维度以及指标模型,同时也便于其他项目组的对接。
后续:
打通数据开发平台,为指标的使用提供统一的标准化服务
实现血缘关系管理和数据资产管理
打通 BI 平台,实现自助式报表展示