企业的痛点
企业在建设数据产品时往往响应不了实际业务变化,工作中我曾遇到过公司新增业务在全国进行推广,需要推广过程中产生的数据反哺业务决策,对新业务运营成效展开分析复盘。因为新业务是跨部门合作,业务节点多,数据链路中就有三个系统参与。我们部门在数据可视化需求承接方案设计时发现需求数据需要对接多个系统,但是各个系统对同一个数据指标定义不一致,建模后数据检验不一致。这些种种原因造成新业务数据可视化报表上线延期,无法给新业务运营提供支持。根据实际工作经验我总结出企业在数据领域建设中往往会出现以下痛点:
1.数据指标口径不一致。
指标口径不一致。例如在两个报表中出现的销售额这个指标,其中A报表将其定义为含税,B报表将其定义不含税,虽然指标名称都是销售额但结果却不一样。运营面对这些指标的时候,不知道指标的业务口径,很难去使用这些数据。
2.数据重复建设,需求响应时间长。
我们在数据报表开发时发现客户和门店对应关系有很多数据表,让开发同事不确定使用哪张表数据为准。这种情况下大多数开发同事不会去重新梳理其他团队开发关系表,大概率会自己去开发,这样就造成数据重复建设,增加了需求响应时间,交产品交付时间被拉长。
3.数据对接同步效率慢,数据节点多,数据校验链路长。
业务数据沉淀在自身系统变成了数据孤岛,报表需求取数需要跨多个系统。
4.数据质量差。
痛点背后原因
- 全局统一指标管理的缺失。
- 烟囱式的开发、数据成为孤岛,各业务数据不能形成闭环相互赋能
数据的重复建设,浪费开发资源。 - 数据加工链路长出现问题时排查困难。
数据中台的能力
业务指标标准化、定义清晰一致、计算逻辑一致、数据来源清晰且统一。
举个简单的例子:针对销售金额这个指标,A部门定义是含税销售金额,B部门定义是不含税销售金额。因为指标口径不一致则会造成开发取数时用错指标,造成数据计算错误。往往这种错误是隐藏在深处,一般都是在排查完取数逻辑后才会被发现。实时数据和离线数据因为数据更新频率不一致在计算时也会导致结果不一致,所以统一指标口径时也需要统一数据来源。数据复用能力,保证数据只加工一次。
为了解决数据的重复建设,数据中台建设提供数据资产目录,将已经完成的数据建设录入其中,实现数据地图的功能,以便后续快速查找数据。对外提供数据服务接口。对上游应用经常使用的数据指标进行抽象接口化,也是提高数据复用和标准化常用的方法。对数据全链路监控。
数据中台作为承接上下游数据的枢纽,就需要取数,加工,输出等链路实施监控,以保证在第一时间发现和解决问题。成本控制
数据中台还有一个能力是计算应用,报表,指标的投入产出比。例如数据中台可以建议运营机制,对于一些访问量较低、产出低数据表可以进行整合下线,以节约成本。
什么样的企业适合搭建数据中台
当一个企业业务稳定且经营健康、需要借助数据提升企业经营效率、业务线复杂且有多个数据应用场景、业务数据出现孤岛、数据建设面临效率、质量和成本问题。
如果企业符合以上的特征的话,可以将数据中台建设提上日程。