数据中台的数据主要可以通过以下几种方式链接:
多维模型:以业务流(事件)为中心联接-如合同、订单等;建立基于事实表、维度表以及相互间联接关系,实现多维数据查询和分析
图模型:以对象(主体)为中心联接-如供应商、客户等;通过建立数据对象以及数据实例之间的关系,帮助业务快速定位关联影响
标签:智能标签-员工、用户画像等;对特定业务范围的圈定,是用户主观观察、认识和描述对象的一个角度
指标数据:指标数据-原子指标数据、衍生/复合等;对业务结果、效率和质量的度量
算法与模型:算法模型-辅料计划预测、机会点挖掘等;通过数学建模对现实世界进行抽象、模拟和仿真,提供支撑业务判断和决策的高级分析方法
维度设计需满足单一性、单向性、正交性
单一性:有且仅有一个视角,在同一个维度中不能穿插其他经营分析的视角,如区域中不能含有客户视角
单向性:上大下小,维度只能支撑自上而下的分解和自下而上的收敛,每个成员只能存在向上的收敛路径,不能具备向上和向下两个方向的收敛逻辑
正交性:成员两两不相交,同一成员不能同时拥有多个上级成员,以产品维为例,华为向客户提供的设备或服务都只能被准确地分配到唯一叶子(最底层)节点,并以此路径进行收敛
维度属性是从维度中继承的属性,可以只继承主键作为事实表的外键,也可以继承维度中全部或其他部分的属性。
图模型:由节点和边组成。节点表示实体或概念,边则由属性或关系构成
标签设计:标签分为事实标签、规则标签和模型标签;从客观到主观,从静态到动态
事实标签是描述实体的客观事实,关注实体的属性特征;如性别、品牌等
规则标签是属性&度量的统计结果,对数据进行加工后的标签,如超重货物、日销量TOP10品牌等
模型标签是对于实体的评估和预测,洞察业务价值导向的不同特征,如推荐产品配置高端、消费潜力旺盛等