最近在负责一个CDP项目,项目中需要开发客户标签以及定义客户属性。那么什么是标签和属性呢?
标签
什么是标签?
标签是一种数据特征,是人为定义出来的内容。以CDP项目中的用户标签为例,用户标签是构成用户画像的核心因素。将用户的数据进行提炼后生成具有差异性特征的形容词。
还是举例来说。登录类标签,如最近3天APP登录大于3次,最近3天APP登录小于等于3次,这就是两个不同的标签。
按照标签生成方式,可分为统计类标签、规则类标签、算法类标签(有时说是机器学习类)。一般在CDP项目构建的早期,先会做统计类和规则类的标签。统计类标签举例来说就是:近3天登录APP次数大于3次。规则类标签是:年龄大于等于30.
按照数据失效性,标签分为:静态标签和动态标签。静态标签又可以称为定性标签,指不会随着时间以及用户行为变化而变化的标签,如用户的性别标签,这些标签都是不会随着时间或用户行为而变化的
动态标签又称为定量标签,指会随着时间以及用户行为变化的标签,如用户活跃度标签、忠诚度标签,会根据特定时间段内用户特定行为的变化而变化
属性
查的一个定义:事务的性质和关系,称为属性。
和标签怎么区分呢?例如我们会说年龄是用户的属性,但“年龄是20-30岁”是一个用户标签。我们可以认为,当一个描述客户特征的字段,其取值不能枚举或枚举超过20个以上,就可以将此字段定义为属性。所以一般日期类的字段,例如汽车订单中的购车时间,就可以当成属性来使用。而当取值可以枚举出来的情况,按照业务需求,就可以定义出具体的标签了。
维度
什么是维度?这个建议大家看一下我的上篇维度表的定义,进行一些理解。维度是一种思维角度,看待一种事实表,构建一种数据模型,可以从几个维度来判断。
像这种把流水表里大量重复数据拎到一边单独存放的案例,还有很多,比如
表示时间:日期-年-月-日-季-周(是不是有点像日期表)表示地点:国-省/州-市-区县-镇-村品类:用途-品牌-包装…………类似上面这些具有独立属性或层次结构的信息,我们将其称之为数据的维度。一个数据,可以属于不同维度,在不同维度上根据层次结构进行汇总统计(聚合)为什么把它称为“维度”
以上为引用内容,大神总结比较到位,摘抄之
例如下面图片
为了计算长度、面积或体积,我们把物体长宽高各维度相乘同样,为了计算报表中值的数量,也可以通过报表的独立属性和层次结构中的成员数目相乘,那么“独立属性”和“层次结构”,就是报表的维度
下面正方体的各个面就表示的不同维度,从不同的角度进行切面,就可以获得不同的统计结果。
因此维度与标签属性不是一个层次的内容。