数据指标体系是建立用户画像的基础,也是在进入开发前的关键环节,是需要结合业务场景制定的数据指标。建立用户画像一般从2个维度:
①用户维度(userid):基于当前用户账号相关数据推送内容。
②设备维度(cookie):当用户没有登陆账户而访问设备时,基于用户在设备的行为对该设备推送相关内容。
用户标签从标签类型可分为:统计类、规则类、机器学习挖掘类。从建立的维度来看,可分为:用户属性类、用户行为类、用户消费类、风险控制类。至于标签如何分类,没有严格的规定,符合业务场景和使用者使用即可。
一、标签维度
1、用户属性类
一般是与用户自带属性相关,例如性别、年龄、地域、注册日期、会员类型等。对于相同的一级标签诶些,需要判断多个标签之间的关系是互斥还是非互斥关系。例如,在判断性别时,不能既是男、又是女,这就是互斥关系。
对于传统企业来说,更多的是从用户属性类维度去丰富指标体系。而对于互联网企业来说,其拥有海量的用户访问日志数据,所以更容易从用户行为类数据分析用户的行为特性。
2、用户行为类
常见用户行为维度指标包括订单相关行为、下单/访问相关行为、用户近30天行为指标、高频活跃时间段、用户购买类、点击偏好、营销敏感度等相关行为。
3、用户消费类
用户消费维度指标体系建设从用户搜索、流量、加购、收藏、下单商品对应的品类入手。品类越精细,给用户推荐的准确性越高。例如品类细分到:手机-手机配件-数据线。
4、风险控制类
风控维度主要是预防薅羊毛、恶意刷单、借贷欺诈行为的用户,未防止这类用户给平台带来损失,所以专门设置风控类维度。结合业务场景,可从账号风险、设备风险、借贷风险等维度考虑指标体系。
5、社交属性维度
该维度主要是了解用户的社交范围,如家庭成员、社交偏好、社交活跃度等等。以此来提供个性化推荐和精准营销。例如在朋友圈收到的广告,也是基于用户的社交属性进行的推送。
下面是整理的上述5个维度的画像主题:
二、其他常见标签维度
用户标签体系不限于划分维度,通过应用场景对标签进行归类也是常用手段。从业务场景出发,可分为:用户属性、用户行为、营销场景、地域细分、偏好细分、用户分层等维度。每个维度再分成二级标签、三级标签等。
三、标签命名方式
在确定好标签后,需要对标签进行命名,以便于管理。对一个标签,可从多个角度来确定唯一名称。
1、标签主题
标明属于哪个类型的标签,如人口属性(ATTRITUBE),行为属性(ACTION),用户消费(CONSUME),风险控制(RISKMANAGE)等。
2、用户维度
表明该标签来源,是用户唯一标识(userid),还是用户设备(cookie),一般用U和C区分。
3、标签类型
标签分类,统计型(01)、规则型(02)、算法型(03)。
4、一级归类
在每个标签大类下面,进一步细分的标签类型。
参照上面的命名方式,举例用户的性别标签:
命名规则:标签主题_用户维度_标签类型_一级归类
【男】:ATTRITUBE_U_01_001
【女】:ATTRITUBE_U_01_002
四、元数据管理
标签完成梳理和命名后,需要维护一张码表用例记录标签id名称、标签含义及标签口径等主要信息,方便元数据的维护与管理。
参考资料:
《用户画像:方法论与工程化解决方案》赵宏田 著