用户画像是什么,给大多数人的印象就是给用户打标签,从某种意义上来说,这种理解也是正确的。更详细地来说,用户画像是倾向于对同一类用户进行不同维度的刻画。
1.用户画像数据的来源
一个完整的用户画像是由各个子画像综合计算出来的,丰富的用户行为日志文件是各个子画像的数据来源。
-
从数据的角度来看,用户画像就是对原始数据二次计算重构的后的新数据。
1.用户属性是用来描述一个用户的“个性”,用户画像也是针对用户属性为基础来进行建模的。 2.用户行为是用户画像建模的依据。
2.用户画像特性
动态性:由于是对用户的行为进行分析,可知用户画像是具有很强的动态性。这要求我们设计建模的时候,应该考虑到用户画像的实时更新的问题。
时空局限性:与其动态性类似,在时间上,是对用户的行为日志进行分析,不可避免的会造成用户画像的时间局限性,上一段时间的用户画像不一定适用于当前阶段,其次,在空间上,对于不同的应用领域,需要建立的用户画像也是不同的,所以这就造成了时空局限性,所以离开了应用场景,在谈用户画像是不合适的。
3.用户画像建模
用户定量画像;用户定量画像在建模的过程中,主要考虑到用户画像的颗粒度,即用户画像应该细化到何种程度,当然这个程度需要准确的把握,太过于细化虽然有利于增加推荐的准确度,但是建模的成本会增加,反之亦然。前期可以通过调查问卷的方法来大致的确定用户的关注内容,从而确定用户画像的颗粒度。就可以借助技术的方式来捕捉用户的行为,存储和分析用户的数据。显然,仅仅通过用户定量画像,无法精确的刻画用户。
用户定性画像:相比与用户定量画像,用户定性画像是比较复杂的。包含了以下几个部分
-
标签与用户定性画像:标签通常是人为高度精炼的特征标识,是用户定性画像的核心。标签化的用户画像既方便人们理解,同时也方便计算机进行统计分析和程序化处理。在用户定性画像建模中需要考虑以下几个问题:
(1)如何定义和表示标签?(包括标签名称、标签的类别、标签值和取值范围) (2)如何解释标签?主要是对标签的语义信息进行描述,从语义上给出标签的解释 (3)如何推理标签?主要是定义相应的推理规则,从何实现标签之间的推理。 (4)如何验证标签?包括标签的定义是否合理,标签关系是否一致、正确。
4.用户画像的构建
-
构建用户画像的关键技术是利用本体对用户画像领域中的标签进行表示、验证、推理和解释。本体的结构主要包含类(Class)、属性(Property)、实例(Individual)、公理(Axioms)和推理规则(Rules)。基于知识的用户定性画像主要以用户和消费的相关行为作为画像建模的核心。本体构建的关键步骤:
(1)构建领域词汇表
(2)确定类与类之间的结构
(3)定义属性
(4)定义实例
(5)定义约束公理和推理规则
定性画像知识的存储:基于Jena API的面向关系数据的本体存储技术。
本文参考《用户网络行为画像》