用户画像(Profile),即用户信息标签化,通过收集用户社会属性、消费习惯、偏
好特征等各个维度数据,进而对 用户或者产品特征属性的刻画,并对这些特征分析
统计挖掘潜在价值信息,从而抽象出一个用户的信息全貌; •
可看做是企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数
据驱动运营奠定了基 础。如何从海量数据中挖掘出有价值的信息已经愈发重要。
⽬标⽤户画像
•来源:第三方检测SDK
用户画像(profile)的作用
用户画像(user profile)的构建步骤
数据挖掘:
预先设定好需要获取的事件,让程序员在相应页面上
进行数据埋点,用于追踪和记录用户的行为,并将实
时数据传送到后台数据库或者客户端。
数据挖掘举例
以电商为例,为了抓取用户的人口属性和行为轨迹,
先预设用户购物的可能行为,比如:
把这些用户信息和行为用程序语言进行数据埋点,比如访问时长、浏览路径、页面停留时间等),数据被发至服务器,被存放在后台或者客户端,形成用户基础数据。
确定标签
给用户“打标签”是构建用户画像最核心的部分
不同的受众,不同产品、不同目的,给用户的标签各
有侧重,具体问题具体分析
常见标签分为两类:
静态标签:相对静止的用户标签,包括最基础的用户
信息如性别、年龄、学历、角色、收入、地域、婚
否、性格等
动态标签:变化中的用户标签,记录用户互联网上的
行为偏好。如:搜索、浏览、注册、点赞、收藏、打
分、加入购物车等等。
数据建模就是给用户行为标签赋予权重
用户的行为可以用4w表示:
Who
(谁)
When
(什么时候)
Where
(在哪里)
What
(做了什么)
数据建模
Who(谁):定义用户,明确研究对象,用于用户分类,划分用户群体。
比如用户注册ID、昵称、手机号、邮箱、身份证、微信号等
When(什么时候):包含时间跨度和时间长度两方面。越早发生的行为,
标签的权重越小,越近则权重越大,既“时间衰减因子”
What(做了什么):用户发生了怎样的行为,根据行为的深入程度来添加
权重。比如,用户购买的权重为1,用户收藏为0.8,用户仅仅浏览记为0.7.
Where(在哪里):指用户发生行为的触点,包括内容和网址。内容是指
用户作用于的对象标签,比如小米手机;网址指的是用户行为发生的具体地
点,比如小米官网。权重加在网址上,比如小米官网为1,京东为0.8。
当单个标签的权重确定下来,可以利用标签权重公式计算总的用户标签
权重:
标签权重=时间衰减因子*行为权重*网址权重