CDP客户数据平台:是汇集所有客户数据并将数据存储在统一的、企业各个部门都可以轻松访问和使用的数据平台。CDP的核心是客户,我理解分为四层:
1、数据源:是用户数据的汇总来源,包括收集到的用户数据、第三方提供的数据、一些API接口,甚至一些上传的线下表。
2、数据处理层:这一层是将数据源中的用户数据进行统一处理,通过数据计算用户标签,将用户进行唯一性的全景画像刻画。这里引入了一个用户标签的概念,用户标签就是描述一个人的属性特征的,常见的用户标签包括性别、年龄、职业、是否有车等。用户标签分为三类:
静态标签:静态标签如性别、设备、年龄、地域等,这类标签易于采集,但是描述过于宽泛,不能精确客户用户需求,应用场景不大,可作为辅助条件。
动态标签:随着用户与平台持续交互,如点击、滑动、搜索、点赞、发言、交易等,数据不断更新,基于此类的标签称为动态标签。如购买偏好、促销偏好等。
组合标签:将数据按照规则组合、计算,得出的标签计算方式分为:人工定义、机器算法。组合标签可以提供更加丰富和有价值的标签信息,如业务上人为通过客单价和购买频次综合定义高价值用户,用户的搜索和加购行为定义的高潜用户等。
3、数据展现:当用户标签生成后,可以根据海量的用户数据生成相应的数据展现层功能,包括:标签数据的应用上包括标签圈选、人群分析、标签交叉分析等;用户生命周期的应用上包括用户回流分析、人群路径分析等。同时标签数据还可以整合成API形成对外提供成为人群判定和输出的工具。
4、营销触达:用户平台基于海量用户数据,成为最懂用户的平台,就需要将用户最需要的东西,通过用户最喜欢的方式,触达到用户端。这里就是利用用户标签进行一些业务营销投放。这里会考虑关于投放渠道、投放模板、自动营销、用户疲劳控制、算法推荐等功能,同时也可以形成API工具对外支持多端投放和算法对接
用户标签的质量验证:
数据质量:是标签质量最基础的评价,主要分为准确度、覆盖度、稳定性 三部分,关于准确度,标签其实对一个用户打标是一个个置信区间的标签,比如男女标签的预测,算法只会告诉你1-100之前,这个人是个男或女的概率是大概多少。所以准确性验证也和你算法的阈值范围选取有关。验证标签准确性的方法可以有:分层抽样验证、使用真实数据准确标签反向验证预测算法(比如有准确的男女性别,就可以去反向测试算法算出来的男女性别是否准确)、交叉验证(一些画像类的指标间会存在一些相关性,此时可进行交叉验证,也就是通过其他标签验证这个标签)、还有一些成型的算法验证。
业务质量:应用质量评估(标签是有用的不是可有可无没价值的)、业务价值评估(标签投放后带来的业务提升效果很明显的,就是好标签)