背景
在互联网逐渐步入大数据时代后,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是“可视化”的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务。
那何谓精准营销?精准营销的概念是科特勒在05年的时候提出来的,科特勒是现代营销学之父。 这个精准营销的概念是这么定义的:在精准定位的基础上,依托现代信息技术手段建立个性化的顾客沟通服务体系,实现企业可度量的低成本扩张之路。
简单来说就是在合适的时间、合适的地点、将合适的商品通过合适的方式提供给合适的人。“合适”的关键在于知己知彼,而知彼其中的一个范畴就是了解目标用户,于是,“用户画像”的概念也就应运而生。
用户画像
用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。简单来说就是通过一系列简短、精炼、易识别的语言或者标签来描述一个人。例如,李少华(忽必烈),性别:男;职业,阿里巴巴航旅事业群总经理; 生日,10月16日;婚姻状态,未知;收入情况,高;家乡,浙江省杭州市。
用户画像产品-[毕加索]
当看到这个高逼格的项目名称时,是不是对我们的产品已经有了很大的兴趣。在这里还是有必要介绍下画家毕加索老人家的基本情况。
毕加索(1881-1973),西班牙画家、雕塑家。现代艺术的创始人,西方现代派绘画的主要代表。他和他的画在世界艺术史上占据了不朽的地位。毕加索也是位多产画家,据统计,他的作品总计近 37000 件,包括:油画1885 幅,素描7089 幅,版画20000 幅,平版画6121幅。
我们航旅用户画像产品取名为“毕加索”也是希望我们产品输出的用户画像服务就像绘画大师毕加索的画一样,期望在航旅甚至集团中占有不可替代的地位。
毕加索之数据概览
截止到7月18日,毕加索中共含有226个标签, 总共分为7个一级分类:公共信息,机票,汽车票,火车票,酒店,门票,度假;
每个一级分类下还有二级分类,目前共有29个二级分类,53个三级分类。具体请参考毕加索首页还有一部分标签属于公共标签,归属到了,例如公共信息子目录下,比如,APP特性,交易信息,人生阶段,地理属性,基本特征,浏览行为,用户兴趣,能力层级等,身份信息等。如想具体了解,请访问毕加索首页。
毕加索之功能概览
毕加索一期上线后,主要包含的功能有以下四块:标签展示,标签接入,标签挖掘,标签使用等:
-
标签展示,按照多级类别对标签进行展示,用户可根据类别快速定位到标签,并可查看标签明细。下图展示的是年龄标签的明细,包括数据类型,标签取值,更新周期,算法描述等。
-
标签接入,标签接入其实就是录入标签元数据的过程,目前毕加索已经接入的标签来源包括航旅,淘宝,支付宝,共享LBS服务和航旅实时服务等,并从多个维度上对标签进行了归类,比如标签类型(枚举,数字,日期,KV)、存储类型(多值,非多值)、是否可透视,是否实时等。后期我们会接入更多的标签来源,并且继续扩展标签的维度。
-
标签挖掘,此功能继承了阿里云的PAI算法平台,与ODPS深度打通,只要拥有ODPS某个项目的权限,就可以在毕加索上依托ODPS进行数据标签的开发与挖掘。而且最重要的是,在整个数据开发过程中,你可能不用写一行代码,只需要拖拖拽拽就可完成。下面的示例为K均值聚类过程。
标签使用,针对毕加索中的标签,从数据的角度来认识下他们,比如总标签数量,Top 10最热标签,各个标签的使用频率,每天新增标签等,维度可以任意,目的是让用户从数据的多个维度了解毕加索。
毕加索之架构概览
通过对毕加索现有功能的介绍,相信已经对毕加索有了大致初步的了解。接下来看看毕加索的架构,通过对现有架构的学习进一步加深对毕加索的了解。
毕加索架构图(数据角度):
毕加索整个项目中涉及并依赖了集团多个数据产品,例如ODPS,Garuda(大表JOIN操作非常高效),iGraph(KV或者KKV查询非常,RT在10ms内),PAI(可拖拽的数据挖掘库),Xlib,数据超市等,大家在日常中如果有类似的需求场景,可参考对应的产品。
总结
毕加索作为航旅用户画像的领头羊产品,也是我经历的比较完整的一个数据产品,让我从无到有完整了解了一个数据产品的落地过程。希望通过上面的介绍,对用户画像感兴趣的同学有些帮助,更希望如果有业务需求,尽快骚扰我们。