什么是用户画像?
用户画像这个理念是交互设计之父阿兰·库珀提出来的。他说用户画像是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。是根据用户的属性及行为特征,抽象出相应的标签,拟合而成的虚拟的形象,主要包含基本属性、社会属性、行为属性及心理属性。需要注意的是,用户画像是将一类有共同特征的用户聚类分析后得出的,因而并非针对某个具像的特定个人
例如:
女,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。这样一串描述即为用户画像的典型示范。
用户画像的组成是若干用户标签的集合。
企业通过收集、分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。
用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等广泛的信息。
用户画像有很多的的标签组成,每个标签都是一种观察、认识、描述用户的角度。标签根据企业业务的发展情况,或多或少,对外而言都是一个整体,这个整体称之为用户画像。
用户画像的作用
引导产品优化
因为清晰知道用户是谁,哪个群体占比大去调整产品功能体验!
假如手机目标用户中商务群体居多,最怕没电,手机办公可能是巨大需求,就在电池容量,内置办公等功能要强化。
改进服务质量
画像越清晰,越懂用户。如何在体验服务上升级就有目标了。
利于精准营销
知己知彼,才让营销有效也不会招人讨厌。
就像上面提到的餐厅,如果亲子用餐群体较多,那是不是可以多跟一些亲子类社群和企业合作,广告投放也会以这类为主,提升转化率~
用户画像本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。另外一个方面就是,金融企业利用统计的信息,开发出适合目标客户的产品。
不同企业对于用户画像有着不同对理解和需求。举个例子,金融行业和汽车行业对于用户画像需求的信息完全不一样,信息纬度也不同,对画像结果要求也不同。每个行业都有一套适合自己行业的用户画像方法,但是其核心都是为客户服务,为业务场景服务。
使用场景:
场景一,按需设计:
改变原有的先设计、再销售的传统模式,在研发新产品前,先基于产品期望定位,在用户画像平台中分析该用户群体的偏好,有针对性的设计产品,从而改变原先新产品高失败率的窘境,增强销售表现。
比如,某公司想研发一款智能手表,面向28-35岁的年轻男性,通过在平台中进行分析,发现材质=“金属”、风格=“硬朗”、颜色=“黑色”/"深灰色"、价格区间=“中等”的偏好比重最大,那么就给新产品的设计提供了非常客观有效的决策依据。
场景二,精准营销:
针对已有产品,寻找所偏好的精准人群分类,以及这些人群在信息渠道和购买渠道上的分布比例,来决定广告投放和活动开展的位置、内容等,实现精准营销。
用户画像构建
数据收集
确认画像目的是非常基础也是关键的一步。要了解构建用户画像期望达到什么样的运营或营销效果,从而在标签体系构建时对数据深度、广度及时效性方面作出规划,确保底层设计科学合理。只有建立在客观真实的数据基础上,生成的画像才有效。
在采集数据时,需要考虑多种维度,比如行业数据、全用户总体数据、用户属性数据、用户行为数据、用户成长数据等等,并通过行业调研、用户访谈、用户信息填写及问卷、平台前台后台数据收集等方式获得。
就自身采集到的数据而言,可能存在非目标数据、无效数据及虚假数据,因而需要过滤原始数据。
行为建模
将原始数据转化为特征,是一些转化与结构化的工作。在这个步骤中,需要剔除数据中的异常值(如电商APP中,用户可能用秒杀的手段以几分钱价格获得一部手机,但用户日常购物货单价都在千元以上)并将数据标准化(如消费者购物所使用的货币包括人民币与美元,需要将货币统一)和判断的标签标准化。
将得到的数据映射到构建的标签中,并将用户的多种特征组合到一起。标签的选择直接影响最终画像的丰富度与准确度,因而数据标签化时需要与APP自身的功能与特点相结合。如电商类APP需要对价格敏感度相关标签细化,而资讯类则需要尽可能多视角地用标签去描述内容的特征。
优先级排序方法主要依据构建的难易程度和各类标签的依存关系,优先级如图所示。
构建画像
用户画像数据标签维度,针对每一类数据实体,进一步分解可落地的数据维度,形成字段集。标签维度包括:
自然属性特征:性别,年龄,地域,教育水平,出生日期,职业,星座等
用户兴趣特征:兴趣爱好,使用APP/网站,浏览/收藏内容,互动内容,品牌偏好,产品偏好
用户社会特征:婚姻状况,家庭情况,社交/信息渠道偏好
用户消费特征:收入状况,购买力水平,已购商品,购买渠道偏好,最后购买时间,购买频次
数据在模型中运行后,最终生成的画像可以用可视化的形式展现。用户画像并非是一成不变的,因而模型需要具有一定灵活性,可根据用户的动态行为修正与调整画像。
用户画像平台技术方案
系统架构
从数据源到最终展现分成如下几层:
1.数据源:包括来自各个业务系统和媒介的分析数据源,其载体包括数据库、文件、大数据平台等。
2.数据建模:根据用户画像建模体系,配置数据模型。
3.数据集市:每个数据集市是基于一个主题做好轻量建模的细节数据,数据按照列存储的方式,被高效压缩,打好标签,存储在磁盘中。当需要计算时,采用内存计算来进行数据计算,并且每台机器节点会同时计算,最终会将结果送往可视化分析层做展现。
案例:金融产品用户画像设计的三大重点
用户画像设计要坚持三个原则,分别是:人口属性和信用信息为主,强相关信息为主,定性数据为主。
信用信息和人口属性为主
描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。信用信息可以直接证明客户的消费能力,是用户画像中最重要和基础的信息。包含消费者工作、收入、学历、财产等信息。
再次,金融企业需要触达客户,人口属性信息就是起到触达客户的作用,人口属性信息包含:姓名、性别,电话号码,邮件地址,家庭住址等。这些信息可以帮助金融企业联系客户,将产品和服务推销给客户。
采用强相关信息,忽略弱相关信息
强相关信息:是同场景需求直接相关的信息,其可以是因果信息,也可以是相关程度很高的信息。
例如:分析发现在其他条件相同的前提下,35岁左右人的平均工资高于平均年龄为30岁的人,计算机专业毕业的学生平均工资高于哲学专业学生,从事金融行业工作的平均工资高于从事纺织行业的平均工资,上海的平均工资超过海南省平均工资。
从这些信息告诉我们人的年龄、学历、职业、地点对收入的影响较大,同收入高低是强相关关系。也代表对信用属性影响较大的信息就是强相关信息,反之是弱相关信息。
用户其他的信息,如用户的身高、体重、姓名、星座等信息,很难从概率上分析出其对消费能力的影响,是弱相关信息。
这些信息不放入用户画像中进行分析,对用户的信用消费能力影响很小,不具商业价值。
转定量信息为定性的信息
定量的信息不利于对客户进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选人群。
如:将年龄段划分的客户转化为定性信息
18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。
参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。
参考资产信息也可将客户定义为高、中、低级别。
将金融企业各类定量信息集中做定性信息的分类,定性化有利与对用户进行筛选,快速定位目标客户。
金融企业结合业务需求进行用户画像,从实用角度出发可以将用户画像信息分成五类信息。分别是:人口属性,信用属性,消费特征,兴趣爱好,社交属性。
它们基本覆盖了业务需求所需要的强相关信息,结合外部场景数据将会产生巨大的商业价值。我们先了解下用户画像的五大类信息的作用,以及涉及的强相关信息。
人口属性
用于描述一个人基本特征的信息,主要作用是帮助金融企业知道客户是谁,如何触达用户,属于人口属性的信息包括:
姓名
性别
年龄
电话号码
邮箱
-
家庭住址
信用属性
用于描述用户收入潜力和收入情况,支付能力。帮助企业了解客户资产情况和信用情况,有利于定位目标客户,属于信用属性的信息包括:
客户职业
收入
资产
负债
学历
-
信用评分
消费特征
用于描述客户主要消费习惯和消费偏好,用于寻找高频和高价值客户。帮助企业依据客户消费特点推荐相关金融产品和服务,转化率将非常高。为了便于筛选客户,可以参考客户的消费记录将客户直接定性为某些消费特征人群,例如:
差旅人群
境外游人群
旅游人群
餐饮用户
汽车用户
母婴用户
理财人群
兴趣爱好
描述客户具有哪方面的兴趣爱好,帮助企业了解客户兴趣和消费倾向,定向进行活动营销。
兴趣爱好的信息可能会和消费特征中部分信息有重复,区别在于数据来源不同。消费特征来源于已有的消费记录,但是购买的物品和服务不一定是自己享用,但是兴趣爱好代表本人的真实兴趣,兴趣爱好的信息可能来源于社交信息和客户位置信息。例如:
户外运动爱好者
旅游爱好者
电影爱好者
科技发烧友
健身爱好者
-
奢侈品爱好者
金融企业用户画像的基本步骤
画像相关数据的集中整理
金融企业内部的信息分布在不同的系统,数据来源的系统分为内部与外部系统:
-
内部系统渠道:
人口属性信息主要集中在客户关系管理系统
信用信息主要集中在交易系统和产品系统之中,也集中在客户关系管理系统中
消费特征主要集中在渠道和产品系统中。
-
外部系统渠道:
兴趣爱好和社交信息:
客户的行为轨迹可以代表其兴趣爱好和品牌爱好,移动设备到位置信息可以提供较为准确的兴趣爱好信息。
社交信息:可以借助于金融行业自身的文本挖掘能力进行采集和分析,也是可以借助于厂商的技术能力在社交网站上直接获得。社交信息往往是实时信息,商业价值较高,转化率也较高,是大数据预测方面的主要信息来源。
以上用户画像数据中的强相关信息都可以在金融机构的数据仓库内整理和集中,数据仓库是用户画像数据的主要处理工具,依据业务场景和画像需求将原始数据进行分类、筛选、归纳、加工等,生成用户画像需要的原始数据。
提取同业务场景强相关数据
依据用户画像的原则,提取五大分类的强相关信息。
金融企业内部信息较多,在用户画像阶段不需要对所有信息都采用,只需要采用同业务场景和目标客户强相关的信息即可,这样有助于提高产品转化率,降低投资回报率(ROI),在数据变现过程中也容易实现。
数据分类、标签化(定量-定性)
依据业务需求,对信息加工整理,对定量的信息定性化,方便信息分类和筛选。
这部分工作建议在数据仓库进行,不建议在大数据管理平台(DMP)里进行加工。
定性信息进行定量分类是用户画像的一个重要工作环节,具有较高的业务场景要求,考验用户画像商业需求的转化。
其主要目的是帮助企业将复杂数据简单化,将交易数据定性进行归类,并且融入商业分析的要求,对数据进行商业加工。
依据业务需求引入外部数据
金融企业自身的数据不足以了解客户的消费特征、兴趣爱好、社交信息时,可以引入外部信息来丰富客户画像信息,
例如:引入银联和电商的信息来丰富消费特征信息,引入移动大数据的位置信息来丰富客户的兴趣爱好信息,引入外部厂商的数据来丰富社交信息等。
外部信息的纬度较多,内容也很丰富,但是如何引入外部信息是一项具有挑战的工作。外部信息在引入时需要考虑几个问题,分别是:
外部数据的覆盖率
如何和内部数据打通
和内部信息的匹配率
信息的相关程度
-
数据的鲜活度
敏感信息例如手机号、家庭住址、身份证号在引入或匹配时都应该注意隐私问题,基本的原则是不进行数据交换,可以进行数据匹配和验证。
外部数据不会集中在某一家,需要金融企业花费大量时间进行寻找。外部数据和内部数据的打通是个很复杂的问题。
手机号/设备号/身份证号的MD5数值匹配是一种好的方法,不涉及隐私数据的交换,可以进行唯一匹配。
一般情况下,数据覆盖率达到70%以上,就是一个非常高的覆盖率。覆盖率达到20%以上就可以进行商业应用了。
金融行业外部数据源较好合作方有:银联、芝麻信用、运营商、中航信、腾云天下、腾讯、微博、前海征信,各大电商平台等。
按业务需求进行筛选客户(DMP的作用)
用户画像是数据思维运营过程中的一个重要闭环,帮助金融企业利用数据进行精细化运营和市场营销,以及产品设计。用户画像就是一切以数据商业化运营为中心,以商业场景为主,帮助金融企业深度分析客户,找到目标客户。
DMP(大数据管理平台)在整个用户画像过程中起到了一个数据变现的作用。
从技术角度来讲,DMP将画像数据进行标签化,利用机器学习算法来找到相似人群,同业务场景深度结合,筛选出具有价值的数据和客户,定位目标客户,触达客户,对营销效果进行记录和反馈。
DMP可以帮助信用卡公司筛选出未来一个月可能进行分期付款的客户,电子产品重度购买客户,筛选出金融理财客户,筛选出高端客户(在本行资产很少,但是在他行资产很多),筛选出保障险种,寿险,教育险,车险等客户,筛选出稳健投资人,激进投资人,财富管理等方面等客户,并且可以触达这些客户,提高产品转化率,利用数据进行价值变现。
DMP还可以了解客户的消费习惯、兴趣爱好、以及近期需求,为客户定制金融产品和服务,进行跨界营销。利用客户的消费偏好,提高产品转化率,提高用户黏度。
银行用户画像
银行具有丰富的交易数据、个人属性数据、消费数据、信用数据和客户数据,用户画像的需求较大。但是缺少社交信息和兴趣爱好信息。
到银行网点来办业务的人年纪偏大,未来消费者主要在网上进行业务办理。银行接触不到客户,无法了解客户需求,缺少触达客户的手段。分析客户、了解客户、找到目标客户、为客户设计其需要的产品,成了银行进行用户画像的主要目的。
银行的主要业务需求集中在消费金融、财富管理、融资服务,用户画像要从这几个角度出发,寻找目标客户。
简单的应用场景
寻找分期客户:利用发卡机构数据+自身数据+信用卡数据,发现信用卡消费超过其月收入的用户,推荐其进行消费分期。
寻找高端资产客户:利用发卡机构数据+移动位置数据(别墅/高档小区)+物业费代扣数据+银行自身数据+汽车型号数据,发现在银行资产较少,在其他行资产较多的用户,为其提供高端资产管理服务。
寻找理财客户:利用自身数据(交易+工资)+移动端理财客户端/电商活跃数据。发现客户将工资/资产转到外部,但是电商消费不活跃客户,其互联网理财可能性较大,可以为其提供理财服务,将资金留在本行。
寻找境外游客户:利用自身卡消费数据+移动设备位置信息+社交好境外强相关数据(攻略,航线,景点,费用),寻找境外游客户为其提供金融服务。
寻找贷款客户:利用自身数据(人口属性+信用信息)+移动设备位置信息+社交购房/消费强相关信息,寻找即将购车/购房的目标客户,为其提供金融服务(抵押贷款/消费贷款)。
保险行业用户画像
保险公司内部的交易系统不多,交易方式不是很复杂,数据主要集中在产品系统和交易系统之中,客户关系管理系统中也包含丰富了信息。
保险公司主要数据有人口属性信息,信用信息,产品销售信息,客户家人信息。缺少兴趣爱好、消费特征、社交信息等信息。保险产品主要有寿险,车险,保障,财产险,意外险,养老险,旅游险。
保险行业DMP用户画像的业务场景都是围绕保险产品进行的。
简单的应用场景
依据自身数据(个人属性)+外部养车App活跃情况,为保险公司找到车险客户。
依据自身数据(个人属性)+移动设备位置信息0,为保险企业找到商旅人群,推销意外险和保障险。
依据自身数据(家人数据)+人生阶段信息,为用户推荐理财保险,寿险,保障保险,养老险,教育险。
依据自身数据+外部数据,为高端人士提供财产险和寿险。