案例1:啤酒与尿布
现在,当你走进美国沃尔玛超市,你会发现一个奇怪的现象:
尿布和啤酒摆在一起销售
这是因为沃尔玛通过数据分析发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。
通过这个案例,可以知道:
数据能告诉我们消费者的潜在需求。
这个可能是人很难直接观察发现的。
再看另外下一个案例。
案例2:超市预知高中生顾客怀孕
明尼苏达州的一位中年男子,指控塔吉特百货将婴儿产品优惠券寄给他的女儿──“一名高中生”。
但是,没过多久他却来电道歉
因为女儿经他逼问后坦承自己真的怀孕了。
塔吉特百货就是靠着分析用户所有的购物数据,然后通过相关关系分析得出的真实状况。
通过这个案例,我们可以知道:
数据能告诉我们,消费者的真实情况。
大数据不会说谎,只要你用正确的方式去解读,就能读懂数据背后的故事。
马云说:
互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了。
数据的价值不言而喻。那么在实际产品开发中,如何让数据说话,发挥数据的价值呢?
1.数据驱动产品
既然数据如此重要,那么如何应用数据来驱动产品研发呢?
数据驱动的三个步骤
1.数据采集,也叫数据埋点。
2.数据建模
3.数据分析
数据采集,是后续流程的根基。没有数据,哪里来的建模分析?
数据采集,两大原则:
全面
细致
数据的全面,从大的系统层面,就是能收集的部分,都不能落下。例如移动App端、Web网站端、微信公众号、服务器接口调用情况等。
如果这些数据,能基于用户的唯一ID,进行整合,然后建模,意义就完全不一样了。
细致主要是指尽量把没一个节点的数据都采集到。这涉及到后续不同维度的分析。所以每个节点涉及到的属性、字段,尽量都不要落下。
但是,如果是小的创业公司,精力有限,可以抓核心流程和核心参数进行采集,以保证了解产品情况,让数据告诉你,产品到底好还是不好。好在哪里?不好的地方,又是哪里?
以下是列举的核心参数和核心流程,我认为再小的公司或者团队,哪怕是个人开发者,都不能不做,如下图所示:
当然有很多数据平台,可以帮助解决这个问题。例如友盟、TalkingData。但是,有些数据,可能这些平台不能支持,或者不能很好的体系化。如果企业做大做强了,大部分公司,都会自己开发一套数据收集系统。另一方面,也是因为企业数据的安全和隐私。
核心流程分析转化率,能有效帮助用户在哪一步出现了问题。然后对症下药,事半功倍。
看一个产品,是否成功,是否击中了市场中的目标用户,重点看两个数据:
1.增长
2.留存
硅谷有一句很著名的格言:
Keep growing, fuck everything else .(只有增长是重要的,其他一切都不重要)
虽然有点粗俗,但是话糙理不糙。
对于创业公司,只要你能保持高速增长,所有的问题都至少在短期内能够被容忍,被掩盖,或者不会爆发,可能很多问题当时是个问题,你长大十倍、百倍之后它就不是问题了,甚至不需要解决他就自然而然的消失了。
数据会告诉你,你是不是在增长,是不是做出了市场需要的产品。
2.数据建模和分析
数据建模,就是基于采集的数据,基于某一个数据模型,进行建模分析。通过这一数据模型能得出一个具体的结论,用于指导企业活动。
最简单的数据模型有用户性别比例、用户地域分布、用户的网络使用情况百分比等,就不做具体的探讨了。
案例3:芝麻信用
下图是本人的芝麻信用截图:
从图中可以看出,芝麻信用,主要是从5个维度采集了数据,并建立了权重模型,具体如下:
1.身份特质
2.履约能力
3.信用历史
4.人脉关系
5.行为偏好
基于我的了解,大体的思维导图如下:
根据信用评分,得出一个信用好坏的评级:
1.较差 350~550
2.中等 550~600
3.良好 600~650
4.极好 700~950
但是,这里还不能查到,芝麻信用具体每个模块,占的权重比例。以国际通行的FICO体系(FICO信用分是由美国个人消费信用评估公司开发出的一种个人信用评级法,已经得到社会广泛接受。)做个参考,其主要评级要素和比例如下:
1. 违约历史(Payment history),权重35%。
涉及过去的违约记录,例如断供房产被拍卖,被催债(如拖欠信用卡被收账公司追讨)、罚款(法庭判的或者庭外和解都算)、个人破产(这个国内可能没有)等。
2.债务负担(Debt Burden),权重 30%。
其实就是个人的杠杆率,你欠债越多,评分越低。比如你长期都只能还最低还款额和每次还全额,差别肯定是会很大。
3.信用历史(Length of credit history),权重 15%。
就是你有信用记录的时间越长越好。所谓“路遥知马力日久见人心”嘛。
4.信用种类(Types of credit used),权重10%。
你用过的信用种类越多(信用卡,房贷,消费贷等),说明你金融知识越丰富,理财能力,驾驭财富的能力,自然就强。
5.新申请信用(Recent searches for credit),权重10%。
申请信用的过程,就是提高杠杆的过程,比如要买房买车,都是需要申请贷款的,贷款的时候,是需要对你的信用进行一次查询的。
案例4:百度搜索
百度搜索把我在百度搜索里面搜索的次数和关键词,进行了数据采集,然后进行了简单的数据建模,主要是周搜索次数、月搜索次数,以及搜索词对应的兴趣领域。
我的兴趣分布:
周搜索指数:
月搜索指数:
通过这样的数据建模,就能很好的了解用户的偏好,那么推荐内容,推荐广告,就变得精准起来。
百度的主要收入,来源于广告,2015年总营收640亿,相当于每天赚两个亿。亚马逊三分之一的销售额来自基于数据分析后的个性化推荐系统。
让数据说话,就是让数据更好的满足用户的需求,产生更多的价值。