互联网产品和传统产品不同的是,互联网产品能够产生大量的数据。通过分析工具和方法进行数据的分析能够非常清晰直接地了解用户习惯,优化产品。
姚旭认为数据分析是一种靠谱的产品研究方法,这东西有很多误区,也不能迷信,最终到头来还是要人来做决策。
别忽略沉默的用户
二战时英国空军为了降低飞机的损失,决定给飞机的机身进行装甲加固。由于当时条件所限,只能用装甲加固飞机上的少数部位。他们对执行完轰炸任务返航的飞机进行了仔细地观察、分析、统计,发现大多数的弹孔,都集中在飞机的机翼上;只有少数弹孔位于驾驶舱。从数据上说,似乎加固机翼的性价比最高。但实际情况却恰恰相反,驾驶舱才是最应加固的地方,因为驾驶舱被击中的飞机几乎都没飞回来。
“发声”的数据是最好获取的,但如果没把这些沉默的数据考虑进来,那么这种数据分析是不靠谱的。所以除了数据的结果,还得尝试解读这些数据。而解读数据就完全依赖人了。
更重要的是有用户在乎
A和B两家网站,都经营类似的业务,都有稳定的用户群。它们都进行了类似的网站界面改版。改版之后,网站A没有得到用户的赞扬,反而遭到很多用户的臭骂;而网站B既没有用户夸它,也没有用户骂它。如果从数据来看,应该是网站B的改版相对更成功,因为没有用户表达不满。但事实并非如此。网站A虽然遭到很多用户痛骂,但说明还有很多用户在乎它;对于网站B,用户对它已经不关心它了。
网站A指的是Facebook,网站B是微软旗下的LiveSpace。
数据不是决策的唯一标准
通常认为,数据分析指导工作是一种高性价比的做法,不容易犯错,对于代表资方的管理层来说,比起依赖于人的决策,依赖于数据的决策似乎更稳健。这种决策在从0.5向0.8的产品改进上,可能是有效的。因为一个已有的产品,数据就摆在那,如果100个用户中有50个访问超时,解决了这个问题,就提升了50%的效果。
但对于从0到0.1的新产品上,由于数据很难获取,需要花大力气在获取模拟数据上。往往是用一周时间去想明白一个做两个小时的产品该不该做的问题。而且模拟的结果还和最终实际相差很远。
建议先做出来A/Btest或是原型系统,再去验证,在一些场合下比先拿数据要有效的多。
数据带有主观性
为了减少内耗,我们往往依赖于数据来做决断。我一直认为数据本身是带有主观性的,完全客观的数据是没有的。数据的获取方法,数据的解读方法,数据的统计方法,都是人的决策。一份数据得出两个相反的结论来也不是没有可能,因为即使主观上没有偏向性,也受限于方法和视野。
决策上最终起作用的还是人,不是数据,虽然人有那么多的不确定性,还可能出现争论、扯皮,不敢承担责任。
但重视数据应该成为一种信仰
且歌且行对于数据的观点是:数据是一种信仰。
毁掉分析数据态度有三个常见原因。
第一,大环境不尊重数据,尤其是老板的态度。如果数据分析师只要随便给一个报告就行,数字多一点或少一点,大家也是一笑而过,并不会追根到底,那么很难让数据分析师以严谨的态度对待数据。
例如,国内这几家数据分析机构,基本都在着急扩张自己,争着占领行业,对于其推出的数据有多精准却不那么在意,所以艾瑞的数据最近才会经常被人说“不靠谱”。
数据分析,今天做得不准,明天再改是没有用的。比如艾瑞,如果数据不稳固却抢着做很多行业,这是不靠谱的做法,指不定哪天就砸了自己的牌子。
有人提过Facebook的数据分析师为什么那么能耐,因为他们不觉得数据分析是一个苦事,十几个人在一个房子里把数据分析当做一件很开心的事情来做,分析数据对于他们来说是在追求科学。
第二,好的数据分析师需要一点天分,同时也需要高人点拨,但是电子商务这个圈子,真正懂数据分析的人不会超过10个,所以一般人很难取得真经。这和信仰一样,没有师傅领进门,难度也会大很多。
我回顾了自己从微软到易趣,再从敦煌到支付宝,在数据分析上有一次长足的进步,得益于从两位老师的身上得到了许多启发。
一位是亚马逊的首席科学家韦思康。曾经我告诉韦思康,KPI报告显示敦煌网需要4秒钟,他立马让我叫来做技术的同事(他要听到一线同学的反映),问这个4秒钟怎么测算出来,是美国人打开用4秒钟,还是英国人打开用4秒钟,用的是什么Browser(浏览器)等。这个4秒钟和商业价值(例如交易量)有关系吗?
这让当时的我很触动,连这么一个很基础的数据,韦思康老师都是以求证的心态来分析的。更令我印象深刻的是,只请他当半天敦煌网顾问,按照他的工作经历来说,随便忽悠半天是很容易的事情,但是韦思康老师非常严谨,先是以一个普通人的身份花了半个小时在敦煌网买东西(坚决要真实付钱),切身体会敦煌网的用户体验。然后也不先看数据,而是先问很多能更了解敦煌网的生意形态的问题。他的问题比很多投资分析师来得专业。而现在许多数据分析师,包括当时的我自己,只看数据就开口说问题,不深入去体会公司的商业形态。
韦思康老师告诉过我数据是一种态度,让我明白做数据的人就是要全身心投入,好像一种信仰一样,中间有许多路要走;而且,数据与商业密切相关,不能局限在数据的死角里。
另一位是清华大学的教授谢劲红,有一个夏天我碰巧去旁听他的课,拿一堆的数据给他看,他一边看一边给我演绎他的思维,他可以很快在一堆数据中找到它们之间的关系。后来我常常带着团队去清华找他聊,他教我如何看网络数据,用联动的思维来看网络数据。可以说是他启蒙了我用“关系”的思维看数据。一听完就回到敦煌看很多数据,发现了新世界。
第三,数据分析师感叹落不了地,只能谈数据,而不懂商业。如果不懂商业,而单纯看数据,不仅很难有创意的思维,而且是没有意义的。
而对于一般的数据分析师来说,大部分人没有系统思维,而且也只能看一部分数据,无法从大面儿上了解整个公司的运营数据,这样就令数据分析师难以形成全面的思考方式。
为什么我在敦煌的时候数据分析能力会突飞猛进?那也是因为我在前两家公司只能看到一部分数据,而到了敦煌之后我爱看什么就看什么,受谢教授启发之后我更是天马行空地把营销数据、市场数据、财务数据、产品数据、卖家和买家数据等联动起来看,这大大改变了我对数据的运用方式。
打破常识和经验分析数据
丁士正有一段时间在一家为客户在Facebook上做广告的加拿大公司工作。
这是一家小型Startup(创业)公司,总共不到20个人。其中4个人(包括他自己)是技术人员,剩下的除了CEO都是Account Manager(客户经理)。当然CEO很多时候也在做Account Manager的事情。
刚到这个公司的时候,我觉得他们的code很烂,他们的数据库设计也很烂。后来才知道,当初startup的时候,是找了印度公司做外包的,他们对这个外包很不满意,所以一期项目搞定之后,就全部拿过来自己做了。但是后遗症也留下了。
这个公司的数据模型很清楚,只要通过低于广告主给出的CPA(Cost Per Action),每行动成本,一种按效果支付成本的收费形式)价格能赚到钱,就想办法增加广告覆盖率。但是有个常识大家都明白,增加覆盖率很可能导致转化率下降。但是如果接受这个假设,那么就没有什么赚钱的机会了。恰恰是因为他们相信,除了常识之外,还有一些事情是经验之外的。
比如说关键词。有些关键词对某些人有用,对另外一些人没用。如果不做数据挖掘,生想广告词或者关键词的组合,把自己累死也赚不到什么钱。
所以,这个公司在代码中设计了几个基本核心算法:
- 一种止损的trigger(触发器),自动停止任何亏钱的广告。
- 一个自动发布广告的Cron(定时任务)。程序一直在扫描,一旦发现一些广告能赚钱,就自由组合这些广告元素再自动发布到广告系统里面。这样,就能出乎意料地发现一些更加赚钱的广告形式。
- 做了很多广告更新的算法,搞了一个自动化的A/B测试策略来针对Facebook广告价格的浮动,来更新广告的价格。
通过阅读这些算法我感受很深。所谓的数据分析,不是一个产品经理跑到运维、数据库管理员或者工程师那里说:我现在要跟踪什么什么数据,你帮我出一下吧,然后再对着跑出来的数据琢磨这些数据是否合理。在这个公司里,只要发现一个数据模式对收入有影响,就会直接编码到系统里,变成自动执行的代码。基于这样的数据导向原则,代码面临无穷多次的重构,因为谁也不知道,下一个数据模式会发生在哪个层面,哪几个数据之间会发生关系。
我认为国内的不少公司,还在根据daily report(日报单)分析数据,还在说数据只是为了验证产品经理想法的阶段。这动作是不是太慢了?
对于大多数网站,如果你想用数据为导向,必须建立系统级的A/B测试机制。对于界面层面的重构,一个产品经理加一个工程师,用这个系统一天至少能做3~4个。系统级别的A/B测试要能够保证快速上线,第一时间看到数据,一旦超过临界值要直接结束测试、保留数据并生成报告(直接邮件发送,而不是让产品经理想起来跑到后台再查)。
对于做社交网站,或者有复杂用户数据模型的公司,要在界面呈现和用户数据之间建立匹配系统。这样,产品经理可以设计几种呈现模式,丢到匹配系统中,过不了多久,就能发现用户对不同呈现模式的数据反应的不同,然后系统性地固化这种机制。
通过cookie或者用户登录信息,建立针对不同用户的内部tag系统,看这些tag在系统里有没有明显差异。如果有就可以固化下来,用来提高关键指标。
所以,我现在对于数据分析的感觉是:要提高一个数据指标,盯着它是没有用的。必须找到影响这个数据的另几个可操作性更强的数据指标,调整它们。分析数据的可能性要充分,充分分析的基础是测试充分多的可能性。如果你想测试图标的颜色从绿色变成红色会不会更好,那为什么不测试一下蓝色、紫色和黄色呢?如果小规模数据已经可以说明问题,就没有必要延长测试时间,也没有必要扩大测试范围。要充分利用计算机来帮你做数据采集和分析,缩短数据分析的周期,降低数据分析的成本。有必要的时候,可以让计算机帮你找Pattern(模式),因为计算机没有偏见。
知乎说
“数据”和“用户反馈”就像产品发展过程中的左右两个大脑,一个是“理性”的,一个更偏“感性”。数据能够更加真实地反映出用户使用产品的行为特征,然后根据这个特征来做产品调整。但是尽信数据不如无数据。当你手握数据的时候,你应该考虑的是如何分析,如何运用好这些数据,理性和感性结合,才能做出好的判断。