我不喜欢现在用的大数据标签,谁家的都不喜欢。
越来越感觉,现有标签把数据和数据的关系给固化了,就是你买过尿布然后一辈子都会被推荐啤酒的赶脚。而我有限的数据产品经历却告诉我,数据被全量保存下来的最大意义不是数据本身变成动态可查询,而是数据和数据的关系变成动态可查询。
什么意思?
简单来说,就是你历史上买没买过尿布,买没买过啤酒,这些数据并不重要,重要的是买尿布的行为和买啤酒的行为之间,在两项数据之间是否有关联,强度多大——譬如说,是不是买了尿布的人7成以上(瞎编的,如有雷同,纯属撞上死耗子)都会买啤酒?
所有的资料告诉我们,「大数据关注的是相关关系,不关心因果关系」,并且把这作为大数据的优点提出。但是,今天,当我们关注大数据产品化和商业化的时候,却发现这很可能恰恰是大数据的缺陷。
有牛人告诉我,统计学和计算机算法的最大区别就在于,前者是要「归因」的。今天回头来看,大数据商业化的瓶颈恰恰可能就卡在大数据产品「如何从数据和数据的关系中找到大概率的因果关系」,而不是「如何用数据挖掘解决问题」。
正如前文所言,「如何用数据挖掘解决问题」是「私人医生」,也就是BI和数据科学家的事情,但是站在一个普通的商业从业者角度,我需要的只是知道我生了什么病,应该怎么去确诊,而不是不管三七二十一,上来就先做个血检。
换个角度来看,数据指标本质上就是数据和数据关系动态的体现。譬如说用NPS的曲线和revenue的曲线作比较,就能发现后者是否处于健康增长的状态,有没有做什么dirty的事情,有没有对老客户挤奶牛;用BDI和CDI交叉,就能够看出最近品牌和产品是否出了什么问题。作为一个普通从业者,经过普通的讲解,我就能够用这些数据指标来做一些判断和决策,而对于行业高手来说,这些数据指标甚至可以成为他们的利器。
为什么品牌还在用「老旧」的数据指标,而不是用大数据产品来决策——因为用数据指标可以「归因」,从而制定有效的品牌和产品策略,而大数据标签和报表只能用于打包人群。
再换一个角度,大数据标签背后,打包人群里的每一个个体都被视为平等的「理性人」,分享着共同的标签,享受着同等的投放待遇。但是,事实上呢?这些人里面,有KOL,有现实的意见领袖,有网红,也可能有线下导购,每个人所能发挥的作用并不是标签所能概括的。
从这个意义上,大数据标签,更像是大数据从产品化向商业化迈进的过程中,所产生的过渡产品——到达人群的方式有千万种,目前效率最高成本最低的是标签这一种。就好像电子商务,电子只是手段,商务才是目的;数字营销,数字只是手段,营销才是目的。对于大数据营销来说,标签只是手段,到达人群才是目的。
早晚会有更好用的产品替代掉现在的大数据标签,也许是「标签+」,也许是「人群+」,总之,是一个更简单好用的东西。或者,就像电子商务今天更多地被称为商务电子化,大数据标签有一天也会更多地被称为标签数据化。
「让听得到炮火声音的人来决策」,但是,也请用大数据产品让他们能够找到炮火声音背后那致命的狙击手。
就酱。
PS:以上内容纯属一个文科生的吐槽,仅代表本人观点,和所在公司无关。
人了解世界的时候,都是先问who & where,慢慢学会问why,当对答案不满足的时候就开始问how,所以,knowhow才是人对世界的回答。谢谢关注Knowhow_Ho,何夕一言堂,这是我对世界的回答,一家之言,不求正确,但求有所启发。