大数据:不求因果,只求相关性

报道称 TikTok 收购案将最快于下周(2020 年 9 月第一周)完成交易。

扎克伯格一直声称抖音,影响了美国的言论自由。特朗普甚至污蔑抖音,操纵美国言论。

收购案其中有一项,值得人注意的就是关于用户数据的交割

互联网时代,谁都知道,数据为王,数据就是财富,数据就是未来。

我们有必要了解一下大数据思维。

大数据思维,不求因果,只求相关性。

西方人一直对中医这种东方医学,存疑,不信任。原因是中医,“知其然而不知其所以然”,没法解释它的因果关系。但是随着互联网时代的到来,思维观念的转变。越来越多的西方人开始接受,欢迎中医。中医属于经验科学,经过千百年来的摸索,就是建立在事实上的,虽然难知因果,但它确实有效。接受中医,相信中医,就是在接受和相信相关性。

相关性是建立在大量完善的数据上的。

2010年,谷歌自动驾驶汽车在闹市区高速路等各种路段行驶了22.5万千米。而早在6年前的2004年,美国国防部高级研究计划局组织了世界上第1届自动驾驶汽车拉力赛。考虑到当时的自动驾驶汽车水平,主办方不敢在真正的道路上进行,选择了240千米长的废弃道路。当时主办方还一直担心跑道不够长。结果出乎意料。取得第1名成绩的开了13千米,大约只占跑道总长的1/20,其余的不是提前抛锚就是撞坏了。担心跑道不够长,主办方真的是想多了。

到2016年,谷歌自动驾驶汽车安全行驶已达320万千米。

其实早在谷歌几十年前,自动驾驶就一直处在研发阶段,但是进展缓慢。为什么谷歌进入这个领域之后,能够取得突破性进展,而且发展迅速?

关键在于思维不同。

谷歌之前的研制,关于自动驾驶的方案,都是采取现场采集数据,现场分析处理,然后再做决策。如此多的大量数据,要进行及时处理,运算量巨大。

而谷歌不同,谷歌依托自己成熟的街景项目,在已经构建了庞大的街景数据库之后,自动驾驶只是在走虚拟化的实景地图,就好像打游戏一样,所有的地图已经提前加载好了。如此一来,就省去了大量采集数据,进行场景分析这一步。

2016年,谷歌无人驾驶在安全行驶320万千米之后,终于发生了第1起负主要责任的安全事故。原因是,它无法识别道路上一个5千克的小沙袋。一般情况下,正常有人驾驶直接压过去就行了,但是谷歌无人驾驶,从没有见过,无法识别,所以采取了保守决策,选择绕道行驶。而因此与来往车辆发生了一起小事故。

虽然出了一起小事故,但是谷歌基于大数据将智能问题转化为数据问题的方式,是正确的,可行的。

数据是财富,数据是未来。越早进入,数据越多,成功概率越大。

这是否意味着晚进入的,就一定没机会?

未必。

今天各类新闻、视频、购物等应用的智能推荐已经是标配,这种智能推荐是对每个用户的私人定制,根据用户习惯,推荐用户想要的,比你还了解你自己。智能推荐会让你花更多的时间,花更多的钱。对于老用户而言,可以根据完善的数据,精准推荐,但对于新用户缺失完善的数据,那该怎么办?又或者,你看新闻的时候,如果只看体育新闻,那么根据你的用户习惯,就只给你推送体育新闻,这不是太无趣了,那该怎么办呢?

通过协同过滤预测用户偏好。

就是根据其他用户的使用习惯,推测你的喜好。比如,和你一样喜欢看体育新闻的,有60%也喜欢看娱乐新闻,那么也会给你推送娱乐新闻。

今日头条,抖音短视频,亚马逊等,就运用了协同过滤来预测用户的偏好。

大数据思维,不求因果,只求相关性。

大数据思维,把智能问题转化为数据问题

解决问题,不是只有打破砂锅问到底,求因果这条路。如果大量事实和数据能够证明,就是可信的。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。