大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……
一、前言
当你在和朋友抱怨昨天不小心摔碎一个杯子时,你拿起手机发现购物网站给你推荐了正流行的克莱因蓝陶瓷杯;当你点开音乐软件时突然一个弹窗告诉你附近的人都在听这首歌;当你打开健康码时上面会显示你何时何地接种了何种疫苗,而你又去过哪些城市;当你打开购票网站时它会提醒你怎样买票更划算……
欢迎你加入大数据时代。
大数据,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中认为“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”
量变积累产生质变。大数据带来了很多技术上的变革,很多之前需要花费很多时间搜集信息和资料所作的研究,大数据时代则能够在很短的时间内处理。这为科研,推动技术发展带来了极大的便利。同时,现代生活所存储以及运用的数据相较于以往任何一次信息爆炸时,数据量都大得多,这种数据的增长为信息的传播和运用带来了质的变化。
二、变革
大数据开启了一次重大的转型时代。书中指出大数据带来的信息风暴带来了思维变革、商业变革和管理变革。让我感受最深刻的是作者提出思维变革的三点特征。首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。
不是随机样本,而是全体数据。小数据时代的随机采样,最少的数据获得最多的信息。随机采样取得了巨大的成功,成为现代测量领域的主心骨。但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。它的成功依赖于采样的绝对随机性,但是实现采样的随机性非常困难。一旦采样过程中存在任何偏见,分析结果就会相去甚远。生活中真正有趣的事情经常藏匿在细节之中,而采样分析法却无法捕捉到这些细节。我们处于大数据时代并且可以用现有技术进行分析,所以现在经常会放弃样本分析这条捷径,选择收集全面而完整的数据。
不是精确性,而是混杂性。第一次看到这一观点时实在让我难以理解,但是仔细思考后发现为了追求精确性,人们不得不承担它带来的高额成本,而精确性是服务于“小数据”的。在越来越多的情况下,使用所有可获取的数据变得更为可能,但为此也要付出一定的代价。数据量的大幅增加会造成结果的不准确,与此同时,一些错误的数据也会混进数据库。这些问题是无法避免的,我们正在学会接受它们。这就是由“小数据”到“大数据”的重要转变之一。
不是因果关系,而是相关关系。虽然我不能完全认同这个观点,但是这也反映了目前的社会现象。短视频当前的状况就可以证明这个观点:一个又一个热点的迭代,引发人们大量的模仿,人们根本没有必要去深究热点视频火爆的原因,因为在我们探究的过程中,热点就已经过去了。在大数据时代,这些新的分析工具和思路为我们提供了一系列新的视野和有用的预测,我们看到了很多以前不曾注意到的联系,还掌握了以前无法理解的复杂技术和社会动态。但最重要的是,通过去探求“是什么”而不是“为什么”,相关关系帮助我们更好地了解了这个世界。
三、价值与风险
央视曾推出同名纪录片《大数据时代》。该片是国内首部大数据产业题材纪录片,节目讲述了大数据技术在政府治理、民生服务、数据安全、工业转型、未来生活等方面给我们带来的改变和影响。其中介绍了大数据对老人安全的保障,可以根据老人家里门磁、煤气、温度等数据确保老人的安全。另外还能通过床垫检测微弱震动来判断人的心跳呼吸等数据。另一个例子是共享单车的停放问题,通过大数据技术,分析用户的需求行为、行驶路线、借还地点、使用时预测需求量的大小,为运营管理及调度安排提供相应指导。通过对数据的采集利用建立合适的电子围栏,合理约束用户停放区域。由专门的负责人对共享单车的违规行为进行举报和骑回热点地区。利用大数据技术对数据进行采集、分,挖掘出其中有价值的信息以供决策。随着大数据时代的到来,大数据技术的利用将对共享单车的治理产生积极而深远的影响。
正如维克托教授所说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。尽管大数据技术给我们带来了很多方面的变化,但我们都知道身处数据时代就是将自己暴露在阳光之下。购物软件监视着我们的购物习惯,浏览器监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的想法,还有我们的社交关系网。大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用。这就颠覆了当下隐私保护法以个人为中心的思想。
应对大数据的汹涌来袭,我们没有万无一失的方法,必须建立规范自身的新准则。我们需要把进行隐私保护的责任从个人转移到数据使用者身上,也就是说,数据使用者应该以负责任的态度使用数据。
最后作者在书中写道:“大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。这也提醒我们在使用这个工具的时候,应当怀有谦恭之心,铭记人性之本。”