本以为是本介绍大数据基本概念的书,实则不然。
第一,突破了我固有的大数据定义。一直以来我对大数据的定义是已经录入的数据、在网络上的各种点击搜索痕迹、网页及页面布局上停留的时间等等,这些数据因为海量,也因为所有人都生成的普通性,所以,即便是裸奔,也是大家一起裸奔,不会让我害怕。但,如果你只是出现在普通同学朋友的集体照中、只是出现在街头不同的摄像头中的背景里、仅仅出现在陌生人照片的背景中、甚至可能是你家门外的声音感测器突然听到的与平时不同的声音频率、电话中的声音背景音的频率与以往有异常,这些都能成为帮助他人推测你的活动轨迹、所处环境,进而推测你可能的行为趋势的数据,有没有很可怕。再来,即便只是一张照片,如果拍摄角度比较好,大数据方法可以直接通过照片取得你的虹膜相关数据,虹膜识别这种比指纹更高端的识别方式,防线有多脆弱?如果你的保密设备绑定的是指纹、虹膜识别,他人可能仅仅通过分析一些特定角度的照片就可以解密,这种感觉电影中才有的情节,十分夸张,但真的可能发生,有没有心惊胆战的感觉?大数据,比我想象中的更大。
第二,普通人对数据的无所谓的态度,应该转变。使用手机的时候,各种不同的软件可能善意,更多是无意,甚至可能恶意的获取了很多我们的私人信息,而在真实生活场景中,大部分基本不在乎这一点,各类软件app的使用数量之多、使用频率之大超过普通人的认知。一个普通软件所间接获取的私人信息,真的如普通人想象中那么无所谓不用计较吗?虽然只是普通人,但是整体人群的行为和心理分析,一样可以得出很多结论,指导商业活动,甚至可以进一步,指导各种社会行为。想想自己工作的行业的立足之本,就是大数法则。数据的价值,远超过普通人的认知,因而普通人对数据分享的态度,的确应该更理智或者更谨慎一些。
第三,大数据作为客观事物,比自我主观更真实的反应内心,是为大数据比你更懂你。人的主观评价或多或少会有美化、安抚自我的倾向,而大数据作为客观的描述,比自我更了解自我。感觉人的主观性,更像是在特定情况下将自我这潭水搅浑,不被他人看透的同时也容易混淆自我认知,而水潭中的真实自我究竟是裸奔还是穿着泳衣,大数据这种客观维度,就容易抛开泥沙水雾,看的清楚真切。联想到三体的威慑理论,威慑真的那么有用吗?不知道对手内心真实的想法,真的对预测对手的真实选择增加了这么高的难度吗?还是我们对大数据所能做到的精准预测缺少预见性和信赖感?这么一来,混沌学真的只是混沌学吗?
第四,普通人对大数据,一方面要分享,另一方要管控。要有能改动数据的权利、有模糊数据的权利、有遗忘数据的权利、有知道分享数据能给自己带来多少收益的权利。这是本书作者的核心观点。在新技术领头羊的大数据帮扶之下,普通人必须分享私人数据才能享受到收益,但分享与收益、与隐私权,是普通人应该考虑的方向,尤其更是研究大数据的专家慎重考虑的方向。现在我们有很强大的数据存储能力,之前一个图书馆的天文数据量现在有足够的方式简单存储。因此我们无时不刻不在制造的数据,全都被保留,作为冗余数据,没有被删除。没有人知道这些数据、既往的痕迹最后会给自己带来什么。而曾经的数据只代表曾经的我们的选择和思想,经过时间沉淀之后,这些选择和思想会有变化,并不是我们现在的选择和思想,不被删除的冗余数据让我们思考,是否会存在需要为过去不太正确的思想、行为承担责任?各种软件在使用和制造普通人的数据时,是不是有达摩克利克之剑悬在它们头上,让他们对数据保持基本的敬畏之心,从而更加精心的保护数据安全,并且不滥用数据?
断断续续的看完的,因而所得也断断续续,无法连贯成递进关系,对不住作者的用心良苦,也对不住此书的内容质量。作者是真心站在普通民众的角度,用自己的专业知识告诉民众如何了解和使用大数据,如何更好的从使用大数据中受益。