书中内容的概要总结
《万物皆无序:新数字秩序的革命》一书,在前言“空间中的信息”中,以史泰博“超市原型实验室”为例,讲述了在实体空间中信息的限制。在任一时刻,实体物件只能存在于一个地点,因此即便是人们有不同的需求,在超市中商品的布局只能有一个。不同的用户面对同样的商品布局,他们各自需求不同,无论实验室将布局设计得多么出色,都只能方便其中一部分用户。但是在由数位构成的数字世界中,这一切截然不同,商品不再有序,它们“乱”成一团。通过计算机的处理能力和储存在计算机中商品的元数据描述,用户可以按自己的方式整理商品,不再局限于单一布局。
这本书中,将对事物整理的秩序划分为三阶。
- 一阶秩序
在秩序的一阶当中,我们整理的是事物本身。例如我们将书放进书架、将照片放进相册里面。也就是整理真实世界中的物体。 - 二阶秩序
在秩序的二阶当中,我们整理的是事物的元数据——有关一阶物体的信息。但是二阶当中有天然的限制,并非所有与一阶物体相关的信息都被记录下来。 - 三阶秩序
物体的内容被数码化,变成了数位;该内容的相关信息(元数据)也被数码化,变成数位。数位化带来的好处显而易见:它突破了实体世界的界限,对物体的描述信息可以多于物体本身的信息。
在温伯格写这本书的时候,三阶秩序带来的好处才开始体现,传统的按一阶、二阶秩序对事物进行整理的方式占据主流。所以,温伯格在这本书中,主要从以下的对比,分析和总结了三阶秩序带来的影响。
- 维基百科与《大英百科全书》的内容来源
- 亚马逊和图书馆对于书籍的不同分类方式
- Flickr.com和传统相册关于照片的整理方式
- Delicious.com和普通的书签的区别
信息组织的任务与挑战
书中提到三阶秩序带来的改变,我们现在已经习以为常。按用户需求对内容排序,按用户自定义标签组织内容,分面式分类系统以及对隐式信息的挖掘与利用,这些技术在现在数字世界中随处可见。而且正如温伯格所描述的一般,三阶的混乱越来越庞大。人们基于数字世界进行内容创作,事物被数字化,电子设备和软件记录着人们的日常活动……这些行为成为了现如今的常态,产生了大量的信息。如何从这一堆混乱的、增长速度日益加快的信息中找到有用的信息,或者从中挖掘出价值,成为当前ICT环境下信息组织的任务与挑战。
信息组织的前提:元数据
谈及对信息的利用,首先我们要做的事情是将无序、混乱的信息按某种方式进行组织。温伯格所说的无序混乱的数位信息拥有比一阶、二阶秩序更多价值有一个很重要的前提,信息能通过自身的元数据(信息的信息)互相联系起来。
对于一幅图片,能直接与图片二进制编码相关联的图片极少;但通过图片的元数据,若干的图片能以不同维度联系起来。我们从后者的关联能挖掘出比前者更多的价值。关于图片的元数据越多,我们就能从更多维度来组织图片。没有元数据,数量庞大的图片在数字世界中就是真正的“无序与混乱”,每一张都是孤立的个体,我们无法利用计算机将图片有效组织起来,从图片之间的联系中挖掘出价值。
温伯格在书中提出了“包括与推迟”的概念:包括所有能找到的信息,推迟分类与组织。我认为这里指的信息,指的就是事物的元数据。包括事物尽可能多的元数据,数字世界总能以一种方式去利用这些数据。
信息如何组织
信息组织的关键是对信息进行分类。
温伯格用了大量篇幅去描述前两阶秩序与三阶秩序之前不同的信息分类方式。传统的树状图式的分类方式,在数字世界中有着许多局限性。事物的分类并不是非此即彼,事物可以按照不同的分类标准、不同的组织顺序进行组织。
数字世界中大量的无序混乱的信息在元数据的作用下并非真正的无序。计算机利用信息的元数据对信息分类。在参照标准的前提下,从系统用户的需求出发,对信息的元数据尽可能详细地刻画,我们就能给用户提供更多的检索、排序与筛选信息的方式。
隐式信息与隐私泄露
温伯格书中描述的一个重要概念是隐式信息。隐式信息是对可见信息本身或者对可见信息之前关系进行推理后得到的信息。数字世界无法对可见信息本身进行推理,但是当信息之间有了联系,通过设计好的算法,计算机能从关键的显示信息中得到隐式信息。
这些挖掘出来的隐式信息,让企业对消费者了解得更加深入。企业可以根据隐式信息对消费者提供针对性的服务,提高用户体验的同时,扩大企业的盈利。
挖掘隐式信息是现在信息组织过程中,必须要做的一件事情。不进行挖掘,就无法对消费者提供针对性的服务,企业就会丧失在同类互联网行业中的竞争力。
但是这个技术带来了一个很严重的,容易被忽视的问题,那就是人们的隐私安全。数据挖掘需要收集用户的大量信息。也许直观看上去,每一条信息都不能算是用户隐私,但是当信息积累到一定数量,通过挖掘,用户的兴趣爱好、性格在企业面前变得完全透明,企业成为了消费者的“知己”,了解消费者胜过用户自己。消费者对这一切可能并不知情,不免让人细思恐极。
前些天Facebook的用户数据泄露事件为我们敲响了警钟,人们对自己的数据隐私看得越来越重要。在信息组织的过程中,我们必须要对数据进行挖掘,以生产出更多的价值(提升用户体验带来的价值,而不是贩卖挖掘出来的用户数据)。我们必须对用户的隐私心生敬畏。