在信息爆炸的时代,每天都有大量的信息数据产出,作者在文中的主题是信息的秩序和组织方式,我认为正是从信息管理的角度入手思考的,这也能给我们信管专业的发展和思维方式提供更多的引导。
一、关于比特秩序的思考
作者在文中提到了“三阶秩序”,第一阶是实体秩序,也就是按照物理位置存储和查找信息,就像数据结构中的线性结构;第二阶是索引秩序,也是我们之前很通用的信息组织方式,就是为信息制造索引表,对信息的物理位置顺序没有多少要求,就像数据结构中的哈希表;而作者反复提到的第三阶秩序,是一种大众化分类,按我粗浅的理解,也就是信息时代的每个人都能为信息添加自己想要的各种标签。
在我们原本接受的要保持东西井然有序的思维教育下,跟前两个相比,它表面上看起来是“无序”的,甚至是杂乱的。但是在信息世界中,信息本身就是十分庞大且混乱的,而且每时每刻都在迅速更新,在这样的环境下,原本的分类体系就会带来巨大的工作量,而且它的准确率也会下降。书中有一个例子,美国国会图书馆拥有的藏书有大约2900万,而藏书的数量每天还在快速增长,有三四百名的编目员对每本书进行查看并在图书馆的28.5万个主题标目中选出合适的主题。面对大量的书籍,国会图书馆做出的改变是每年编目员们可以根据自己的经验提出新的类目标签,再进行投票表决,图书馆每年都会创建8万个新的主题标目。由此可见无论是确保图书不会混乱无序,还是对主题标目的建设和维护,都是很大的工作量。
在前两阶秩序的分类体系中,大多数的目录都属于上下级或者平行关系,而在标签制的大众化分类中,却互无同属,交叉现象极其普遍。对于传统的分类方式来说,这种方式实在是太混乱了。但是在网民大规模的参与后,这种看起来十分混乱的随意分类能形成信息的高效率定位。摆脱了大量信息的分类方法由少数人来决定的局面后,标签式的分类方法或许能更加体现群众的兴趣和观点,能帮助他们更加容易地搜索到想要的内容。正如温伯格在书中所言,“我们组织世界的方式不但反映了世界,也反映了我们的兴趣、我们的激情、我们的需求和我们的梦想”。本书的标题说“万物皆无序”,在混乱无序的表面下,隐藏着对大众来说更加方便生动的数据分类方式。在三阶秩序中,数位做主,混乱无序也做主。
二、ICT环境下的信息组织的任务与挑战
ICT是信息、通信和技术三个英文单词的词头组合(Information and Communications Technology,简称ICT) 。它是信息技术与通信技术相融合而形成的一个新的概念和新的技术领域。在数字化时代,通信技术为我们带来了巨大的信息量。作为一种技术,它不仅仅提供多种业务,也不仅是信息的传递和共享,而且还是一种通用的智能工具。这种工具的产生也为信息组织方式带来了冲击。
第一个挑战是信息的存储模式。数据库技术是现代信息的主要存储模式,它主要是对大量的规范化的信息进行存储管理,面向结构化的数据处理。在传统的文献管理的环境下,它主要是记录在关系型数据库中,但是关系型数据库处理网络环境中许多无序的、非结构化的数据会有很多局限性。非结构化数据库弥补了关系型数据库的不足,但是要完成庞大的网络信息的所有组织功能,依然需要多种数据库技术的结合。信息组织的所对应的任务就是合理利用多种数据库技术,寻找合适的信息存储模式,以适应ICT环境下信息的快速增长。
第二个挑战是信息的管理模式,特别是分类模式。首先,信息原本的分类方法大多都十分严谨,一经建立很难改动,而缺少动态性;其次,信息的分类方式很容易出现边界模糊的问题,书中美国国会图书馆的周会上关于“斯里兰卡人”类目标签的争议就反应了这个问题。而在ICT环境下的数据更新速度很快,具有较强的动态性,标签法能为信息分类带来新的组织方式,但是由于它庞大的数据量和杂乱性,也会为信息的管理在标签管理和分析方面带来困难。
第三个挑战是信息检索方式,特别是在查全率和查准率方面的矛盾。虽然搜索引擎提供提高查准率的高级检索方式,但是熟练使用的人占少部分。大多数人的检索方式都是基于主题法的关键字检索,这样的查全率很高,但是查准率会比较低。另外在用户一部分的搜索行为中,用户输入的关键字并不是信息本身带有的词组,而是用户的主观记忆,在这种情况下检索效率会大大降低。标签化的秩比特序或许能解决这种问题,另外提供标签的复合检索方式能在提高查全率和查准率方面发挥作用。
三、总结
在ICT环境下,信息迅速发展,信息组织技术必须在思维和方式两方面都做出相应的改变,以适应快速变化的信息环境,推动ICT行业的良好发展。