不断进击的编码
很多次听过“万物来自比特”,但不解其义,直到看过《信息简史》才理解个中奥妙。从非洲的鼓,到字母表,再到电报、计算机,信息的发展是一个不断编码的过程。字母表的出现,是一个里程碑。人类将信息编制成字和词,将实物与语言相勾连。早期的语言,枝节庞杂。同一个词,但有多种不同写法,比如cony(兔子),亦有conny、conye、conie等多种拼法。这时候,字典出现了,它作为一种规范语言的工具,实际上明确了对信息的编码,语言得以便利人类沟通、深化思考的利器。后来,这种编码过程不断深化,随着数学家、物理学家等人的加入,编码朝着更简洁更高效的方向迈进。其间,诸如摩斯密码的形式相继出现。早期为远距离通信而精心建造的信号塔如今已成陈迹,脱离了最初的功能。关于编码的奇思妙思层出不穷,直到二进制一统天下。比特是二进制算法中的基本单位,如今基本上所有的事物都可以用比特来表示,所以20世纪的物理学家惠特才喊出“It from bit(万物来自比特)”的论断。
比特之所以重要,是因为它剥离了信息意义的外衣,通过数学和理性直击到信息的本质。由此,信息学作为一门全新的学科诞生了。它如一股洪流,在接下的时光里,影响到一个又一个的领域:心理学、热力学、遗传学、传播学、量子力学,不一而足。《信息简史》的中文译者高博这样评价信息学建立后的巨大影响:“每一门学科在经受了信息学洗礼后,面貌都焕然一新,不仅在技术上有了长足的进步,而且更重要的是在哲学思辨上大大地深化了。”
信息学诞生之前,人类为信息的传递做出了大量艰辛而富有智慧的努力。在非洲早期,有部落通过鼓声来传递信息。其秘诀在于声调。同样一种鼓声通过不同的音高而产生不同的含义。通过鼓的接力,部落人可以将信息传递到一二百里开外。但鼓语有个先天不足的地方,即词汇量太少。而在传递中,歧义不可避免。为了解决这一问题,非洲人加入了“冗余”。不把月亮说成月亮,而是“那俯览大地的月亮”;把鸡说成“鸡,那啾啾叫的小东西”。这种为提高精确度而引入冗余的思想,最终被香农证明。香农证明了只要通信速率小于通信容道,总可以使概率误差接近于零。这个结论震惊了当时的通信理论界。可以说正是这个理论,奠定了渐进无误差通信的基础,才有了后来的信息时代。
文字的出现,可谓是社会的一大深刻变革。由此衍生出来的书面文化,开启了人类抽象思考的大门。文字可以描述事物,可以描述事物的抽象,甚至是事物抽象的抽象。比如,谈论起诗歌,亚里士多德会引出topic(论题)、structure(结构)等词汇。为了描述这个抽象的世界,亚里士多德创造了“范畴”的概念,并运用二阶抽象的文字来组织经验——这样的思考过程被哈夫洛克唤作“思考”。说起某件事物成,人们的头脑中常会浮现字词。字词长久以来是构成知识的原子,诠释着信息。这种通过字词的编码方式,便利着人们理解事物。由于书写文化,这种编码方式以及思考过程,仍存在人的心智和头脑中。而到了现在,编码方式变得越来越抽象和难以触摸。
后来,传奇人物巴贝奇不满足于现在的编码方式,试图将思想的力量注入齿轮机械。他创造了差分机,第一次将复杂的人类思维活动复制到机械中。差分机的价值在彼时并未被世人所察觉,直到后世才展现出天才的光芒。差分机,可以说是电脑的前身,这种尝试也给后世的科学家们以无限灵感。
但直到目前来说,人类在远距离通信上仍进展缓慢。在18世纪,有人进行“信号塔”的研究,但这种通信方式费时费力,是单向的传播方式。由于层层传播,信息在传递过程中难免走样。随电报出现,信号塔很快过时。1859年,历史学家托利弗在俄国旅行时看到死亡已久的信号塔,如是说,“这些信号站如今已陷入沉默,再不见指示的动作。他们默默矗立在高处,很快将屈服于时间的侵蚀之手。而电线,尽管外观没有那么雄伟,却遍布整个帝国,用燃烧的火焰将君主的意志传递给四散在他广袤领土上的六千六百万民众。”
电报问世前,一个重要的问题是,如何将字词转换成电线中的律动,这意味着全新的编码方式。摩尔斯提出的解决方案是,以字母表作为起点,通过用新的符号来替代旧的符号来对其加以利用。这种将意义从一种抽象转换为另一种抽象的过程,是数学本质的体现,也是编码的过程。电报成功后,不仅是对远距离通信问题的解决方案,甚至开创出一种前所未有的语言简洁风。由此而来的密码问题,更是让一代代数学家贡献脑力,深化了人类对编码的认识。
《信息简史》这本书中心人物便是香农。他以一己之力奠定了信息学的基础,现在信息领域的诸多技术都是由他的思想演化而来。在《通信的数学理论》中,香农这般阐述,“通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。这些讯息往往都带有意义。”其中点的概念,抽象了时间和空间。讯息的原始表达是message,而不是information。区别在于message是各种具有实际意义的事物的总称,比如一部小说、一段音乐,与抽象的information不同。这样一来,信息论便有了非常广泛的实用意义。
在科学发展过程中,思想的杂交具有无穷的魅力。书中出现的思想成果,很多都是在各种讨论、会议、论坛等场所由思想碰撞而产生的。对语言、数学和机械的痴迷让巴贝奇创造出差分机。信息学诞生后,为还没弄清楚研究对象的心理学输送了无穷养分。在学习信息简史之前,若被问起信息相关的概念,我会想起历史上种种的信息载体——文字、书籍、广播、电视、互联网等,但信息的概念,远大于此。信息不仅出现在传统意义上的载体中,我们身边一草一木一生灵,都会是信息的载体。这就引出了DNA。
谁是强者,人还是基因?
如果从基因的角度来思考,人只不过是信息的载体罢了——一组组基因组聚集和生存的地方。从这个意义上说,人与地球上大到大象小到蛆虫的生物没有区别。肉身会毁灭,存活下来的是基因。而人在自然界的脱颖而出,也仅是寄居在人体内的基因组为了自身生存而不断改进的产物。用比较专业的话说,基因就是DNA核苷酸的一段线性排列,他决定了蛋白质氨基酸的一段线性排列。归根到本质,基因就是信息,基因就是比特,基因就是生命的编码。
基因归属于生命科学,在社会科学中,与之相对应的便是《自私的基因》一书作者道金斯提出的“meme(模因)”。模因是一种无形的复制子,它可以是一段旋律,可以是一种思想,也可以是一句流行语。它以语言为载体,以人类文化为原生汤,在人类的大脑中产卵。相比于基因,它更新,但传播和进化的速度却是基因所不能及。
以近些年中文世界的流行语为例,如“不明觉厉”“小鲜肉”“屌丝”,这些新时代的称呼,迅速成为潮流,突破了网络一隅的滋生地,走入主流社会群体中。我们所有人,都有意识或无意识地使用过这些词汇。有时,为了使传播更为广泛,模因还会借助节奏和韵脚来扩大自身的影响。用丹尼特的话说,“一个模因就是一个自行其是的信息包”。而人类是模因的助手和载具。
基因和模因的提出,受到了冰火两重天的评价。反对者难以忍受人被边缘化的景象,基因和模因成了世界的强者,而人只是众多实体的一种。丹尼特这样总结此种情景,“我的大脑不过类似某种粪堆,滋养着他人思想的幼虫,直到它们成熟后在一次信息流散中再度散播出去?……倘若如此,那么到底是谁在掌控?是我们,还是我们的模因?”而支持者发出警示之语,“人类中心主义是人类智识的一大残疾”。明确复制子的地位,对生物学和社会学的发展大有裨益,其本身也代表着对信息的认知。
如何面对信息洪流?
如今的时代早已不是那个信息匮乏的时代,我们正生活在古人梦寐以求的巴别图书馆里,信息过载、信息洪流成为新常态。谷歌为代表的搜索引擎帮助我们更快捷地获取信息。但面对信息的指数级扩张,单纯的搜索引擎恐难以达到有效的信息抵达,更何况搜索引擎本身也会生产很多搜索者不需要的信息。
现在互联网都快成过往,一大批公司和研究机构正转向开发物联网。那将是一个信息更加繁盛的阶段。为使我们不至于迷失在信息海洋中,抛去技术上的支持,我们该做的是守住本心。面对海量信息,不要让信息侵犯你,而是在兴趣和好奇心的指引下,去获取信息,以求为我所用,随心而动。