图灵与香农以及他们的大时代(《知识产权简史》人物篇)
作者:读裁者黄远辉,专注人文科技、知识产权
大家都知道,苹果公司的LOGO是一个被咬了一口的苹果,大家因此猜测这个苹果是不是图灵自杀时咬的那个苹果(沾了剧毒氰化物)。后来苹果公司出来解释说,这个被咬掉的苹果其实是艾萨克·牛顿爵士的苹果。苹果最早的LOGO就是牛顿坐在苹果树下看书的情景,LOGO设计者韦恩是苹果公司的联合创始人之一。直到乔布斯决定要修改苹果公司的LOGO,韦恩才设计成一个被咬了一口的苹果。
《知识产权简史》人物篇迎来影响至今(预计整个21世纪还会持续受到他们的影响)的两位伟大人物——艾伦·图灵和香农,推荐阅读书单:《艾伦·图灵传》《香农传》《生命3.0》。
艾伦·图灵(1912年6月23日-1954年6月7日),英国数学家、逻辑学家、密码学家,被称为“计算机科学之父”,“人工智能之父”。我们先简要回顾一下艾伦·图灵充满灵性的一生,图灵少年时就表现出独特的直觉创造能力和对数学的爱好。1926年,14岁的图灵考入伦敦著名的谢伯恩公学,受到良好的中学教育。1927年,15岁的图灵为了帮助母亲理解爱因斯坦的相对论,写了爱因斯坦的一部著作的内容提要,表现出非凡的数学天赋(《知识产权简史》已出场的多位人物均表现出超高的数学天赋),获得过国王爱德华六世数学金盾奖章。15岁那年,图灵在罗斯公学遇到了克里斯朵夫·默卡(比图灵大一岁),一见钟情,从此彻底改变了他的一生。为追随爱人,1931年,图灵考入剑桥大学国王学院,在国王学院就读期间荣获英国著名的史密斯数学奖。1936年5月,图灵向伦敦权威的数学杂志投了一篇论文——《论数字计算在决断难题中的应用》,他在论文中描述了一种可以辅助数学研究的机器,后来被人称为“图灵机”。图灵机首次将纯数学符号与实体世界建立了联系,后来出现的电脑、人工智能都是基于这个设想才发明的。图灵毕业后在美国普林斯顿大学攻读博士学位,二战爆发后返回英国剑桥,发明一种名为“Bombe”的破译机,协助军方破解德国密码系统Enigma,“得益于图灵的这个贡献,使得二战足足提前了两年结束”。1950年,图灵发表论文《计算机器与智能》(1956年以《机器能思考吗?》为标题重新发表),提出著名的“图灵测试”,为他赢得“人工智能之父”的称号。1951年,图灵成为英国皇家学会会员,年仅39岁。1952年,保守的英国政府对图灵的同性恋进行定罪,并对图灵实行化学阉割,即注射雌激素。1954年6月7日,图灵无法忍受化学阉割对心灵带来的巨大折磨(雌激素产生了声带变化、乳房发育等副作用),将含有氰化物的苹果咬入口中,告别人世。
1999年,图灵被《时代》杂志评选为20世纪100个最重要的人物之一。2013年12月24日,英国女王向图灵颁发了皇家赦免,英国司法部长宣布:“图灵的晚年生活因为其同性取向而被迫蒙上了一层阴影,我们认为当时的判决是不公的,这种歧视现象如今也已经遭到了废除。为此,女王决定为这位伟人送上赦免,以此向其致敬。”
人工智能专家道格拉斯·霍夫施塔特对图灵的评价:“一边是计算机科学中最有诗意的概念和理论,一边是在第二次世界大战时为世界和平而解谜。”《科学美国人》这样评价图灵的一生:“个人生活隐秘又喜欢大众读物和公共广播,自信满怀又异常谦卑。一个核心的悖论是,他认为电脑能够跟人脑并驾齐驱,但是他本人的个性却是率性而为、我行我素、无法预见,一点也不像机器输出来的东西。”
为了纪念图灵对计算机科学的巨大贡献,由美国计算机协会(ACM)于1966年设立一年一度的图灵奖,以表彰在计算机科学中做出突出贡献的人,图灵奖被喻为“计算机界的诺贝尔奖”。
与在英国的艾伦·图灵遥相呼应的另一位天才人物,是在大西洋彼岸的克劳德·香农(1916年4月30日-2001年2月24日),美国数学家,信息论创始人,是“信息时代之父”。1936年获得密歇根大学学士学位,1940年在麻省理工学院获得硕士和博士学位,1941年进入贝尔实验室工作。香农提出了信息熵的概念,为信息论和数字通信奠定了基础。香农生长在一个有良好教育的环境(历史上,大家可以统计一下,一般作出过重大的贡献的人物,一般都受过良好的教育,当然不是绝对的,教育很重要!),香农主要受祖父(农场主兼发明家)的影响,发明过洗衣机和农业机械,香农还是大发明家爱迪生的远亲。
与图灵的不幸相比,小四岁的香农要幸福的多,图灵只活了41岁,而他活到了21世纪,享年84岁,我们重点看一下香农的高光时刻。二战时,香农与图灵一样,也是一名密码破译者,主要是追踪德国飞机和火箭。香农提出过一个非常重要的概念——信息熵,证明熵与信息内容的不确定程度有等价关系。熵是波尔兹曼在热力学第二定律引入的概念,可以理解为分子运动的混乱度。熵在创新、信息等各个领域都有应用(我曾写过《熵、创新、知识产权与税》的文章,请大家往前翻看),信息熵表明汉字的静态平均信息熵比较大,中文是9.65比特,英文是4.03比特。什么意思呢?就是说中文的复杂程度要高于英文,中文字含的信息要比英文字母丰富,尤其是文言文,言简意赅,中文是世界上最难学的语言(骄傲不?)。不知道大家有没有看过英文原版的教材或者其他书籍,你会发现这些很厚的英文书籍翻译成中文后会薄很多。当然考虑信息熵,中文表达会丢失掉一部分英文原本信息,这也是为什么翻译工作非常难的原因,要做到信达雅非常不易,向翻译者致敬。
1948年,香农发表数十页的论文《通信的数学理论》,成为信息论正式诞生的里程碑。他在通信数学模型中,提出著名的计算信息熵的公式:
计算公式中的对数log如果是以2为底的,那么计算出来的信息熵就以比特(bit)为单位,计算机和通信中广泛使用的字节(Byte)就是由此演化而来的。香农曾举过抛硬币的例子来说明这个计算公式,我们抛硬币每次抛出正面朝上的概率都是1/2,硬币出现正面朝上的信息量=-log2(1/2)=1比特,信息熵就是把一条消息中出现的所有字符,做信息量的加权平均。以此类推,26个英文字母选出的信息熵最大可以达到4.7比特,考虑WXYZ不常用,就得出我们前面说到的4.03比特,2500个常用汉字中的信息熵可以达到11.3比特,这就是为什么中文是一种更高效的语言。香农认为英语是冗余度非常高的一种语言,一般英文文本中75%的字符都是多余的。
香农在32岁完成系列开拓性的工作之后,放弃了一切,继续玩他小时候的兴趣——搞发明,他的发明包括命名为“忒修斯”的可以自动穿越迷宫的电子老鼠,能够在家散步的“建造模型”龟,首台能下国际象棋的电脑,首台可穿戴电脑,代号为 THROBAC的使用罗马数字进行运算的计算机等等。有人评价香农是融合了理查德·费曼(1965年诺贝尔物理奖得主,我曾推荐过他的自传《别闹了,费曼先生》)的玩兴和爱因斯坦的天赋。香农富有创造力、丰富绚烂的一生证明,游戏精神对于工作而言是多么重要,人称现代“达·芬奇”(请往前翻看我在《知识产权简史》人物篇中写的《穿越时空的全才列奥纳多·达·芬奇》)。香农真正伟大的地方在于,他用数学语言量化了信息。
万维钢老师说,从信息论角度来看,最重要的不是你说了什么,而是你能说什么。信息论的价值观是要求选择权、多样性、不确定性和自由度。我们要在这个世界上留下自己的痕迹,这就是我写《知识产权简史》的初衷。