阅读及笔记时间:2018年10月1日-2018年10月7日,约5小时;
阅读书本:《数学之美》;作者:吴军;2014年11月第2版;人民邮电出版社;P1-312页;
阅读目标:为什么说数学之美?它的美体现在哪里?
阅读方法:影像阅读,快速阅读
整书笔记及感想:
阅读3小时,笔记2小时。
前些天偶然听到吴军演讲的一段音频,他在音频中讲到很多人不知道学习数学有什么用?而在他看来学习数学可以练习逻辑推理能力,阅读理解与表达能力,训练抽象思维能力。他的演讲令我对他的作品《数学之美》产生了兴趣。
数学是基础科学,它与很多学科相关。人工智能从本质上来说就是数学模型。在《数学之美》这本书里讲的其实就是数学在人工智能上的多种应用。在我原先的理解中,所谓人工智能,机器应该就像人脑那么聪明,它是模拟人脑的。看了这本书,我知道自己理解错了,不,它不是模拟人脑思维,而是运用形式上简单的数学模型去解开一个个智能(工程)难题,诸如手写输入、语音识别、搜索引擎、地图导航、机器翻译、自然语言处理等等。的确非常神奇!
首先吴军博士讲了为什么数学很神奇。在今天的城市里人们花时间最多的是在电视机、互联网、电话上,这些都统称为通信方式,这些通信方式都遵循信息论的规律,而整个信息论的基础就是数学。整个通信的过程就是编码(讲话、发信息)、信息传播(或在空气中传播、或在光缆中传播)、解码(听到或收到的信息),这个模式古今中外都一样。解决通信问题采用的是数学中的概率统计方法。
之后作者讲了许多数学应用的例子,帮助读者对数学之美有一个较为具体而细致的认识。作者从通信、自然语言的机器处理开始介绍。
20世纪50年代有个著名的测试叫做“图灵测试”,就是让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,那么这个机器就有智能了。当时科学界采用的是电脑模拟人脑,首先得理解人的语言(识别人类语言的规则,基于规则的自然语言处理)才有可能识别人的语言,所以,道路曲折而艰难,进展相当的缓慢。到了20世纪70年代,另一路科学家另辟奚径改用通信的原理去处理自然语言,也就是基于统计的自然语言的机器处理,随着计算机运算能力的提高,数据的增多,这个方法为自然语言的机器处理打开了一条光明的道路。它的原理是在已知第一个词的前提下,第二个词出现的概率与第一个词相关(即马尔可夫假设),第三个词又与第二个词相关,根据大数定理,只要统计量足够,相对频度就等于概率。
语音识别、机器翻译也是利用统计语言模型计算出每种分词后句子出现的概率,并找出其中概率最大的,来确定语音的识别与机器的翻译,它运用的是隐含马尔可夫模型(马尔可夫假设+独立输出假设),求最大值概率。这个模型最早的成功应用是语音识别,后来又陆续成功应用于机器翻译、拼写纠错、手写识别、图像处理、基因序列分析等很多IT领域,它也是机器学习的主要工具之一。近20年来,它还广泛应用于股票预测和投资。
通过信息熵来对信息的不确定性进行度量。信息是消除系统不确定性的唯一办法 ,如果没有信息,任何公式或者数字的游戏都无法排除不确定性。几乎所有的自然语言处理、信息与信号处理的应用都是一个消除不确定性的过程。通过互信息来作为两个随机事件相关性的量化度量。完全相关时,取值1,完全不相关时取值为0。互信息被广泛用于度量一些语言现象的相关性。
二进制在搜索中的计算机中的应用。中国古代易经中的阳爻、阴爻可以认为是最早的二进制雏形;到17世纪德国数学家莱布尼兹完善了二进制,用“0”和“1”代表它的两个数字,或者代表逻辑中的“是”与“非”;19世纪英国的布尔用数学方法解决了逻辑问题,运算的元素只有两个1(真)和0(假),基本的运算只有“与”、“或”、“非”三种;1938年香农运用布尔代数实现开关电路,使之成为数字电路的基础,所有的数学和逻辑运算全都能转换成二值的布尔运算。后来,二进制不仅成为计算机的语言,还大量运用在索引中,比如有3篇文献,则用3位的二进制数表示一个关键字是否出现在文献中,010,0代表没有,1代表有,如果有N篇文献,则用N位的二进制数表示关键字是否出现在文献中。对于互联网的搜索引擎来讲,每一个网页就是一个文献,因此,布尔代数模型可以快速地帮助用户搜索。
除此之外,数学的应用还有很多,比如,用图论的遍历算法自动下载互联网的网页;用网页与网页的相关性进行加权的民主表决来度量网页的质量(这里还涉及到二维矩阵的应用);用相关性及加权词频对网页进行排名(这里会用到对数函数);用有限状态机和动态规划应用在识别地址、导航、语音识别等领域;用矩阵运算中的奇异值分解一次性把所有新闻的相关性计算出来,进行文本的粗分类,再用余弦定理进行精确的新闻分类。。。。。。等等非常多的应用,因此说,数学的确有这个魅力将复杂的工程问题简化成一个个公式,然后通过大量的机器运算去实现这些功能。
最后想再强调一下,所谓的人工神经网络,它不是什么都能思考的大脑,与其说它很聪明,不如说它很能算!计算能力的不断提高有助于仅通过简单的数学方法解决复杂问题。