吴军的《数学之美》买了有一两年了,但是摆在那里从来没有看过,年前一段时间闲来无事,坐下来居然静静的看完了,颇有收获。
统计学规律比语法及定律规律的可靠性
在计算机领域,计算机语言在识别人类语言和规则方面,统计学似乎比语法,规律更好使。在搜索领域,在语言识别领域,以及神经网络学习等,基于大数据的学习分析,计算机变得越来越聪明。吴军老师用通俗易懂的解说让我这个外行理解了计算机在语言识别,搜索,路径规划等多个领域的工作方式。虽然我还不知道这些对我有什么用,没什么用也没啥不好,活个明白也好。
基于规律和基于统计,目前看来是统计胜出。
有点像法律中不同的法系。有的是基于律典,有的则是基于以往判例。基于固有典法有时会过于死板,而基于判例则会越来越比较合理。
又有些像经典力学和量子力学,经典力学基于公理定理,而这些在更加微观的层面却无法对现象进行解释,而需要用另一套规则。
很多思想是通用的
书中还讲述了吴军老师的一些经历和感触,可以发现,不同行业还是有很多想通之处。
比如,工程上越简单越好,有的模型简单,虽然不如一个复杂模型精确度高,但是在实际应用当中,已经足够好,虽然在结果准确度或是精度上不如一个复杂模型,但是是实用的。一些复杂模型虽然理论上更加完善,但是可能会复杂到无法实施或是无法操作。
再比如,一个正确的模型可能一开始不如一个精雕细琢的错误模型;学术领域很多人重方法而轻数据。
此外,还有一个认知我认为也很重要。“在工业界,只要采用基本的统计语言模型,加上一些业界熟知的技巧就能得到很好的分词结果……”。(p45)在我们实际工业过程中,一些科研工作者盲目追求创新,而忽视了对现有经验的总结和使用,导致为创新而创新。
我一直有一个观点,能把现有技术玩转,就很厉害了。创新需要天时地利,不是每个人都能那么灵光一闪。
最后,想说两句:
1.数学真的很重要,但是我们的教科书编的让人们觉得数学离我们很远。
2.大数据真的好可怕。