都说上了大学之后要知道"学习如何学习"而不是去学习,结果这句话仿佛变成了一句俗语,并没有人深究什么叫做学习如何学习了。不管是快速学习新知识(而非系统性),还是在科研领域追求突破,还是学以致用精进工作之后的工程实践,都频繁的需要一种能力,这种能力是和死读书、背知识点背道而驰的,它可以提炼新规律,发现新定理,形成新方法。
这种东西就是洞察力。
《Seeing What Others Don't》,即《洞察力的秘密》一书提到的120个案例中,82%的案例使用了触类旁通(即类比)的办法,38%来自于错误理论自相矛盾导致正确理论的建立,10%来自于巧合(偶然发现了正确的事实),7。5%来自于好奇心,25%的情景是打破僵局急中生智。你能够对以上数字加总后发现,很多案例都具备2种或以上的情景。
我不禁有些好奇,以上的分类数目——5类——就一定合理吗?在聚类算法中,随便选择一个magic number并不是什么特别好的方案,就算是自动选择聚类数目的算法,其中的超参数也是指定的吧?我们可以简单一点把上面几个分类再次聚成3类。
1 洞察力的根源
a 触类旁通+好奇心导致的洞察力
很少有人听说过二战爆发之初,1940年11月11-12日的塔兰托战役,英国的老式战机使用改造后沉水较慢的机载鱼雷轰炸了意大利舰队,使后者的半支舰队退出战队长达半年之久。如果你是一个充满好奇心、懂得触类旁通旁通的人,那么恭喜你,你和当年日美两国的海军上将想到一块儿去了。极为讽刺的是,时任美国海军作战部部长的上将哈罗德塔斯克在40年11月22日就签署一份备忘录,"在珍珠港内放置鱼雷网非常有必要",还给海军部部长写信说明这一点。结果其他的美国人根本就不重视这一点,认为珍珠港水深足够浅,而日本人长途跋涉也无法在不被发现的情况下进行物资补给。鱼雷护网也根本没落实。更邪门的是,日本海军上将山本五十六本身是一个反对侵占东北、反对全面侵华、反对与纳粹德国结盟、反对日美战争的将领,海军大臣出于保护他仕途的目的让他在海上工作。与骄傲自大的日陆军决策层不同,山本担心的是日美正面对抗,以及是否真的对最后的战果有信心。时势所迫,山本在1941年1月把突袭思路落实在书面上,并在当年12月放手一搏,成功地实施了震惊世界的偷袭珍珠港事件。
在这里要充分说明的是,无端地认为重型鱼雷要下沉水深至少30米才能工作这一点本身就是错误的:英国人用金属丝提起鱼雷前端,使腹部先落水,而且还给鱼雷增设了木质的鳍来减缓下落,在塔兰托军港水深仅有12米的情况下成功实施了打击。好奇心是一种不存在先入为主的见解:如果不是专家或者科学家,你很难想象一位英国海军将领不对"30米"这一神奇的数字深信不疑,但如果这一数字变成了一个科学研究任务,那么事情就又不同了:人类的主观能动性,或者说"不设限"的思想就能把一部分人认为不可行的方案变成可行方案。
b 急中生智:不能小看肾上腺素和求生意志
1949年8月5日,西蒙大拿。
15位空降消防员希望控制在曼恩峡谷发生的森林大火,然而他们在降落后遭遇了一连串二次火灾的大爆发,在每小时30英里的风势下,他们马上就要被山火在1分钟内追上。幸存的3位消防员在瓦格纳。道奇的急中生智下得以幸存:与其被火追上,不如在自己面前先放一把火,然后自己用浸湿的手帕堵住口鼻,把脸藏在余烬里。既然火的燃料就是干草,没有了燃料火就不能蔓延,那么只要除掉干草就好了。如何除掉呢?就是用自己点的火除掉。
类似的故事不一定是在求生时发生的。为什么大学生喜欢临时抱佛脚、喜欢赶在deadline之前完成任务、作业、甚至论文?因为在那个紧张的状态下,整个身体的机能是高效、协调的,在12个小时内就能完成别人一周的工作任务。虽然这一点也不值得鼓励,但是在这种情况下,论文往往还会出现创新思维的火花,而不是像别人的工作一样中规中矩。适度的肾上腺素是我们的朋友。因此一成不变的时间表对我而言也是毫无吸引力,适当的刺激以及事前事后充分的休息,才会真正让人感觉到"活着"。
2 破坏洞察力的根源:懒惰。
发现矛盾不破不立,以及巧合是提高洞察力的另外一组有效机制,这里就不得不先谈谈破坏洞察力的根源——思维上的懒惰。先把有没有好奇心放在一边,对问题的视而不见,或者习惯于把所有不满足自身想法的样本全部归位巧合本身,就是一种思维的懒惰。而有时候太依赖巧合性的实验则充分说明了行动上的懒惰。
19世纪中期霍乱流行,当时已经很有名的医生约翰斯诺提出霍乱并非是毒气传播时,仍然遭受了不少非议。霍乱弧菌会导致腹泻、呕吐,使人脱水死亡,但那个时代里,人们并不了解细菌致病的机理,也没有检测微生物的仪器,因此盲目相信空气致病是一种思维上的懒惰,毕竟大家呼吸的是同样的空气。随着研究的展开,斯诺不断发现:
* 同一间屋子里住着的人有一部分感染霍乱,另一部分没有
* 病人解剖后,肺部没有病变,消化系统有病变特征
* 同一个社区从两家给水公司取水,上游公司的客户都没有感染,下游公司客户有较大比例感染
* 宽街水泵水井附近聚集着大量霍乱病例
第一点是现象,第二点是有针对性的研究,第三四点是带一些巧合性的天然实验结果。有的时候,人是会在第三次、第四次"巧合"发生时,才惊觉应该使用新的理论来解释之前的矛盾现象,而不是抱着错误的理论不放,把所有outliers(异常点)都归为巧合。按理说,斯诺的这些发现几乎能彻底推翻了之前的理论了,那么为什么在医学界里,哪怕是《柳叶刀》这样的科学杂志都仍然执迷不悟,长达数年地反对斯诺的观点呢?
思维上的懒惰和身体上的懒惰简直同样可怕。
3 机器何时能有洞察力
先从一个等式说起:
提升效果 = 增加效率(准确率和速度)+ 加深洞察力(做减法)
在我眼里这就在说一件事:机器学习的发展是离不开前者(有监督学习)和后者(无监督学习的)。但是往往,受到功利性、KPI的制约,前者更容易在工程化里做到极致,而后者往往能够出现在科研机构、高校研究所,在机器学习领域的重大突破所需要的洞察力大量来自于人类自身的思考模式或者人类自身的结构(知识库,专家决策系统,神经科学etc),然而大家都把这些类比写成了套路性质的代码,用来提高算法的准确率和速度,几乎没人关心机器如何模仿人类的洞察力。
直到现在为止,我在数据清洗上对于一份残破不全的身份证还需要写正则表达式规则才能提取出其中的有效信息,但仍然有人还在迷信"机器学习包治百病,自动化处理数据100%准确",这不能怪他们——他们并不知道机器学习在现在的阶段并不拥有真正的智能:我们有预测销售的模型、物品分类的模型、自动驾驶的模型、自动下围棋的模型等等,但是谁真正在乎让自动驾驶汽车又一天突然会下围棋,又有一天突然会跟人类实现智能对话?几乎全部的机器学习模型本身仍然还是"习得性"的知识。如果没有长期无监督学习的研究积累,机器学习模型就无法跳变式地增加准确率和速度(比如大家现在已经知道在多层神经网络下面加AE了);如果没办法对整个结构进行松弛,而只是对参数进行松弛(比如注意力模型)得到的效果也只能像是行星运动大圆套小圆那样的修修补补了。
机器学习的逻辑对人类学习的逻辑模仿至少要满足几点才可能接近到达产生智能的关键点:
* 单位时间耗电量(能源)就像人类的精力约束一样,将成为新的惩罚项
* 在1的基础之上,模型对于增加新参数而言,更喜欢对参数分类或者去除(决策树剪枝、L1正则化)
* 注意力仅仅是学习的一小部分:知道哪里需要注意本身就是一种洞察力,这种洞察力绝对不是仅有领域内的知识就足够的,要把知识应用于领域外,再进行迭代,才有可能更好地进行注意力管理。人尚且有自控力不足,不想学习只想打游戏的时候,何况暂时没有自主挑选能力的机器?如果机器知道哪本书写得好,哪本书写得烂,很明显要比不加挑选地学习几十万本书高端得多。总让机器看10w+的朋友圈,这个机器的思维估计会low破天际。
结论:今天的努力工作和思考,不仅仅是为了维护人类洞察力的尊严,也是为了以后还能有资格脑后插管。CPU、GPU、FPGA能异构计算,在其中加入人脑也并不违和。