天天刷书,一起成长。我们今天继续看王烁的《三十天认知训练营第二季》,这讲的标题是《选择:反馈最后会把你带到陷阱》。
英国哲学家塞亚伯林有个比方,说有两种人,一种是刺猬,一种是狐狸。
刺猬只知道一件大事,就一直做这一件事。
狐狸知道很多小事,就会不断地试。
知道大事的刺猬,大部分都是错误的。
总是不断探索小事一点一点前进的狐狸,可能会获得最终的胜利。
王烁说,狐狸的胜利在于它在尝试,并通过反馈的结果,不断地更换选择。
反馈在很多的学习方法中,都是重要的一环,比如刻意练习。
从反馈角度来讲,可以有三种学习方法。
1// 通过什么来反馈
想要反馈,先要知道试什么途径来获得反馈。
第一种,就是从自己的经验反馈中学习。
摸石头过河,就是从自己的经验反馈。
每件事做完,对的,就继续;错了,就换赛道。
这个反馈最直接,有点像计算机里的算法。
第二种,模仿别人。
找个对标的对象,他怎么做,我就怎么做,copy不走样。
甚至有些不知道目的的动作也做,因为也不知道到底哪个动作有用。
第三种,进化算法。
进化算法就是模拟自然界的套套逻辑(tautology):适者才能生存,而生存下来的就是适者。自然界就在循环论证。
当然进化中也有没用的部分,但如果不影响生存,可以完全不care他。
三种方法都重视反馈,根据反馈调整行为,本质上都属于适应性学习。
但王烁给我们警告,重视反馈要有限度,狐狸也会碰到陷阱。
2// 反馈的陷阱在哪里
反馈的陷阱在于短视。
我们接受的反馈,都是最直接的结果,而不是很久以后的反馈。
而且,很多学习方法认为,反馈就要及时。
但这种及时就造成了,我们看不到当下行为对长远的影响。
赢了当下,可能输了未来。
除了时间,还有一个方面,就是范围。
我们会更关注局部,但局部最优未必是整体最优。
有时候局部优化会牺牲整体利益。
适应性学习带来两大陋习,一个是为了眼前得失牺牲将来,另一个是不肯为了全局牺牲局部。
3// 那该怎么办
方法是,去搭刺猬的车。
狐狸和刺猬相比,是短视的,时间上短视,范围上短视。
但刺猬有长远计划,他认准了一件大事,会跨越时间和空间地坚持。
狐狸是一群精致的利己主义者,最后都会掉入陷阱,没有出路,所以要搭配刺猬长远计划的优点。
但刺猬的成功率非常低,一堆刺猬可能只有一只选择的方向是对的。
那怎么管理刺猬呢?
能做的是试点。做大事之前先试点,低投入,隔离影响。低投入,所以失败不会有灾难性后果;隔离影响,所以失败的后果不会传染全身。
然而,王烁告诫我们,这样做问题并没有消失,只是推到了下一个环节:当试点产生经验,需要推广开来时,它会面临着那堵将特区与整体隔开来的高墙,真正的冲突在那里等着它。
其实这是个无解的题,我们只能是找方法做的更好,但逃脱不了最后的命运。
想要现在好,还想要未来好,哪有那么多的好事。
以上就是今天刷书的主要内容,希望对你有所帮助。
天天刷书,一起成长,明天见。