吴军老师的第十八封信,期望值最大化和在生活中的运用,老师说“在每一时刻,算出能够最大化收益(期望值)的方向”,沿着这个方向走一小步,然后再从新的起点重复这个过程,不论从何处起始,最后一定能够达到收益最大的那个终点。
比如一直被国人吐槽的国足,前段时间又输给了小组最弱对手叙利亚,提前告别了俄罗斯世界杯,大家都很着急,但是无论投钱,还是换帅,都无济于事,国足默默承担着国人愤怒的情绪,其实就我个人而言,我是蛮心疼国足的,因为我知道,他们身上背负的压力,他们也渴望赢球,甚至比球迷更渴望胜利,渴望被证明。但是结果往往不尽人意,究其原因其实根本不怨国足,真正的原因是体制(别说中国13亿人找不到踢球好的10个人,这不是输球的本质).
当透过现象看到本质,吴军老师这样说道,其实有一个很简单的方法让中国足球冲出亚洲,甚至成为世界足球冠军。只要教育部宣布,从今往后高考一半分数看文化课成绩,另一半看足球成绩,马上中国所有的广场都会被踢球的孩子占领,所有的家长给孩子安排的课外活动都会是足球,各省市都会往足球上砸钱。回到前面的收益函数,,就是期望值最大化,只要这个函数一确定,整个社会就会变成一个机器学习的系统,期望值最大化的方法会自动优化全社会,让足球成绩达到最大值。
再如一个人交朋友,开始可能有很大的随意性,但是他内心有一个衡量标准(收益函数),就会最大化自己的收益,久而久之,对他好的人,能够彼此产生“化学反应”的人,以及距离比较近的人(方便于帮助他)就成了他的朋友,其他人就渐渐淡出了他的生活圈。
让我想到从人类发展来看,人本质就应该是趋利避害的,也必须这样,不然人类怎么可能一直延续至今,应用到公司里面,就是设置有效的奖励机制(收益函数),这时候全公司的员工就会不自觉的最大化它。所以对一个人来讲,最重要的就是定方向,对一个公司来讲,最重要的是定规矩,这样期望值最大化就会发挥作用。