吴军硅谷来信第18封信
本封信关于期望值最大化原则。
期望值最大化是机器学习算法重要的理论基础,同时在管理学又有非常广泛的应用。
吴军老师解释了什么是期望值最大化:只要给出一个收益函数,在某一时刻,算出能够最大化收益的方向,沿着这个方向走一小步,然后再从新的起点重复这个过程,不论从何处开始,最后一定能够达到收益最大的那个点。当然,这一切都是一步一步优化的
在我们的生活也会应用到它。IBM奖励员工发专利,谷歌有段时间为了省钱没有发专利的激励机制,虽然它在内部教育员工专利重要性,但是结果是人均申请专利数量锐减,最后造成与苹果、微软的专利之争非常被动。你猜后来怎么着?
谷歌终于改变政策:申请一个专利可以获得一万美元奖金,专利数蹭蹭的回来了。从这个很小的例子我们可以看出:公司设置什么样的收益函数,员工就会最大化它。创始人最重要的事就是立规矩。
人都是趋利避害的,无论上层是有意还是无意制定了收益函数,他们的员工一定会朝着最大化自己利益的方式去做。因为期望值最大化也是我们地球能够孕育生命的法则,比如物理学的基本原理,物质之间的4种基本作用力就是收益函数。
想想我们教育孩子都是一样的,如果孩子发现他哭闹你就会妥协,那么他每次都会用这招。这是他的收益最大化做法,却是我们无意设置的