好久没有静下来了,学一点东西,写一点东西。 短短的几个月太多的事情,结婚,投稿会议,投稿期刊,可能面临博士的延期,太多的事情,纷繁复杂,前面想看看耶鲁的死亡课都只看完了一课,就未能延续,甚憾。 冷静下来,其实,人生漫长,万事万物,皆是磨砺。正逢参考文献时看到一篇写非合作QoS的博弈的论文,想着看一下博弈论的公开课,写一点东西,记录一下体会。
博弈论在我看来,是一门很神奇的学科,他可以有严格的数学表达,也可以感性去理解。很早就接触过的囚徒困境,给我感觉就是我好像略懂博弈,但是其实对于这门广泛应用与现代科学各个领域的学问,我感觉又不得其门而入。 面对网易公开课上的两个选择,耶鲁的学院派以及国内一个不知名小哥的版本,我果断选择由浅入深,先看一看通俗版的博弈论有什么样的风景。
不出所料的开头,从囚徒困境开始, 揭露了一个基本的道理,就是个人利益最大化或者损失最小化,达到纳什均衡点 (可能不止一个)。 接下来是反复博弈,即两人多轮博弈。 举了Robert教授80年代的一个硬币匹配实验,完全合作,完全背叛,随机选择的效果都不大好,这也在清理之中。得分最高的所谓一报还一报的策略,即首先选择合作,以后每一轮复制对方上一轮。 多人博弈是以上情形的一个扩展,由于情形复杂,小哥这里的介绍过于简单,只是举了个很容易达到纳什均衡的例子,得到的结论是站在对方立场相对容易和快速达到均衡点。这一块等以后用的时候,follow学院派的理论好好看看。
多选择博弈也是一个有趣的topic,已选举为例,证明在双人博弈中,中位数原则的选择是有利的, 然后 一个城市聚集的例子,简单接受了这个系列终极topic,多人多选择的问题。解决办法,没有看出新意,还是闭环构成均衡点,但是小哥一句free的国家可以用脚投票选择宜居的城市,略扎心。 最后以刷单中伪装和声誉激励,以及海盗分赃来结尾,算是生活中的趣味博弈案例。 小哥的视频,虽然简单,但也确实打开了博弈论的一角。 我总结,最精髓之处在于博弈论的决策,无论是合作还是对抗,都要知己知彼。