维京说21 简析AlphaGo中Monte-Carlo tree search算法原理

问题:AlphaGo中的Monte-Carlo tree search是什么原理?

nature的《Mastering the Game of Go with Deep Neural Networks and Tree Search》 原文对蒙特卡洛查找树(Monte-Carlo tree search)的描述:

Without any lookahead search, the neural networks play Go at the level of state-of-the-art Monte-Carlo tree search programs that simulate thousands of random games of self-play.

我举个例子来侧面描述一下这个逻辑:

假设现在有个不规则形状A,怎么统计这个形状A的面积呢?
我用一个圆圈B住这个A,然后在B上面疯狂的随机打点,打上一万个。然后看有x个点落在了A上。那么A约值B*(x/10000)。

所以下棋逻辑差不多:
任意给定一个棋盘,我不知道这个棋盘上剩余哪个子一定能赢,但是我知道概率啊。
于是在y1这个落子上我接着下了一万局(先看别人怎么玩,再自己左右手互搏着玩),统计一下胜利了x1次,于是y1子上赢面是x1/10000。以此类推,y2上的概率是x2/10000...好像yn赢面很大啊,我下yn吧。
所以,虽然我不能穷尽所有可能性,但是每次我落的那个棋子都“可能”是最有机会赢的。

什么是棋感?就是全盘看下来,好像这样落子赢面更大一点。
一步算一步的这么下着下着,咦,我怎么就赢了。


系列目录:http://www.jianshu.com/p/efd0d0b90ddf
字典汇总:http://www.jianshu.com/p/6ff2604bbe6b

See you:)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 最近一直在看欢乐颂,前几天是跟同学一起在学校看,最近五一一个人看,一个人看,给了我更多的感悟。我总觉得我好像可以理...
    nononoway阅读 273评论 0 0
  • 我希望 太阳睁开蒙眬的双眼时, 我与万物一起苏醒, 平静地生长,风调雨顺,静谧祥和 我希望 天空之下,清风徐来 眉...
    slooby阅读 468评论 0 1
  • 他在这里很久了 在楼下一直等待、徘徊 是在等什么人吗 孤单的身影显得格外的清瘦 不合时宜地 天空下起了大雨 豆大的...
    爱读书的无为阅读 183评论 3 2
  • 我家江水初发源,宦游直送江入海。闻道潮头一丈高,天寒尚有沙痕在。中泠南畔石盘陀,古来出没随涛波。试登绝顶望乡国,江...
    诗文书法国画交流平台阅读 748评论 0 0