柯洁这次输给了人类，却赢了AI

姓名：李国霏学号：17021210903 专业：信号与信息处理

转载自：https://www.ithome.com/html/next/335058.htm，有删节

【嵌牛导读】柯洁输了，柯洁又赢了。

【嵌牛鼻子】柯洁、围棋、AI

【嵌牛提问】发生了什么？

【嵌牛正文】排名第一的柯洁九段大意失荆州，在11月16日的第22届LG杯世界棋王赛半决赛上，意外输给日本七冠王井山裕太九段，再度无缘LG杯决赛。

不知道是不是受到了今年5月份在乌镇输给AlphaGo的影响，今年以来，柯洁已经无缘春兰杯、三星杯、LG杯三大赛冠军，只剩下12月中下旬的新奥杯可以满足一下他对冠军的争夺。

但这似乎并没有影响到柯洁的心情。

11月18日凌晨零点刚过，柯洁发了一条微博，称他昨天终结了一个昵称叫“符合预期”的围棋AI的41连胜，“一度觉得没法继续了的棋，很艰苦赢了下来。”

柯洁认为“符合预期”的实力在去年战胜李世乭的AlphaGo之上，他还发出了一个世纪之问：“若是当初第一个与AlphaGo对弈的人是我？结果到底会是如何？今夜未成眠……”

显然，在柯洁眼里，战胜围棋AI“符合预期”是要比赢得LG杯冠军更值得庆祝的事情，毕竟自从AlphaGo去年3月份赢了李世乭后，人类就没有在这项古老的技艺上挽尊过。

2017年1月初，披着Master马甲的AlphaGo一路过五关斩六将，干掉朴廷桓、元晟溱、柯洁、聂卫平等一众世界顶尖围棋高手，豪取59连胜后，在电脑上幽幽地飘出一句话：“我是AlphaGo的黄博士。”随后又毫无悬念地赢了古力，以60胜0败收场。

3月19日，在第十届UEC杯世界围棋AI大赛上，中国AI绝艺在决赛中逆袭，一举击败了夺冠呼声最高的日本AI DeepZenGo，获得冠军。

然后就是今年5月23日在乌镇举行的世纪之战，世界排名第一的柯洁对战AlphaGo，第一盘在耗时4小时25分后，柯洁以四分之一子败给了AlphaGo，聂卫平表示这还是“AlphaGo一再退让的结果”，柯洁说：“我很早就知道自己要输1/4子，AlphaGo每步棋都是匀速，在最后单官阶段也是如此，所以我就有时间点目，看清自己输1/4子，所以只好苦笑。感觉AlphaGo和去年判若两人，当时觉得他的棋很接近人，现在感觉越来越像围棋上帝。”

5月25日，第二盘，柯洁执白再次输给了AlphaGo，盘面上大龙横死，只是这次输得快多了。

5月27日，柯洁在第三盘还是输了，他哭了，在认输之后，他起身走到宣传板后没有摄像机镜头的区域独自流泪，哭得像个孩子。

后来，AlphaGo获得了九段称号，但随后从世界排名中停留了一段时间被消失了。

就在我们都以为AlphaGo就此收手时，在10月19日又投下一个炸弹。DeepMind团队在 Nature 上发表了题为 Mastering the game of Go without human knowledge 的重磅论文，称新一代的AlphaGo Zero，完全从零开始，不需要任何历史棋谱的指引，更不需要参考人类任何的先验知识，完全靠自己一个人强化学习（Reinforcement learning）和参悟，以100:0的成绩战胜了AlphaGo。

作为AlphaGo的主要设计者之一，也是AlphaGo的“人肉手臂”，Deepmind资深研究员的黄士杰日前在台湾中研院举办的“2017年人工智慧年会”上谈到AlphaGo的几次比赛，谈到AlphaGo Zero时，他说：“什么是AlphaGo Zero？我们拿掉所有人类对围棋的知识，只喂AlphaGo Zero围棋规则，让它自己学习下棋。”

“AlphaGo的成功就是深度学习与强化学习的胜利，因为两者结合在一起，建构判断形式的价值网络(Value Network)，后来也成为AlphaGo Zero的主要理论。”黄世杰说，“AlphaGo Zero是从乱下开始，找出围棋的下法，它只用了三天，走过了人类研究围棋的千年历程。”

据悉，只经过了40天的训练，AlphaGo Zero就超越了Master。

在人类已经绝无可能赢下围棋AI的时候，柯洁在前一天输掉LG杯、输给同类后，他反而赢了围棋AI“符合预期”，并终结了后者的41连胜，非常戏剧性。

柯洁说：“这个昵称为‘符合预期’的AI尤其强，实力应该已经远超当时与李世石对弈的AlphaGo了吧？”

那这位“符合预期”是谁家的AI呢？你给我出来。

柯洁这次输给了人类，却赢了AI

推荐阅读更多精彩内容