姓名:李国霏 学号:17021210903 专业:信号与信息处理
转载自:https://www.ithome.com/html/next/335058.htm,有删节
【嵌牛导读】柯洁输了,柯洁又赢了。
【嵌牛鼻子】柯洁、围棋、AI
【嵌牛提问】发生了什么?
【嵌牛正文】排名第一的柯洁九段大意失荆州,在11月16日的第22届LG杯世界棋王赛半决赛上,意外输给日本七冠王井山裕太九段,再度无缘LG杯决赛。
不知道是不是受到了今年5月份在乌镇输给AlphaGo的影响,今年以来,柯洁已经无缘春兰杯、三星杯、LG杯三大赛冠军,只剩下12月中下旬的新奥杯可以满足一下他对冠军的争夺。
但这似乎并没有影响到柯洁的心情。
11月18日凌晨零点刚过,柯洁发了一条微博,称他昨天终结了一个昵称叫“符合预期”的围棋AI的41连胜,“一度觉得没法继续了的棋,很艰苦赢了下来。”
柯洁认为“符合预期”的实力在去年战胜李世乭的AlphaGo之上,他还发出了一个世纪之问:“若是当初第一个与AlphaGo对弈的人是我?结果到底会是如何?今夜未成眠……”
显然,在柯洁眼里,战胜围棋AI“符合预期”是要比赢得LG杯冠军更值得庆祝的事情,毕竟自从AlphaGo去年3月份赢了李世乭后,人类就没有在这项古老的技艺上挽尊过。
2017年1月初,披着Master马甲的AlphaGo一路过五关斩六将,干掉朴廷桓、元晟溱、柯洁、聂卫平等一众世界顶尖围棋高手,豪取59连胜后,在电脑上幽幽地飘出一句话:“我是AlphaGo的黄博士。”随后又毫无悬念地赢了古力,以60胜0败收场。
3月19日,在第十届UEC杯世界围棋AI大赛上,中国AI绝艺在决赛中逆袭,一举击败了夺冠呼声最高的日本AI DeepZenGo,获得冠军。
然后就是今年5月23日在乌镇举行的世纪之战,世界排名第一的柯洁对战AlphaGo,第一盘在耗时4小时25分后,柯洁以四分之一子败给了AlphaGo,聂卫平表示这还是“AlphaGo一再退让的结果”,柯洁说:“我很早就知道自己要输1/4子,AlphaGo每步棋都是匀速,在最后单官阶段也是如此,所以我就有时间点目,看清自己输1/4子,所以只好苦笑。感觉AlphaGo和去年判若两人,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝。”
5月25日,第二盘,柯洁执白再次输给了AlphaGo,盘面上大龙横死,只是这次输得快多了。
5月27日,柯洁在第三盘还是输了,他哭了,在认输之后,他起身走到宣传板后没有摄像机镜头的区域独自流泪,哭得像个孩子。
后来,AlphaGo获得了九段称号,但随后从世界排名中停留了一段时间被消失了。
就在我们都以为AlphaGo就此收手时,在10月19日又投下一个炸弹。DeepMind团队在 Nature 上发表了题为 Mastering the game of Go without human knowledge 的重磅论文,称新一代的AlphaGo Zero,完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(Reinforcement learning)和参悟,以100:0的成绩战胜了AlphaGo。
作为AlphaGo的主要设计者之一,也是AlphaGo的“人肉手臂”,Deepmind资深研究员的黄士杰日前在台湾中研院举办的“2017年人工智慧年会”上谈到AlphaGo的几次比赛,谈到AlphaGo Zero时,他说:“什么是AlphaGo Zero?我们拿掉所有人类对围棋的知识,只喂AlphaGo Zero围棋规则,让它自己学习下棋。”
“AlphaGo的成功就是深度学习与强化学习的胜利,因为两者结合在一起,建构判断形式的价值网络(Value Network),后来也成为AlphaGo Zero的主要理论。”黄世杰说,“AlphaGo Zero是从乱下开始,找出围棋的下法,它只用了三天,走过了人类研究围棋的千年历程。”
据悉,只经过了40天的训练,AlphaGo Zero就超越了Master。
在人类已经绝无可能赢下围棋AI的时候,柯洁在前一天输掉LG杯、输给同类后,他反而赢了围棋AI“符合预期”,并终结了后者的41连胜,非常戏剧性。
柯洁说:“这个昵称为‘符合预期’的AI尤其强,实力应该已经远超当时与李世石对弈的AlphaGo了吧?”
那这位“符合预期”是谁家的AI呢?你给我出来。