2018-07-04 Deep Mind 新文 人类水平的多人游戏

使用的游戏是《雷神之锤III竞技场》,CTF(Capture The Flag)的游戏规则很简单,但是过程很复杂。游戏双方分成蓝红两队在指定地图中对抗。对抗的目的是保持我方旗帜位于己方基地内,将敌方旗帜从其基地中带到我方基地内,与我方旗帜接触即得一分,在五分钟里得分最多队伍获胜。双方通过射击消灭对方,碰触己方旗帜可以使其回到己方基地。

Deep Mind 训练的AI名为“为了胜利”(For the Win,FTW),在运行了45万场游戏后,FTW理解了如何有效地与人/其他的机器合作与竞争。

研究人员对AI的唯一限定是,在5分钟时间里尽可能取得多的旗帜。对战的游戏地图是随机生成的,每场都会变,室内与室外的地形也不相同。在训练过程中,AI发展出了自己的奖励机制,学会了基地防守、尾随队友,或者守在敌人营地外偷袭等策略。

在验证AI效果时,组队的时候,AI可能与人组队,也可能与其他AI组队。

DeepMind在他们今天发表的博客文章中写道,从多智能体的角度说,玩《雷神之锤III》这种多人视频游戏,需要与队友合作,与敌方竞争,还要对遭遇到的任何对战风格/策略保持鲁棒性。

分析发现,游戏中,AI在“tagging”(碰触对方,将其送回地图上的初始地点)上比人类更加高效,80%的情况下能够成功(人类为48%)。

而且有趣的是,对参与对战的人类玩家进行调查后发现,大家普遍认为AI是更好的team player,更善于合作。

AI的表现与人类对比
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容