AlphaGo的应用推广价值

AlphaGo团队用深度学习和强化学习的结合来做两种任务的判别，即来判别现在所在的棋盘是好是坏，同时来预测未来。通过对大数据的分析，让我们对“现在状态”有了一个靠谱的理解。

AlphaGo自我博弈就是自己玩游戏，得到不断反馈，然后更新策略，经过无数次比赛，最后会得到一个好策略，最终输出是一个行为策略。在一个封闭场景中，可以用自我博弈的模拟方法得到更多的数据。

最后编辑于：2017.12.06 01:46:07

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

AlphaGo：人工智能的曙光？
本文系《文工团》约稿，禁止一切形式的未授权转载，谢谢合作。这篇是约稿的第二版，第一版可以点这里。围棋，是一项中国...
LostAbaddon阅读 2,833评论 7赞 10
【全球AI日报】第四范式首席科学家杨强教授：人工智能的下一个技术风口与商业风囗
作为华人界首个国际人工智能协会AAAI Fellow、至今为止唯一的AAAI 华人执委，以及IEEE Fellow...
Stan森阅读 342评论 0赞 0

说说AlphaGo zero的那些事
http://mp.weixin.qq.com/s/68GTn-BaiRPmzi9F-0sCyw 学号: 17...
枫页syl阅读 696评论 0赞 0
[密恐患者勿进哦]三分钟PS搞定人像文字云效果
这篇的效果有点酷，跟以往的所谓文字云不同，此效果的特点是“文字”成了人的“皮肤”，而非只是人的“框架轮廓”。感兴趣...
阿随向前冲阅读 5,556评论 29赞 96
别让不好意思阻碍你进步的步伐
我正在一点一点的努力改变自己！我以前总是不好意思说话，不喜欢在人多的地方待，到了大学以后各种社交，...
慧慧啊阅读 224评论 0赞 0

赞1赞

赞赏

手机看全文