2019-03-08派森学习第110天

今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。

强化学习迷宫的游戏,让机器自己学会找到黄色目标。

刚开始运行是这样的:

刚开始

经过一段时间的学习之后:

强化学习_迷宫

把observation_打印出来方便观察,

observation_

其中用到的Q-Learning算法:

Q-Learning
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 转载自https://mp.weixin.qq.com/s/3NtfHjgfhxbf6sVKleoRpA 1. 模...
    _龙雀阅读 9,575评论 0 8
  • 2016年11月14晚22:45,因大家都在说今晚的月亮姑娘,特意跑到楼下去欣赏,所谓亮,大,圆。西安近日以来,见...
    不是小个子的小精灵阅读 1,504评论 0 0
  • 明天就是中国传统文化中的七夕节,此刻我也是夜来非属性爆发,突然就想着写点什么 遇见,是在无声岁月里的相逢。ta走过...
    风吹北大荒阅读 1,553评论 0 0
  • 短短2小时的师资班,让我对木马程序有了更加落地的认识。而给我最大启示的是,我们先要把自己的木马抓好清好处理好,再去...
    saiyonana阅读 2,563评论 0 0
  • 1.矩阵是二维数组。 数组分为5类 1.空数组 a=[]2.标量 a=[5]3.向量 行向量...
    convertible阅读 4,026评论 0 0

友情链接更多精彩内容