今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。
强化学习迷宫的游戏,让机器自己学会找到黄色目标。
刚开始运行是这样的:
刚开始
经过一段时间的学习之后:
强化学习_迷宫
把observation_打印出来方便观察,
observation_
其中用到的Q-Learning算法:
Q-Learning
今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。
强化学习迷宫的游戏,让机器自己学会找到黄色目标。
刚开始运行是这样的:
经过一段时间的学习之后:
把observation_打印出来方便观察,
其中用到的Q-Learning算法: