1
0
写了 9144 字,被 8 人关注,获得了 22 个喜欢
一、 获取并处理环境图像 本文所刨析的代码是“pytorch官网的DQN示例”(页面),用卷积层配合强化训练去学习小车立杆,所使用的环境是“小车立杆环境”(CartPole)...