1
0
写了 185361 字,被 9 人关注,获得了 95 个喜欢
之前写的一篇关于强化学习的日志,很粗糙。简单的说了一下,动态规划,蒙特卡罗,时序差分。 也写了一些其他的内容。 用这篇文章来从头到尾总结一下。 什么是强化学习?强化学习是机器...