Java(但不限于)技术栈源码讲解。深入技术底层原理,透彻理解源码作者思想
IP属地:台湾
前言: *该文章需要一定的深度学习基础和游戏基础(因为是随手写的可能有比较多的BUG,注释也没写多少,请见谅) 首先我想说,两个东西都是开源的,bug多也是很正常,其次这两个...
这两天看了一下李宏毅老师的强化学习课程的前两讲,主要介绍了Policy Gradient算法和Proximal Policy Optimization算法,在此整理总结一下。...