240 发简信
IP属地:四川
  • 120
    TRPO算法解析

    这俗话说的好呀,这饭要一口一口吃,酒要一口一口喝,路要一步一步走,步子迈大了,喀,容易扯到蛋。这训练模型呢,也是这个理,欲速则不达,收敛慢并不可怕,可怕的是不收敛,今天要介绍...