240 发简信
IP属地:山东
  • 240
    策略梯度算法

    本文主要分为下面几个部分:1.策略梯度算法介绍2.方差过大及解决方法3.代码实现及解读 策略梯度算法介绍 策略梯度算法主要从智能体的策略出发进行优化,策略主要指的是在给定状态...

  • Python中的filter和map函数

    map函数与filter函数的第一个输入都是一个函数,第二个输入都是一个可迭代对象,不同的是map函数用于对可迭代对象中的每一个元素做函数运算,返回的值是函数运算后的结果;而...