240 发简信
IP属地:山东
  • 120
    数学基础1

    数学基础部分包括:泰勒展开、雅克比矩阵、海森矩阵、链式法则、方向导数、仿射集、凸集、锥和凸锥以及超平面、半平面和凸函数的概念。 1.泰勒展开 泰勒公式在本质上是用函数的多项式...

  • 120
    策略梯度算法

    本文主要分为下面几个部分:1.策略梯度算法介绍2.方差过大及解决方法3.代码实现及解读 策略梯度算法介绍 策略梯度算法主要从智能体的策略出发进行优化,策略主要指的是在给定状态...

  • Python中的filter和map函数

    map函数与filter函数的第一个输入都是一个函数,第二个输入都是一个可迭代对象,不同的是map函数用于对可迭代对象中的每一个元素做函数运算,返回的值是函数运算后的结果;而...