240 发简信
IP属地:北京
  • Resize,w 360,h 240
    强化学习 优势函数(Advantage Function)

    什么是优势函数 优势函数表达在状态s下,某动作a相对于平均而言的优势。从数量关系来看,就是随机变量相对均值的偏差。使用优势函数是深度强化学习极其...

个人介绍
专注机器学习,探索人工智能。