240 发简信
IP属地:山西
  • 请问这篇文章的代码你复现了吗,我复现的时候好多问问题,当然主要是tensorflow版本问题,怎么都调不好

    QMDP-Net阅读记录

    记录一下自己所看的论文,后续会继续更新一些model-based的论文阅读记录,欢迎交流、讨论(emmmmm,我实在才疏学浅)。 论文:P Karkus,D Hsu,WS L...

  • 120
    QMDP-Net阅读记录

    记录一下自己所看的论文,后续会继续更新一些model-based的论文阅读记录,欢迎交流、讨论(emmmmm,我实在才疏学浅)。 论文:P Karkus,D Hsu,WS L...

  • 关于Policy Gradient的理解

    虽然前段时间稍微了解过Policy Gradient,但后来发现自己对其原理的理解还有诸多模糊之处,于是希望重新梳理一番。Policy Gradient的基础是强化学习理论,...