240 发简信
IP属地:上海
  • 数据结构习题课

    1. 第三次作业(1080 - 后缀表达式) 1.1 题目描述 【题目链接】[https://acm.sjtu.edu.cn/OnlineJud...

  • 数据结构第一次作业-T1014+T1033

    1. 数列操作(T1014) 1.1 题目描述 【题目链接】[https://acm.sjtu.edu.cn/OnlineJudge/probl...

  • Resize,w 360,h 240
    强化学习整理-经典论文之Miscellaneous

    # Model-Free RL: Distributional RL 1. C51 (Categorical DQN) 2017: A Dist...

  • Resize,w 360,h 240
    强化学习整理-经典论文之Policy Gradients

    Model-Free RL: Policy Gradients 1. TRPO 2015: Trust Region Policy Optimi...

  • Resize,w 360,h 240
    强化学习整理-经典方法之Policy Gradient

    Policy Gradient Methods 1. Policy Gradient Theorem 2. REINFORCE 可以推导出Sto...

  • Resize,w 360,h 240
    强化学习整理-经典方法之TD Learning

    Temporal-Difference Learning 1. TD(0) TD error : 2. Sarsa 3. Q-learning...

  • Resize,w 360,h 240
    强化学习整理-经典论文之Deep Q-Learning系列

    Model-Free RL: Deep Q-Learning 1. DQN 2013: Playing Atari with Deep Rein...