李宏毅deep reinforcement learning笔记

deep reinforcement learning intro

DL监督学习主要关注有明确答案的问题,RL主要关注与环境交互的问题,RL的主要场景:

image.png

RL的主要难点:

  • reward delay:
    某些action不会立即带来reward
  • action affect the subsequent data it receives
    agent需要exploration

outline:

image.png

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。