登录注册写文章

李宏毅deep reinforcement learning笔记

李宏毅deep reinforcement learning笔记

deep reinforcement learning intro

DL监督学习主要关注有明确答案的问题，RL主要关注与环境交互的问题，RL的主要场景：

image.png

RL的主要难点：

reward delay:
某些action不会立即带来reward
action affect the subsequent data it receives
agent需要exploration

outline：

image.png

最后编辑于：2020.08.07 16:31:39

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

1赞2赞

赞赏

手机看全文