deep reinforcement learning intro
DL监督学习主要关注有明确答案的问题,RL主要关注与环境交互的问题,RL的主要场景:
image.png
RL的主要难点:
- reward delay:
某些action不会立即带来reward - action affect the subsequent data it receives
agent需要exploration
outline:
image.png
DL监督学习主要关注有明确答案的问题,RL主要关注与环境交互的问题,RL的主要场景:
RL的主要难点:
outline: