一、RL基础概念介绍

1.基本概念

  • Agent:智能体
  • System Environment:系统环境/实验的操控者
  • Observation/State:观察值(Agent眼中环境的状态)
  • Action:行动/Agent的反映
  • Reward:回报/反馈

在经典强化学习中,智能体要和环境完成一系列交互
(1)在每一个时刻,系统都将处于一种状态
(2)智能体将设法得到环境当前状态的观察值
(3)智能体根据观察值,结合自己历史的行为准则(策略,Policy)做出行动。
(4)这个行动会影响环境的状态,是环境发生一定的改变。Agent将从改变后的环境中得到两部分信息:新的环境观测值和行为给出的回报。Agent可以根据新的观测值做出新的行动。

2.强化学习两个特点

(1)不断试错
(2)看重长期回报

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Agents设计 本文翻译自https://github.com/Unity-Technologies/ml-ag...
    浪尖儿阅读 6,341评论 0 6
  • 失败固然痛苦,但重蹈失败更悲哀。不同于其它为了衬托设计师惊人天赋,所有展示作品都是技惊四座惊艳全场效果的影视作品,...
    十言九不语阅读 481评论 0 0
  • 这个眉目含情的女人深情的回望着她的房子,这个她已经居住了30多年的房子,有些不舍也有些无可奈何,她到了必须离开的时...
    孔瑞杰阅读 213评论 0 0
  • 20年前,我还清楚的记得你还牵着我的手走过田野小道,10年前,我每次放学回家都会跑到你住的地方找你说话,5年前,我...
    江小小先生阅读 241评论 0 1
  • 这篇文章想说说目前我在开发项目时,对于项目架构体系的总结。 架构体系图 流程 项目分为客户端和服务端。客户端于服务...
    红烧排骨饭阅读 677评论 0 1