论文阅读:Graph Convolutional Reinforcement Learning

这篇论文主要介绍了DGN的算法,在DQN的基础上加了图网络,用于状态的融合。在多智能体环境下运用。relation kernel用的是self-attention。


论文算法框架

这篇论文提到的几个点:

  1. 因为智能体之间的关系变化太快了,所以图动态变化太快,不利于收敛,所以在连续2个时间点保持图暂时不变。


  2. unlike other methods with parameter-sharing, e.g., DQN, that sample experiences from individual agents, DGN samples experiences based on the graph of agents, not individual agents, and thus takes into con- sideration the interactions between agents.(这个没太看懂,怎么根据图来sample呢?)

  3. Temporal Relation Regularization.



这篇论文和论文:Deep Reinforcement Learning with Relational Inductive Biases. 都用到了图网络和强化学习的结合,都提到了relational reinforcement learning 这个概念。有机会可以了解一下。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容