20170904——丁酉年七月十四

之前一个月半月，学习基本处于停滞状态。现在心态也调整好了，事情也办完了。回过头来发现RL的很多理论方法，以前只是知道怎么写代码，但是并不清楚背后的原理。无论从数学、还是从自然规律，还是需要建立一个体系，所以打算重新精读这些文章。

精读论文：

1. J.Schulman 2015Trust Region Policy Optimization

2. D.Silver 2014 Deterministic Policy Gradient Algorithms

*3. S.Levine 2014 Learning Complex Neural Network Policies with Trajectory Optimization

完成任务：

1. 深入理解1、2两篇论文，并形成笔记；

2. 有时间的话选读论文 3

最后编辑于：2017.12.10 06:06:35

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Deep Reinforcement Learning Papers
Deep Reinforcement Learning Papers A list of recent paper...
西方失败9527阅读 4,569评论 0赞 1
长篇连载《剑饮天川》第三章姑苏寒
———“君到姑苏见，人家尽枕河” 莺啼柳，春光瘦，棹渐临岸雨渐收，寒山寺的钟声响起，渔人归家，浣女濯衣，宁...
踏歌涉川阅读 1,157评论 0赞 0

只有经历最痛苦的坚持,才配得上拥有最长久的幸福
记住一句话:越努力,越幸运.振振能让你倒下的是你绝望的内心你处理情绪的速度,就是你迈向成功的速度.一个人越懒,明天...
上官曙光阅读 4,260评论 0赞 0
成长记录
大家好，笑来老师好，我是Shirley云熙，简书、微博，微信公众号ID都是：Shirley云熙。在写这一篇成长记...
云熙聊亲密关系阅读 3,047评论 4赞 2

赞1赞

赞赏

手机看全文