RL L1

3 Ways of Learning

Markov Decision Process

On Rewards

Two way is Infinite

Discount Factor

Polices

Finding Polices

Findn Polices Quiz

Finding Polices Again

V Function & Q Function

C Function

Ralation of Bellman Equations( Q Func is Cool!)

What've Learned

最后编辑于：2017.12.05 05:53:10

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

怎么看待孤独
第四季中欲望都市里的凯莉，与男朋友分手后，好像并不会很孤独，起码她还有好姐妹，她说生活在纽约这个城市中，可以做得事...
unmi阅读 3,114评论 1赞 2
安全感
何为安全感？有很多心理学家都会说从一个人的言谈举止中可以看出一个人是否有安全感，甚至一举手一投足就可以反映一个人...
LittlePiggie阅读 1,571评论 0赞 0

两天九小时结束了
错得在理阅读 1,580评论 0赞 0
iOS端微信支付成功失败无法收到不执行回调微信回调函数的原因
- (BOOL)application:(UIApplication *)app openURL:(NSURL *...
AlanAnie阅读 6,798评论 2赞 0
也许孤单也是美
自从去年11月份回家之后，就习惯了有人陪伴的日子，吃饭有人陪，逛街有人陪，看电视有人陪，渐渐的忘记了那个自己一个人...
胖嘟嘟199200阅读 1,063评论 0赞 0

赞1赞

赞赏

手机看全文