首页 > 其他 > 详细

Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

时间:2018-05-01 13:04:33      阅读:311      评论:0      收藏:0      [点我收藏+]

 https://drive.google.com/file/d/0BxXI_RttTZAhTUpqUFdEZ3BXNFE/view

技术分享图片

 

 

技术分享图片

 

game of Pong is a MDP.

 

 

 

技术分享图片

技术分享图片

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

 

技术分享图片

 

 

 

 

 

技术分享图片

 

 

 

 

 

 技术分享图片

 

 

 

 

 

 技术分享图片

 

 

 

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

 

 技术分享图片

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 

 

终于一睹AK真容了,很有想法,很幽默

 http://karpathy.github.io/

 技术分享图片

 

Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

原文:https://www.cnblogs.com/ecoflex/p/8976042.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!