首页 > 其他 > 详细

深度学习课程笔记(十四)深度强化学习 --- Proximal Policy Optimization (PPO)

时间:2018-07-17 17:21:35      阅读:590      评论:0      收藏:0      [点我收藏+]

深度学习课程笔记(十四)深度强化学习 ---  Proximal Policy Optimization (PPO)

2018-07-17 16:54:51 

Referencehttps://blog.openai.com/openai-baselines-ppo/  

Codehttps://github.com/openai/baselines/tree/master/baselines/ppo2  

Paperhttps://arxiv.org/pdf/1707.06347.pdf  

Video Tutorialshttps://www.youtube.com/watch?v=OAKAZ hFmYoI&t=1s 

 

 

深度学习课程笔记(十四)深度强化学习 --- Proximal Policy Optimization (PPO)

原文:https://www.cnblogs.com/wangxiaocvpr/p/9324316.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!