首页 > 其他 > 详细

Deep RL Bootcamp Frontiers Lecture I: Recent Advances,

时间:2018-05-04 18:09:10      阅读:217      评论:0      收藏:0      [点我收藏+]

技术分享图片

 

技术分享图片

 

 

 

 

 

 

技术分享图片

high bias

if the robot has learnt something (no changes appear with iterations)

however, in the real world tasks, the task could change a little bit, then the robot will failed to generalize.

 

 

 

技术分享图片

 

 no matter how well we train the robot in situations, there‘s always something that happens and messes up the system.

 

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 技术分享图片

 

 

 技术分享图片

14 robot, sharing their own experience to each other

  技术分享图片

 

 

技术分享图片

 

 

 

 

 技术分享图片

here the goal is to grasp anything. no task here

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

技术分享图片

 

 

 

 

 技术分享图片技术分享图片技术分享图片

技术分享图片技术分享图片技术分享图片

 

 

a few clips of our best trained neural network, picking up four objects that are visually kind of similar. They are all blue and roughly the same size, roughly rectangular.

 

 

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 

技术分享图片技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

技术分享图片

 

 

 

 技术分享图片

 

 

 

 

 

  技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

技术分享图片

 

 

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

  

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 技术分享图片

 imitation learning

 

 

 

 

技术分享图片

 

 

 

 

 

 技术分享图片

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 技术分享图片

技术分享图片

 

 

 

技术分享图片

 

 

 

 

技术分享图片

技术分享图片push the green tedy bear to the red spot

 

 

 

 技术分享图片

 

 

 

 

 

 

 技术分享图片

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 

 

 

技术分享图片

 

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 



 技术分享图片

 

 

 

 

 

 

技术分享图片

技术分享图片

 

 

 

 

 技术分享图片

 

终于结束了,接下来需要

1,学习使用tensorflow和pytorch

2,对CNN、RNN、GAN动手实践,做项目

(大概需要20天)

3,学习基础的ML(大概需要4天)

4,学习raspberry pi和arduino(大概需要4天)

Deep RL Bootcamp Frontiers Lecture I: Recent Advances,

原文:https://www.cnblogs.com/ecoflex/p/8991605.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!