首页 > 其他 > 详细

LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS

时间:2018-03-12 16:10:32      阅读:299      评论:0      收藏:0      [点我收藏+]

任务是地图里面导航,让agent从起始点到达指定位置。

 

用了supervised learning + reinforcement learning + lstm

 

用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。

 

LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS

原文:https://www.cnblogs.com/huangshiyu13/p/8549262.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!