首页 > 其他 > 详细

【转载】 强化学习(十一) Prioritized Replay DQN

时间:2019-04-10 10:01:34      阅读:141      评论:0      收藏:0      [点我收藏+]

原文地址:

https://www.cnblogs.com/pinard/p/9797695.html

 

 

 

----------------------------------------------------------------------------------------

 

 

        在强化学习(十)Double DQN (DDQN)中,我们讲到了DDQN使用两个Q网络,用当前Q网络计算最大Q值对应的动作,用目标Q网络计算这个最大动作对应的目标Q值,进而消除贪婪法带来的偏差。今天我们在DDQN的基础上,对经验回放部分的逻辑做优化。对应的算法是Prioritized Replay DQN。

 

【转载】 强化学习(十一) Prioritized Replay DQN

原文:https://www.cnblogs.com/devilmaycry812839668/p/10681479.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!