首页 > 其他 > 详细

temporal credit assignment in reinforcement learning 【强化学习 经典论文】

时间:2019-04-14 15:02:19      阅读:140      评论:0      收藏:0      [点我收藏+]

Sutton 出版论文的主页:

http://incompleteideas.net/publications.html

 

技术分享图片

 

 最近在做强化学习方面的课题, 发现在强化学习方面被称作强化学习之父的  Sutton  确实很厉害, TD算法和策略梯度策略算法都是他所提出的, 虽然Reinforcement learning 的现在框架是从 Q-learning 开始确定的,但是强化学习做的最早的人之一,对强化学习中经典思想的贡献最多的人估计就是Sutton了,Sutton本硕都是在MIT读的心理学,博士阶段才读的计算机,看来确实是很强的。作为强化学习最经典的论文,也是Sutton的博士毕业论文,很是值得读一读的,寻找该篇论文许久,发现可能是由于该篇论文发表的时间过久,所以所有的数据库都没有收录,唯一收入的应该是Sutton的博士授予的大学 Massachusetts 马萨诸塞州大学,但是由于该文章只向本校学生开发,所以找了几天都没有找到,今天灵机一动,为什么不到作者的个人主页上找一找呢,这一弄还果然发现了它的存在,特此mark一下。

 

 

 

 

----------------------------------------------------------------------------------------------------------------

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

----------------------------------------------------------------------------------------------------------------

 

 

附:(Sutton主页  Publication部分内容)

 

Rich Sutton‘s Publications

First, a quick guide to the highlights, roughly in order of the work‘s popularity or potential current interest:

Also, some RL pubs that aren‘t mine, available for researchers:


For any broken links, please send email to rich@richsutton.com.

temporal credit assignment in reinforcement learning 【强化学习 经典论文】

原文:https://www.cnblogs.com/devilmaycry812839668/p/10705075.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!