由于需要,在强化学习的学习过程中,本着搞透彻的基本观念,认真研读了Sutton的强化学习圣经 An Introduction。
以下是我在看完3~6章后个人的一些理解,也为了能够理清楚具体的原理,在这篇博客记下来相关内容。
附上链接:
第4章:动态规划
第5章:蒙特卡洛方法
第6章:TD方法:包括Sara和Q-learning算法
强化学习Sutton (Reinforcement Learning : An introduction )文章概括和总结
原文:https://www.cnblogs.com/xsy123/p/12711245.html