【转载】强化学习（二）马尔科夫决策过程(MDP)

时间：2019-04-05 13:13:12 阅读：158 评论：0 收藏：0 [点我收藏+]

原文地址：

---------------------------------------------------------------------------------------

在强化学习（一）模型基础中，我们讲到了强化学习模型的8个基本要素。但是仅凭这些要素还是无法使用强化学习来帮助我们解决问题的, 在讲到模型训练前，模型的简化也很重要，这一篇主要就是讲如何利用马尔科夫决策过程(Markov Decision Process，以下简称MDP)来简化强化学习的建模。

　　　　MDP这一篇对应Sutton书的第三章和UCL强化学习课程的第二讲。

1. 强化学习引入MDP的原因

技术分享图片

技术分享图片

技术分享图片

原文：https://www.cnblogs.com/devilmaycry812839668/p/10658453.html

踩

(0)

评论一句话评论（0）