首页 > 其他 > 详细

Andrew Ng机器学习课程17(2)

时间:2015-10-12 12:43:37      阅读:213      评论:0      收藏:0      [点我收藏+]

Andrew Ng机器学习课程17(2)


声明:引用请注明出处http://blog.csdn.net/lg1259156776/


说明:主要介绍了利用value iteration和policy iteration两种迭代算法求解MDP问题,还介绍了在实际应用中如何通过积累“经验”更新对转移概率和reward的估计的学习模型,并结合两种迭代算法进行求解的完整过程。


技术分享
技术分享
技术分享
技术分享


2015-10-11 艺少

版权声明:本文为博主原创文章,转载请注明出处http://blog.csdn.net/lg1259156776/。

Andrew Ng机器学习课程17(2)

原文:http://blog.csdn.net/lg1259156776/article/details/49053485

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!