首页 > 其他 > 详细

机器学习十讲——第十讲

时间:2021-02-06 10:44:59      阅读:24      评论:0      收藏:0      [点我收藏+]

第十讲——强化学习

  首先介绍了机器学习的方法和强化学习的概念。技术分享图片

技术分享图片

 

  之后介绍了数学模型MDP:

技术分享图片

 

技术分享图片

 

 

 技术分享图片

 

 

 

 

 

   对强化学习进行分类:

技术分享图片

 

   介绍了最常用的方法Q-Learning和计算思路和公式:

技术分享图片

 

  DQN——Q-learning的一种方法,能处理状态多但是行动空间数值不高的行动决策。

  如果状态太多不能用表来表示,可以用函数表示。

技术分享图片

 

 技术分享图片

 

 技术分享图片

 

 (状态位参数θ,状态多的函数是复杂函数,最为拟合的就是深度学习的方法)

 

  实践证明DQN的表现很好:

技术分享图片

 

 技术分享图片

 

   还有一种算法:

技术分享图片

 

   随后列举了美团的“推荐系统”,系统会观察用户的行为,记录用户点击的店面下单的东西,然后分析数据,下次点开推送类似的东西;还介绍了出租车派单系统、智能交通等等。最后概括了一下机器学习的知识体系:

技术分享图片

 

 

  知识体系很庞大,眼花缭乱,老师给出了学习意见:

技术分享图片

 

 

  至此,机器学习十讲内容结束。

 

机器学习十讲——第十讲

原文:https://www.cnblogs.com/zhangxinyue/p/14380388.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!