首页 > 其他 > 详细

强化学习建模之前必须思考的问题

时间:2021-05-18 16:03:29      阅读:14      评论:0      收藏:0      [点我收藏+]

强化学习是智能体与环境的交互,通过交互信息来感知环境,从而调整自己的行为,选择出最好的结果。
【相当于人做了多次的探索,把最后的劳动成果以状态值函数、动作状态对值函数等方式表达出来。对人学习过程的简单模拟】

需要思考的问题:
研究什么问题,与环境中的什么东西相关?
哪些行为可以影响到环境,是不是可选的动作?
与环境的交互是为了什么?要达成什么目标?对每个状态的奖励如何设置?

分别对应 环境状态、状态下对应的动作、动作与状态转移的关系、对目标的设定及衡量

在目前你考虑的问题中是否对一些情况作了理想化处理?如果不做理想化处理应该选择什么方式来解决这个问题?

【个人理解:强化学习很像自己指定规则来探索环境,根据规则尝试很多次,把最后收敛的结果输出来指导决策】

强化学习建模之前必须思考的问题

原文:https://www.cnblogs.com/yuyuanliu/p/14780189.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!