首页 > 编程语言 > 详细

python机器学习-chapter2_4

时间:2020-02-03 19:29:07      阅读:59      评论:0      收藏:0      [点我收藏+]

•R2是一个回归模型的评价标准,也叫作决定系数,位于0~1之间,越接近1表示预测效果越好

训练集和数据集的分数非常接近,说明可能存在欠拟合

训练集的分数很好但测试集的分数不好,说明存在过拟合

 

•线性回归(普通最小二乘法 OLS):

寻找w和b,使得训练集的预测值与真实的回归目标值之间的均方误差最小。(均方误差:预测值与真实值之差的平方和除样本数)

 

•岭回归(ridge regression):

①对系数w的选择:

♠在训练集上有好的预测效果

♠拟合附加约束

♠w尽量小(所有的w都尽量接近零,每个特征对输出的影响尽可能小)

这种约束即为正则化,正则化可以避免回归模型过拟合。

②岭回归中的alpha

在岭回归中存在一个系数alpha(alpha默认设置为1),alpha影响了简单性和训练集性能二者对于模型的重要程度,

减小alpha即增大训练集精度,降低泛化性能,在模型复杂度关系图中向右移动,

alpha即为约束性,alpha越大,对w的约束性越大,即越靠近0。

技术分享图片

 

python机器学习-chapter2_4

原文:https://www.cnblogs.com/bozi/p/12256727.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!