首页 > 其他 > 详细

关于偏差-方差的分析

时间:2019-06-05 00:33:50      阅读:143      评论:0      收藏:0      [点我收藏+]

这里的内容参考了:

  1. 邱锡鹏老师的《神经网络与深度学习》
  2. 吴恩达老师的《深度学习》课程

由于所有的样本数据都被用来训练模型,验证模型时,也只是将模型的训练结果与正确结果作对比来观察正确率。这样的训练方法是否正确?正确率能否作为评价模型的标准?该如何正确评价一个模型?以及采取何种改进策略?


当模型表现不佳时?通常出现两种问题,一种是高偏差问题,另一种是高方差问题。

偏差: 是指一个模型的在不同训练集上的平均性能和最优模型的差异,可以用来衡量一个模型的拟合能力。

方差: 是指一个模型在不同训练集上的差异,可以用来衡量一个模型是否容易过拟合。

以下图中给出了机器学习算法的偏差和方差的四种不同组合情况。每个图的中心点为最优模型f?(x),蓝点为不同训练集D上得到的模型 fD(x) 。

技术分享图片

上图所示为偏差和方差的四种组合:

(a)低方差-低偏差:理想情况;

(b)低方差-高偏差:模型泛化能力很好,但拟合能力不足;

(c)高方差-低偏差:模型拟合能力很好,但泛化能力较差;

(d)高方差-高偏差:最差情况。

就像打靶一样,偏差描述了射击总体是否偏离目标,而方差描述射击准不准。


方差一般会随着训练样本的增加而减少。当样本足够多时,方差比较少,可以选择能力强的模型来减少偏差。然而在很多机器学习任务上,训练集往往比较有限,最优的偏差和最优的方差就无法兼顾。

随着模型复杂度的增加,模型的拟合能力增强,偏差减小而方差增大,从而导致过拟合。以结构错误最小化为例,可以通过调整正则化系数r来控制模型的复杂度。当r增大时,模型复杂度降低,方差减小而偏差上升,从而避免过拟合。但当r过大时,总的期望错误反而会上升。因此,一个好的正则化系数需要在偏差和方差之间取得较好的平衡。如下图所示,最优模型并不一定是偏差曲线和方差曲线的交点。

技术分享图片


关于偏差-方差的分析

原文:https://www.cnblogs.com/xxxxxxxxx/p/10975281.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!