首页 > 其他 > 详细

机器学习之正则化

时间:2017-08-26 21:07:27      阅读:259      评论:0      收藏:0      [点我收藏+]

前言

           以下内容是个人学习之后的感悟,如果有错误之处,还请多多包涵~

 

 

正则化

一、过拟合

         过拟合是一种现象。当我们提高在训练数据上的表现时,在测试数据上反而下降,这就被称为过拟合,或过配。过拟合发生

的本质原因,是由于监督学习问题的不适定:在高中数学我们知道,从n个(线性无关)方程可以解n个变量,解n+1个变量就会解

不出。在监督学习中,当样本数远远少于特征数时,会发生过拟合现象。

         为了更直观地了解过拟合,请观察下面的图片。可以看到,左边是欠拟合,中间是正好拟合,右边是过拟合。经过对比,可以

看出过拟合能够符合所有的训练样本,但是结构弯弯曲曲,无法准确地测试数据。

                  技术分享

            针对过拟合现象一般有两个处理方法:

           1、尽量减少特征量,将一些冗余的、信息量少的特征量舍弃。

           2、使用正则化

 

二、正则化原理

       使用正则化,其实只需要在代价函数后面加一个惩罚项即可。

       Why? 为什么加一个惩罚项就可以了?

        是的,看下面的例子。我们可以看到,二次多项式已经可以实现正确的拟合,采用四次多项式,就会产生过拟合。此时,我们

在代价函数的后面加上1000*(θ32,θ42)项,当代价函数最小化的时候,θ3≈0,θ4≈0,即假设函数变换到了二次多项式,避免了

过拟合。

                       技术分享

          如果我们像惩罚 θ3 和 θ这样惩罚其它参数,那么我们往往可以得到一个相对较为简单的假设函数。实际上,这些参数的值

越小,通常对应于越光滑的函数,也就是更加简单的函数。因此 就不易发生过拟合的问题。按照惯例,我们没有去惩罚 θ0,因此

θ0 的值是大的。

 

三、线性回归正则化

  •  梯度下降法:

                                   技术分享

  •   正规方程法:

                               技术分享

 

四、逻辑回归正则化

                              技术分享

 

 

注1:λ的选取起到很关键的作用,之后会讲到相关的算法来实现自动取值λ。

注2:正则化不仅能够解决过拟现象,还能解决正规方程中奇异矩阵的问题。

 

 

 

以上是全部内容,如果有什么地方不对,请在下面留言,谢谢~

机器学习之正则化

原文:http://www.cnblogs.com/steed/p/7436336.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!