首页 > 其他 > 详细

核函数基础二 核方法、核技巧和核函数

时间:2020-05-31 15:24:06      阅读:55      评论:0      收藏:0      [点我收藏+]

核方法 

核方法 是一类把低维空间的非线性可分问题,转化为高维空间的线性可分问题的方法。核方法不仅仅用于SVM,还可以用于其他数据为非线性可分的算法。核方法的理论基础是Cover‘s theorem,指的是对于非线性可分的训练集,可以大概率通过将其非线性映射到一个高维空间来转化成线性可分的训练集。

SVM中,令 技术分享图片 表示将 技术分享图片 映射后的线性向量,那么对偶问题是:

技术分享图片

最终分类模型是:

技术分享图片

跟上一篇的SVM相比,除了 技术分享图片 变成了 技术分享图片 ,其他式子没有任何变化。

到这里核方法已经初步结束了,如果知道 技术分享图片 的具体形式就可以直接拿来用了。不过再深入一步,可以用核技巧加速核方法的计算。观察 技术分享图片 ,我们只需要计算 技术分享图片 ,并不需要单独计算,这便引入了核函数的概念。

核函数 

定义 核函数[2] 设 技术分享图片 是输入空间(即 技术分享图片 , 技术分享图片 是 技术分享图片 的子集或离散集合 ),又设 技术分享图片 为特征空间(? 技术分享图片 是希尔伯特空间[3]),如果存在一个从 技术分享图片 到 技术分享图片 的映射

技术分享图片

使得对所有 技术分享图片 ,函数 技术分享图片 满足条件

技术分享图片

则称 技术分享图片 为核函数。其中 技术分享图片 为映射函数, 技术分享图片 为内积。

即核函数输入两个向量,它返回的值跟两个向量分别作 技术分享图片 映射然后点积的结果相同。

核技巧

核技巧是一种利用核函数直接计算 技术分享图片 ,以避开分别计算 技术分享图片 和 技术分享图片 ,从而加速核方法计算的技巧。

得益于SVM对偶问题的表现形式,核技巧可以应用于SVM。 技术分享图片 可改写为:

技术分享图片

技术分享图片 可改写为:

技术分享图片

核函数的选择是SVM的最大变数,如果核函数选择不适,那么 技术分享图片 将不能将输入空间映射到线性可分的特征空间。下表为常用核函数[4]:

技术分享图片

不知道 技术分享图片 的情况下,如何判断某个 技术分享图片 是不是核函数?答案是 技术分享图片 是核函数当且仅当对任意数据 技术分享图片 ,核矩阵(kernal matrix,gram matrix)总是半正定的[5]:

技术分享图片

总结:核方法是一类把低维空间的非线性可分问题,转化为高维空间的线性可分问题的方法。核函数输入两个向量,它返回的值跟两个向量分别作 技术分享图片 映射然后点积的结果相同。核技巧是一种利用核函数直接计算 技术分享图片 ,以避开分别计算 技术分享图片 和 技术分享图片 ,从而加速核方法计算的技巧。核方法不仅仅适用于SVM,还适用于其他数据为非线性可分的问题和算法。SVM的表现形式包含了映射的点积,所以可以用核技巧加速核方法的计算。

 

[1] 本文主干内容来自机器学习-白板推导系列-核方法 。强烈推荐大神的机器学习系列视频 Machine-Learning-Session 

[2] 《统计学习方法》定义7.6

[3] 希尔伯特空间是完备的(对极限封闭)、被赋予内积的(对称性、正定性、线性)线性空间。

[4] 《机器学习》表6.1

[5] 证明见《统计机器学习》定理7.5

核函数基础二 核方法、核技巧和核函数

原文:https://www.cnblogs.com/qiu-hua/p/12997357.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!