通俗易懂--SVM算法讲解(算法+案例)

时间：2018-12-23 21:47:51 阅读：145 评论：0 收藏：0 [点我收藏+]

1.SVM讲解

新闻分类案例

SVM是一个很复杂的算法，不是一篇博文就能够讲完的，所以此篇的定位是初学者能够接受的程度，并且讲的都是SVM的一种思想，通过此篇能够使读着会使用SVM就行，具体SVM的推导过程有一篇博文是讲得非常细的，具体链接我放到最后面，供大家参考。

1.1支持向量机(SVM)的由来

首先我们先来看一个3维的平面方程：Ax+By+Cz+D=0
这就是我们中学所学的，从这个方程我们可以推导出二维空间的一条直线：Ax+By+D=0

那么，依次类推，更高维的空间叫做一个超平面：

技术分享图片

x代表的是一个向量，接下来我们看下二维空间的几何表示：

技术分享图片

SVM的目标是找到一个超平面，这个超平面能够很好的解决二分类问题，所以先找到各个分类的样本点离这个超平面最近的点，使得这个点到超平面的距离最大化，最近的点就是虚线所画的。由以上超平面公式计算得出大于1的就属于打叉分类，如果小于0的属于圆圈分类。

这些点能够很好地确定一个超平面，而且在几何空间中表示的也是一个向量，那么就把这些能够用来确定超平面的向量称为支持向量（直接支持超平面的生成），于是该算法就叫做支持向量机(SVM)了。

1.2如何找到超平面

函数间隔

在超平面wx+b=0确定的情况下，|wx+b|能够表示点x到距离超平面的远近，而通过观察wx+b的符号与类标记y的符号是否一致可判断分类是否正确，所以，可以用(y(w*x+b))的正负性来判定或表示分类的正确性。于此，我们便引出了函数间隔（functional margin）的概念。定义函数间隔（用技术分享图片表示)为：