首页 > 其他 > 详细

吴恩达机器学习笔记18-多类别分类:一对多(Multiclass Classification_ One-vs-all)

时间:2019-02-18 13:43:16      阅读:372      评论:0      收藏:0      [点我收藏+]

  对于之前的一个,二元分类问题,我们的数据看起来可能是像这样:

技术分享图片

  对于一个多类分类问题,我们的数据集或许看起来像这样:

技术分享图片

  我用3 种不同的符号来代表3 个类别,问题就是给出3 个类型的数据集,我们如何得到
一个学习算法来进行分类呢?
我们现在已经知道如何进行二元分类,可以使用逻辑回归,对于直线或许你也知道,可
以将数据集一分为二为正类和负类。用一对多的分类思想,我们可以将其用在多类分类问题
上。
下面将介绍如何进行一对多的分类工作,有时这个方法也被称为"一对余"方法。

技术分享图片

  现在我们有一个训练集,好比上图表示的有3 个类别,我们用三角形表示 ?? = 1,方框
表示?? = 2,叉叉表示 ?? = 3。我们下面要做的就是使用一个训练集,将其分成3 个二元分
类问题。
  我们先从用三角形代表的类别1 开始,实际上我们可以创建一个,新的"伪"训练集,类
型2 和类型3 定为负类,类型1 设定为正类,我们创建一个新的训练集,如下图所示的那
样,我们要拟合出一个合适的分类器。

技术分享图片

  这里的三角形是正样本,而圆形代表负样本。可以这样想,设置三角形的值为1,圆形
的值为0,下面我们来训练一个标准的逻辑回归分类器,这样我们就得到一个正边界。
为了能实现这样的转变,我们将多个类中的一个类标记为正向类(?? = 1),然后将其
他所有类都标记为负向类,这个模型记作???
(1)(??)。接着,类似地第我们选择另一个类标记为
正向类(?? = 2),再将其它类都标记为负向类,将这个模型记作 ???
(2)(??),依此类推。
最后我们得到一系列的模型简记为:

技术分享图片

技术分享图片  

  最后,在我们需要做预测时,我们将所有的分类机都运行一遍,然后对每一个输入变量,都选择最高可能性的输出变量。

总之,我们已经把要做的做完了,现在要做的就是训练这个逻辑回归分类器:???
(??)(??),
其中 ?? 对应每一个可能的 ?? = ??,最后,为了做出预测,我们给出输入一个新的 ?? 值,用
这个做预测。我们要做的就是在我们三个分类器里面输入 ??,然后我们选择一个让 ???
(??)(??)
最大的??,即

技术分享图片

  你现在知道了基本的挑选分类器的方法,选择出哪一个分类器是可信度最高效果最好的,
那么就可认为得到一个正确的分类,无论??值是多少,我们都有最高的概率值,我们预测??就
是那个值。这就是多类别分类问题,以及一对多的方法,通过这个小方法,你现在也可以将
逻辑回归分类器用在多类分类的问题上。

吴恩达机器学习笔记18-多类别分类:一对多(Multiclass Classification_ One-vs-all)

原文:https://www.cnblogs.com/sl0309/p/10395010.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!