首页 > 编程语言 > 详细

朴素贝叶斯算法

时间:2021-04-18 14:26:53      阅读:18      评论:0      收藏:0      [点我收藏+]

朴素贝叶斯(Nave Bayes)法是基于贝叶斯定理与特征条件独立假设的分类算法。

1.朴素贝叶斯模型

下面是分类模型样本:

技术分享图片

假设有m个样本,每个样本有n个特征,特征输出有K个类别,定义为

技术分享图片

从样本得到朴素贝叶斯的先验分布

技术分享图片

接着得到条件概率分布

技术分享图片

然后用贝叶斯公式得到Xy联合分布P(X, y)

技术分享图片

因为P(Y=Ck)比较容易通过最大似然法求出,得到P(Y=Ck)就是类别Ck 在训练集里面出现的频数。但是P(X1=x1, X2=x2, ... Xn=xn| Y=Ck)是个复杂的n个维度的条件分布,很难求出。朴素贝叶斯在这里做了一个大胆的假设,即Xn个维度之间相互独立,得出:

技术分享图片

从上式看出,很难的条件分布大大简化了。如果特征之间不独立怎么办?那就尽量不适用朴素贝叶斯模型。这就是贝叶斯模型的选择。

 

最后回到要解决的问题,我们的问题是给定测试集的一个新样本特征技术分享图片,我们如何判断它属于哪个类型?

既然是贝叶斯模型,当然是后验概率最大化来判断分类了。我们只要计算出所有的K个条件概率 技术分享图片,然后找出最大的条件概率对应的类别,就是朴素贝叶斯的预测。

 

 

2.朴素贝叶斯的推断过程

 

朴素贝叶斯算法

原文:https://www.cnblogs.com/keye/p/14673215.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!