机器学习——随机森林

时间：2018-03-13 23:18:11 阅读：315 评论：0 收藏：0 [点我收藏+]

随机森林是用随机的方式建立一个森林，森林里面有很多的决策树，并且每一棵决策树之间没有关联。也可说随机森林是决策树的组合模型，其中决策树的组合形式采用的是bagging的方式。

Bagging方法：

Boosting方法：

没有先验知识的情况下,初始的分布应为等概分布,也就是训练集如果有 n个样本,每个样本的分布概率为1/ n。
每次循环后提高错误样本的分布概率,分错的样本在训练集中所占权重增大,使得下一次循环的基分类器能够集中力量对这些错误样本进行判断。
最后的强分类器是通过多个基分类器联合得到的,因此在最后联合时各个基分类器所起的作用对联合结果有很大的影响,因为不同基分类器的识别率不同,他的作用就应该不同,这里通过权值体现他的作用,因此识别率越高的基分类器权重越高,识别率越低的基分类器权重越低。

未完待续......

原文：https://www.cnblogs.com/wkslearner/p/8563576.html

踩

(0)

评论一句话评论（0）

分享档案

更多>