首页 > 其他 > 详细

CART决策树的学习历程

时间:2019-02-11 16:52:44      阅读:186      评论:0      收藏:0      [点我收藏+]

学习路线:
1.李航 统计学习方法 5.5CART算法 看不懂,尤其是剪枝那一段
2.Peter Harrington 机器学习实战 第9章树回归 看懂了,但不是想要的(后来发现这仅是回归树的生成和剪枝)

短期总结一下:
CART是决策树的一种(顾名思义,分类与回归树),是ID3和C4.5的升级版(个人认为),而且是二叉树!
但CART不是一个算法,它是2大类,即分类和回归,分别对应离散值和连续值
对于分类树,生成采用基尼指数(Gini Index)来评估数据的混乱程度,这里与ID3和C4.5采用的熵不同的是,基尼指数更加适合表征分类的混乱程度,并且计算收敛速度快(参考了不明来源)
对于回归树,生成采用方差和遍历法,分别遍历各个feat和指定feat上的各个value寻找方差最小的数据,使得分类更加的"纯"

CART的剪枝,机器学习实战采用了方差法类似的手段,并未采用类似于Breiman所述的α,C(t)算法
统计学习方法简单介绍了Breiman的CCP方法,即代价复杂度剪枝算法,但并未详细介绍C(t)和Cα(t)的算法,因此陷入泥坑!

大力推荐CCP的解释文章

至此所有概念开始稍微明朗开来

CART决策树的学习历程

原文:https://www.cnblogs.com/kokomal/p/10362147.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!