首页 > 其他 > 详细

CART-GBRT-GBDT

时间:2015-07-15 01:07:24      阅读:745      评论:0      收藏:0      [点我收藏+]

CART:分类回归树

分类树和回归树的区别:分裂节点时使用的节点非纯度量(最小化准则、特征选择)不一样,修剪树的准则不一样

分类树:

  节点非纯度量:平方误差和

  区域估计值:均值(在给定的划分下,均值带来的平方误差和最小)

回归树:

  节点非纯度量:误分类误差、Gini指数、熵

      区域估计值:多数类

GBRT/GBDT:第m次训练使用的数据集为(xi,rmi),i=1...N,其中rmi表示前m-1棵树组成的模型fm-1在样本(xi,yi)上损失函数的负梯度(延f(x)方向)

问题:

GBRT中的损失函数跟节点非纯度量有关系吗?

GBRT中的区域估计值跟CART中的区域估计值有关系吗?

为什么不使用CART的区域估计值作为GBRT中的区域估计值?是因为损失函数的问题吗?

按维基百科的说法,γ实际是权重,bjm才是真正的区域估计,这又是怎么回事?维基

 

CART-GBRT-GBDT

原文:http://www.cnblogs.com/xiangzhi/p/4646978.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!