首页 > 其他 > 详细

XGboost介绍

时间:2019-04-02 19:55:52      阅读:157      评论:0      收藏:0      [点我收藏+]

XGBoost是端到端的迭代决策树算法框架,被广泛用于各类机器学习应用中,具有很好的可扩展性

每棵树都是回归树(CART树)

Xgboost相比传统GBDT,做了如下优化:

1. 损失函数增加了正则项,正则项里包含了树的叶子节点个数、每个叶子节点上输出的score的L2模的平方和, 提高了树的泛化能力

2. 对于大数据,提供了块缓存结构

3. 对代价函数进行了二阶泰勒展开,使用二阶导优化目标损失函数

4. 对于稀疏或者缺失特征数据, 有默认分支,这样避免计算分割点

 

为了防止过拟合,采用两种方法:

1. 加入Shrinkage思想,相当于给每棵树加入权重

2. 列采样,即特征采样,类似于随机森林

 

 

 

源码: https://github.com/dmlc/xgboost

 

 

参考文献:

XGBoost: A Scalable Tree Boosting System

XGboost介绍

原文:https://www.cnblogs.com/energy1010/p/10633318.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!