首页 / 算法 / GBDT算法梳理

GBDT算法梳理

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了GBDT算法梳理，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2427字，纯文字阅读大概需要4分钟。

内容图文

LeetCode题目记录

1.前向分步算法
2.GBDT算法
3.GBDT负梯度拟合
4.GBDT损失函数
5.GBDT回归算法
6.GBDT正则化
７.GBDT优缺点
８. sklearn 参数

1.前向分步算法

Boosting家族中另一个重要的算法梯度提升树(Gradient Boosting Decison Tree, 以下简称GBDT)做一个总结。GBDT有很多简称，有GBT（Gradient Boosting Tree）, GTB（Gradient Tree Boosting ）， GBRT（Gradient Boosting Regression Tree）, MART(Multiple Additive Regression Tree)，其实都是指的同一种算法，本文统一简称GBDT。
在求解加法模型时，公式如下第一个，在给定训练数据及损失函数L(y, f(x))的条件下，学习加法模型f(x)就成为经验风险极小化损失函数极小化问题，公式如下第二个：
GBDT算法梳理 - 文章图片
前向分步算法的思想为：学习的是加法模型，那如果能够从前向后，每一步只学习一个基函数及其系数，然后逐步逼近优化目标式（第二式），那么就可以简化优化的复杂度。即每一步优化函数变为：

具体如下：
输入数据：训练数据集T ={(x1,y1), (x2, y2), …, (xN, yN)}；损失函数L(y, f(x))；基函数集{b(x; r)}；
输出：加法模型f(x)

GBDT算法梳理 - 文章图片
因此，前向分布算法将同时求解从m=1到M的所有参数βm, rm的优化问题简化为逐次求解各个βm, rm的优化问题。

2.GBDT算法

GBDT也是集成学习Boosting家族的成员，但是却和传统的Adaboost有很大的不同。回顾下Adaboost，我们是利用前一轮迭代弱学习器的误差率来更新训练集的权重，这样一轮轮的迭代下去。GBDT也是迭代，使用了前向分布算法，但是弱学习器限定了只能使用CART回归树模型，同时迭代思路和Adaboost也有所不同。

在GBDT的迭代中，假设我们前一轮迭代得到的强学习器是ft?1(x), 损失函数是L(y,ft?1(x)), 我们本轮迭代的目标是找到一个CART回归树模型的弱学习器ht(x)，让本轮的损失函数L(y,ft(x)=L(y,ft?1(x)+ht(x))最小。也就是说，本轮迭代找到决策树，要让样本的损失尽量变得更小。

GBDT的思想可以用一个通俗的例子解释，假如有个人30岁，我们首先用20岁去拟合，发现损失有10岁，这时我们用6岁去拟合剩下的损失，发现差距还有4岁，第三轮我们用3岁拟合剩下的差距，差距就只有一岁了。如果我们的迭代轮数还没有完，可以继续迭代下面，每一轮迭代，拟合的岁数误差都会减小。

从上面的例子看这个思想还是蛮简单的，但是有个问题是这个损失的拟合不好度量，损失函数各种各样，怎么找到一种通用的拟合方法呢？

3.GBDT负梯度拟合

GBDT算法梳理 - 文章图片

4.GBDT损失函数

GBDT算法梳理 - 文章图片

5.GBDT回归算法

GBDT算法梳理 - 文章图片

6.GBDT正则化

GBDT算法梳理 - 文章图片

７.GBDT优缺点

GBDT算法梳理 - 文章图片

８. sklearn 参数

在scikit-learn中，GradientBoostingClassifier为GBDT的分类类，而GradientBoostingRegressor为GBDT的回归类。两者的参数类型完全相同，当然有些参数比如损失函数loss的可选择项并不相同。这些参数中，类似于Adaboost，我们把重要参数分为两类，第一类是Boosting框架的重要参数，第二类是弱学习器即CART回归树的重要参数。

下面我们就从这两个方面来介绍这些参数的使用。
GBDT算法梳理 - 文章图片

参考文献：
[1]:https://www.cnblogs.com/pinard/p/6143927.html

内容总结

以上是互联网集市为您收集整理的GBDT算法梳理全部内容，希望文章能够帮你解决GBDT算法梳理所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/833437.html

来源：【匿名】

【上一篇】处理器调度算法【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【GBDT算法梳理】教程文章相关的互联网学习教程文章

GBDT算法梳理

1.前向分布算法负梯度拟合损失函数回归二分类，多分类正则化优缺点sklearn参数应用场景原文：https://www.cnblogs.com/yankang/p/10459484.html

GBDT算法原理【图】

一、GBDT 在介绍AdaBoost的时候我们讲到了，AdaBoost算法是模型为加法模型，损失函数为指数函数（针对分类为题），学习算法为前向分步算法时的分类问题。而GBDT算法是模型为加法模型，学习算法为前向分步算法，基函数为CART树（树是回归树），损失函数为平方损失函数的回归问题，为指数函数的分类问题和为一般损失函数的一般决策问题。在针对基学习器的不足上，AdaBoost算法是通过提升错分数据点的权重来定位模型的不足，而梯...

【原创手写笔记】面试准备，关于Adaboost & GBDT算法你需要知道的那些【图】

导读上一份笔记在介绍决策树的过程中我们提到了“决策树是许多集成学习算法的基础算法”。那么，什么是集成学习算法、集成学习算法有哪几种、它们彼此之间有什么区别、集成学习算法合起来性能一定会超过基础学习器吗？在接下来的几份笔记中，我们将会针对几种集成学习算法针对高频问题做推导和解答。这份笔记将首先针对Adaboost和GBDT算法进行介绍，Adaboost和GBDT算法都属于集成学习中采用Boosting策略的算法，Boosting策略的本质...

GBDT算法原理【图】

1. Decision Tree：CART回归树??首先，GBDT使用的决策树是CART回归树，无论是处理回归问题还是二分类以及多分类，GBDT使用的决策树通通都是都是CART回归树。为什么不用CART分类树呢？因为GBDT每次迭代要拟合的是梯度值，是连续值所以要用回归树。??对于回归树算法来说最重要的是寻找最佳的划分点，那么回归树中的可划分点包含了所有特征的所有可取的值。在分类树中最佳划分点的判别标准是熵或者基尼系数，都是用纯度来衡量的，但是...

GBDT算法梳理【图】

LeetCode题目记录1.前向分步算法2.GBDT算法3.GBDT负梯度拟合4.GBDT损失函数5.GBDT回归算法6.GBDT正则化７.GBDT优缺点８. sklearn 参数 1.前向分步算法 Boosting家族中另一个重要的算法梯度提升树(Gradient Boosting Decison Tree, 以下简称GBDT)做一个总结。GBDT有很多简称，有GBT（Gradient Boosting Tree）, GTB（Gradient Tree Boosting ）， GBRT（Gradient Boosting Regression Tree）, MART(Multiple Additive Regression Tr...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / GBDT算法梳理

GBDT算法梳理

内容导读

内容图文

LeetCode题目记录

1.前向分步算法

2.GBDT算法

3.GBDT负梯度拟合

4.GBDT损失函数

5.GBDT回归算法

6.GBDT正则化

７.GBDT优缺点

８. sklearn 参数

内容总结

内容备注

内容手机端

【GBDT算法梳理】教程文章相关的互联网学习教程文章

GBDT算法梳理

GBDT算法原理【图】

【原创手写笔记】面试准备，关于Adaboost & GBDT算法你需要知道的那些【图】

GBDT算法原理【图】

GBDT算法梳理【图】

算法 - 相关标签

算法 - 最新教程

算法 - 最热教程