《机器学习技法》---GBDT

coldyan 2021-08-20 原文

1 对决策树使用adaboost

对决策树使用adaboost时，有以下几个问题：

（1）adaboost每次更新的样本权重如何应用到决策树中？

　　由于我们不知道决策树的err目标是什么，因此通常的方法是根据权重对样本采样，然后给决策树训练，这样我们不需要修改决策树算法本身，样本的权重信息就传进去了。

（2）如果处理某个决策树的ε达到0的情况？

　　达到0时，相应的投票数变为无穷大，因此我们需要对树的强度做限制，使得ε不会为0。通常简单的做法是限制树的高度。

　　特别的，当树的高度被限制为1时，且不纯度定义为二分类错误时，decision Tree等效为decision stump:
　　

因此adaboost-Dtree就是：

Adaboost是一个特殊的gradient boosting，它有自己的损失函数叫做errADA：

它也是01err的一个上界。

把adaboost写成gradient boosting的形式：

gradient Boosting是Adaboost的延伸。

已知前t-1轮的子模型和投票，在第t轮，选取合适的η和h(x)使得加上该轮后的总模型的损失函数最小，这就是gradient boosting：

如果这里的err是平方误差，有如下推导：

对h的大小做限制，后续用η控制大小，这里限制的方法是加一个平方项作惩罚项：

可以看出，这里是最小化平方误差，也就是在残差（s-y）上做回归。这里我们用回归树来做。

得到了h之后，接下来是选择合适的η：

也就是相当于对于残差和gt转换过的特征做单变量线性回归。

因此，我们的GBDT算法流程如下：

随机推荐

Linux 系统是一个多用户多任务的分时操作系统，任何一个要使用系统资源的用户，都必须首先向系统管理员申请一个 […]...

北斗卫星同步时钟（NTP网络时钟服务器）成功投运世界级工程港珠澳大桥北斗卫星同步时钟（NTP网络时钟服务器） […]...

程序是先通过一个解析视频的网站，然后我们提取其接口，然后实现观看vip视频的目的所以说免费观看视频pytho […]...

url-pattern中的/和/*的区别

url-pattern配置为”/”和”/*”的区别最近在学习 […]...

收房细则

1 检查所有插座没有电笔的朋友可以拿个充电器和一个三相接头的排插。充电器可以检查两相插座，三相接头的排插可以 […]...

一起学习共同进步，加油！！！官网地址：http://app-framework-software.intel […]...

dockerfile的格式，dockerfile是一个纯文本文件，我们可以理解为构建镜像的源码；不同于其他编程 […]...

asp.net批量下载文件

asp.net批量下载文件需求：支持文件批量下载。现在有很多小图片需要批量下载。不在服务器打包下载。因为 […]...