[TOC]

GBDT

原理

例子

  1. 训练一个提升树模型来预测年龄:
  2. 训练集是4个人,A,B,C,D年龄分别是14,16,24,26。样本中有购物金额、上网时长、经常到百度知道提问等特征。提升树的过程如下:

问题

  1. 为何GBDT的决策树都是CART回归树?
    1. 因为GBDT每次迭代的要拟合的都是梯度值,属于连续值,因此用CART回归树.
    2. 分类树最好的方法是gini系数和熵,来判别最佳划分点.
    3. 回归树是采用平方误差来判断拟合程度.

实例

  1. 一组数据,特征为年龄、体重,身高为标签值。共有5条数据,前四条为训练样本,最后一条为要预测的样本。 1.

     ![L2fgvViFEabA1jG](<https://i.loli.net/2021/08/13/L2fgvViFEabA1jG.png>)