xgboost论文中关于cost 函数的推导一直不太明白,终于通过youtube视频了解到了理解的方法,视频链接: https://www.youtube.com/watch?v=OtD8wVaFm6E
文中有如下公式,注意在考虑此处公式的时候,隐含了一个假设,即公式中的ft(x),是通过拟合loss针对上一步预测函数的梯度得到的。公式4中的ft(x)表示的是拟合梯度对应的树,w表示的是该树叶子节点的值,因此公式4可以统一通过归并写成只与w相关的式子。另外可以看到,当我们生成了一颗树后,可以计算其gi和hi值(gi就是对应的梯度:>,如果loss是mse,hi就是1),通过这两个值,我们可以求得每个叶子节点的最优值(此时loss最小),对应的最小的loss也可以通过公式6求得。换句话说,公式6可以成为衡量这棵树质量好坏的依据。通过线性搜索的方法,我们可以找出最优的那棵树,进而求出下一个梯度,继续拟合,直到loss满足条件为止
关于xgboost论文的理解
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...