机器学习12 提升树模型与梯度提升

这一篇继续boosting,介绍一下提升树算法, 提升树以决策树为基模型, 依然是加法模型,优化算法是前向分步算法。

针对分类问题, 决策树是二叉分类树, 回归问题则是二叉回归树。

第m步之后的模型, 是f_m(x) = f_{m-1}(x) +T(x;\Theta_m)

f_{m-1}(x)是m步学习之前的模型,通过极小化损失函数,得到第m棵决策树的参数\Theta_m

\hat \Theta_m = \mathop{argmin}_{\Theta_m}\sum_{i=1}^NL(y_i,f_{m-1}(x_i)+T(x_i;\Theta_m))

针对不同的问题,区别在于损失函数的不同, 回归问题采用的是平方误差, 分类问题是指数损失误差

当处理二分类问题的时候, 提升树模型,等价于基模型为二叉决策树的AdaBoost算法。因此这边不再做详细的介绍

因此这一篇我们主要介绍一下回归问题中的提升树

T(x;\Theta) = \sum_{j=1}^J c_j1(x\in R_j)

参数\Theta = \{(R_1,c_1), (R_2,c_2),(R_3,c_3),...,(R_j,c_j)\}表示树的区域划分和每个区域的输出值, J就是叶子结点的个数。

这个问题的前向分部算法可以表示为:

f_0(x) = 0

f_m(x) = f_{m-1}(x) + T(x;\Theta_m), m = 1,2,...,M

f_M(x) = \sum_{m=1}^MT(x;\Theta_m)

第m步时, 只需要求解

\hat \Theta_m = \mathop{argmin}_{\Theta_m}\sum_{i=1}^NL(y_i,f_{m-1}(x_i)+T(x_i;\Theta_m))

采用平方误差, L(y,f(x)) = (y - f(x))^2

L(y,f_{m-1}(x) +T(x;\Theta_m)) = [y - f_{m-1}(x) - T(x;\Theta_m)]^2 = [r - T(x;\Theta_m)]^2

r = y - f_{m-1}(x), 即第m-1次学习后模型的拟合残差。所以对于第m次学习, 只需要拟合当前模型的残差即可。

如果理解了前一篇, 这一篇的提升树理解起来应该比较容易。


但是提升树也有局限性,当损失函数是平方损失或是指数损失的时候,前向分步算法去优化每一步是比较简单的(上一篇与这一篇分别解决了其中一类)。但是对于一般的损失函数,可能不容易优化,这就有了梯度提升算法。每一次学习,都是在拟合损失函数的负梯度, 只要损失函数梯度存在,就可以优化了,因此更具有普适性。下一篇,我们将会仔细介绍梯度提升树算法GBDT,希望大家可以跟我一样,认识到模型是一步步演变进化的过程。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,383评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,522评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,852评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,621评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,741评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,929评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,076评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,803评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,265评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,582评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,716评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,395评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,039评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,027评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,488评论 2 361
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,612评论 2 350