xgboost slide(二)

这部分主要是介绍回归树和组合:

回归树(cart)
1、回归树(也可以叫做分类回归树),加入gbdt是回归树,但是根据最终的回归结果给一个阈值,也可以做分类。
(1)与决策树的决策规则是一样的。对于cart回归,主要是保证MSE最小来确定分裂点
(2)在每一个叶子节点都会有一个值,也就是回归结果。
如上面的图所示:输入年龄,性别等特征,来预测叶子节点的值。

组合回归树
如下面的图所示,这个组合由两个回归树构成。
预测的结果就是每棵树预测结果的和
注意:这两棵树是串行的。

组合树方法
1、非常广泛的用在梯度提升机,随机森林等场景。。。
多半的数据挖掘竞赛的获胜者都是采用组合方法的一些变换形式。
2、对于输入的缩放比例具有不变性,所以你不需要很仔细的去做特征归一化。
3、能够学习特征间更高阶的相互作用,树是有层级的,下一层是基于上一层的,他们之间是有制约关系的,多棵树,就会形成高阶影响关系。
4、很稳定,用于工业生产

放入上下文:模型和参数
1、假设我们有k棵树,然后将这k个树进行组合。回归树就是从属性到分数的映射。
2、参数:
(1)包含每棵树的结构以及叶子节点的分数
(2)之前我们是学习权重,现在我们需要学习树

在只有一个变量的情况下学习一棵树
1、我们怎么学习函数呢?
2、定义目标函数(loss和正则),并且对他们优化
举个例子
(1)假设输入为t(时间)上的回归树
(2)我想预测在特定的时间t,我是否喜欢流行音乐
从下面的图可以看出来,这有两个时间点,一个是2011.3.1,一个是2010.3.20,所以分为三个区间:
(1)2010.3.20之前:喜欢音乐的分数是0.2
(2)2010.3.20-2011.3.1:分数是1.2,原因是遇到女朋友,喜欢浪漫音乐
(3)2011.3.20之后:分数是1.0

学习一个阶跃函数
1、我们需要进行学习的部分
(1)分裂点
(2)每段的值
2、单变量回归树的损失函数
(1)训练loss:重点关注的是拟合这些点
(2)正则化:重点关注这个函数的复杂度,比如说分裂点的个数,每段值的L2范数等等。

学习阶跃函数
我们看着四幅图能看出什么呢?
(1)第一张图是我的训练数据,我就是要拟合它
(2)第二张图是分裂点很多,这样对训练集拟合的很好,但是呢,模型也太复杂了,在测试集上表现不一定好哦方差大
(3)第三张图发现分裂点找的有点偏了,导致拟合的不准,这样MSE就会变大的,偏差大
(4)在损失和复杂度上达到了平衡

回过头来:组合树的目标函数
1、模型:假设k棵树,用加法模型来表示
2、目标函数:包括两个部分,训练loss和树的复杂度
3、定义复杂度的可能形式:
(1)树的节点数目,树的深度
(2)叶子节点权重的L2范数
(3)后面会更加详细的介绍

目标函数以及启发性学习
1、当讨论决策树的时候,往往是启发式的:
(1)根据信息增益找分裂点
(2)剪枝
(3)最大树深度
(4)叶子值的平滑度
2、大部分启发式都会对目标函数进行良好的映射:
(1)信息增益--训练loss
(2)剪枝--节点的正则化
(3)最大深度--确定函数复杂空间
(4)叶子值得平滑度--叶子权重的L2正则化
补充:啥是启发式学习?
通俗的说:启发式算法是指在一个随机的群体寻优过程中,个体能够利用自身或者全局的经验来制定各自的搜索策略。


回归树不仅仅是为了回归
1、回归树组合定义了如何预测分数,它可以被用于分类、回归、排名等等
2、取决于你怎么去定义目标函数
(1)对于MSE ---GBDT --- 回归
(2)logloss ---logitboost----分类

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,076评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,658评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,732评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,493评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,591评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,598评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,601评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,348评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,797评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,114评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,278评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,953评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,585评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,202评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,180评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,139评论 2 352

推荐阅读更多精彩内容