XGBoost算法

吴恩达的机器学习视频已经不能满足我了,断断续续又学了一些其他常见的机器学习算法,这里整理出来

决策树

决策树(Decision Tree)是在已知各种情况发生概率的上,通过构成决策树来求取净现值的)值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。

XGboost算法

XGboost(eXtreme Gradient Boosting)算法是一种树的模型,常用于回归和分类。是一种梯度提升机器算法的扩展。原理是把大量的准确率较低的CART树通过组合形成一个准确率较高的模型。该模型每次训练迭代中都会生成新的树来减少误差。XGboost算法在每次迭代生成的树都会用梯度下降的方法,以上一个树为基础,向着最小化的目标来生成新的树。在一次一次迭代中生成大量的树来达到预期的期望。XGboost算法具有高准确,不容易过拟合等特点,在同类算法中脱颖而出。

CART树

CART树也叫回归树(regression tree)。CART树会把输入的属性分配到各个叶子节点,而且每个叶子节点上面会对应一个实数分数。从简单的类标到分数之后,我们可以做很多事情,如概率预测,排序。

Tree Ensemble

往往一个CART树太过于简单了,不能进行太复杂的情况,更不能有效的预测。因此我们需要把更多的CART树组合起来。我们可以通过把每一个CART树预测的结果分数,加在一起得到一个最终的分数,来当做预测的分数。这样可以减少误差,同时也能进行更加复杂情况下的预测。

训练XGboost

1.3.1目标函数

Obj(θ) = L(θ) + Ω(θ)

上面是Xgboost的目标函数,是由误差函数和正则化项组成。常见的误差函数由平方误差,logistics误差函数等。正则化项是为了惩罚复杂模型,使模型不产生过拟合的现象。Xgboost的目标是使目标函数最小化。

1.3.2数学模型

XGBoost算法的核心就是每次生成一棵树都会更接近预期,这样一棵一棵树的生成来让整个模型的预测精度提高。我们可以用

,来表示模型的初始阶段,没有任何树。然后在

生成第一颗树

,我们用

代表新的树的函数。就这样一棵一棵树的加入模型当中。所以最终生成第t棵树时的模型表达式为:

最后我们要给函数加上惩罚项,来防止模型过拟合。这里在XGboost模型的惩罚项是:

其中T是叶子的个数,ƴ是惩罚力度,是由我们定的,也就是叶子个数越多我们的惩罚力度也就越大。W代表的是每个叶子上面的分数,λ也是我们定的惩罚力度。

这样我们的模型最终的表达式为:

image.png

其中constant是前t-1棵树的复杂度。我们再加上损失函数,表达式将会变成:

我们再将非平方误差的表达式进行泰勒二阶展开:

其中gi和hi是

的一阶导数和二阶导数。具体表达式为:

然后把表达式中的常数项去掉,表达式就变成了:

就是最终的目标函数。这就是第t棵树的优化目标。我们在每次生成新的树都运用这个优化目标,使整个模型精确度更高。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • 一、XgBoost算法简介 在数据建模中,经常采用Boosting方法通过将成百上千个分类准确率较低的树模型...
    owolf阅读 2,626评论 0 2
  • #狄奥尼索斯#酒神狄奥尼索斯赋予了人类欢乐与慈爱,为人类的艺术(音乐与绘画)源源不断地提供着灵感与智慧。因此,在剧...
    维纳斯的密涅瓦阅读 190评论 0 0
  • 50句惊艳世人的电影台词:请原谅我戳痛了你所有记忆 有人说:青春是一部电影,每个人都演绎着自己的角色与人生,或激昂...
    简糯阅读 2,279评论 2 18
  • 今天的中午,妈妈回来了,她像往常一样做好了饭烧好了菜,我们俩一起吃好了饭。妈妈洗好了碗就去上班了。我一个人在家...
    鲍志宏阅读 297评论 0 0