决策树、熵与最大熵

熵:表示数据的内部混乱程度。熵越大越混乱,反之。


决策树-熵

‘基尼’系数和熵变化差不多。

决策树

信息增益:
原来有一个熵值A,选择一个特征的信息熵B,两者相减
信息增益 G:
G = A - B
那个信息增益值最大,说明选取这个特征比较好。

ID3 :信息增益

例如:

天气预报

总的熵值

基于四个特征的划分

举例outlook

计算一个特征的信息熵

另一个特征的计算是一样的。
过程

缺点:
添加一列编号的特征值1、2、3、4、5、6.。。。。。。。
使用Id 编号为特征的值,发生信息增益很大

信息增益到此为止啦。
《机器学习实战》笔记之三——决策树ID3算法

C4.5 信息增益率

信息增益率 = 信息增益/特征自身的熵值

信息增益率

引入了一个评价函数:
H(t) 表示当前叶子结点的熵值或者Gini系数,
Nt 表示当前叶子结点有几个样本

对于连续值怎么分割

损失处理

为甚要得到一个最矮的决策树,决策树太高,意味着分支太多,会有过拟合的风险。
预剪枝:在决策树的过程中,提前停止。比如限制深度、当前叶子结点的样本数小于50个提前停止。
后剪枝:决策树构建好啦,然后才开始剪枝。


Tleaf表示叶子结点数

随机森林

对于分类来说:求众数也可以。
对于回归任务来说:构造了多棵决策树,首先一片决策树,使用这些决策树同时处理一个任务,然后结果统一处理得出来的。

随机森林;
随机啥意思,有双重随机性的
第一,选择60%样本数据(又放回的哈)。
第二,关于特征的,比如有8个特征,选择其中6个(这个没有放回的哈)。

关于参数

画图的库seaborn




2.best 拿所有的遍历找最好的,random 是随机选取几个特征。
3.候选特征比较多的时候,指定一个特征。
4.指定深度。
5.当前这个节点样本数比较小的时候,停止切分。
7.用的比较少,通常不用。
8.限制叶子结点数。
9.类别

最大熵

“最大熵”这个名词听起来很玄奥,但是它的原理很简单,我们每天都在用。说白啦,就是保留全部的不确定性,将风险降到最小。

最大熵原理指出,对于一个随机时间的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。

总结:
最大熵模型可以将各种信息整合到一个统一的模型中。它有很多良好的特性:从形式上看,它非常优美:从效果上看,它是唯一一种既能满足各个信息源的限制条件,又能保证平滑行的模型。由于最大熵模型具有这些良好的特性,因此应用范围十分广泛。但是,最大熵模型计算量巨大,在工程上实现方法的好坏决定了模型的实用与否。

一步一步理解最大熵模型
信息熵公式的由来

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,490评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,581评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,830评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,957评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,974评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,754评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,464评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,357评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,847评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,995评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,137评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,819评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,482评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,023评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,149评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,409评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,086评论 2 355

推荐阅读更多精彩内容