决策树

简介

决策树是一种基本的分类与回归方法,本文主要讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的集合。在学习时,利用训练数据,根据损失函数最小化的原则建立决策树;预测时,对新的数据,利用训练好的决策树模型进行分类。决策树学习通常包括三个步骤,特征选择,决策树生成,决策树修剪。

决策树模型

分类决策树模型是一种描述对实例进行分类的树形结构,树的结点有两种,内部结点代表一个特征和属性,叶节点代表一个类。
决策树模型示意图

在新的数据进行测试时,从根结点开始,对实例的某一特征进行测试,根据测试结构,将实例分配到其子结点,如此递归进行下去,直到到达叶结点。叶节点代表的类也就是实例的类。

熵和信息增益

决策树学习的算法通常时一个递归地选择最优特征,并根据该特征对训练数据集进行分割,使得对各个子数据集有一个最好的分类的过程。最优特征的选择是该算法的重点,特征选择在于选取对训练数据具有分类能力的特征。
熵是表示随机变量不确定性的度量,[图片上传失败...(image-7777cb-1561688746764)]=\frac{P(x)}{Q(x)})

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 决策树 决策树模型与学习 特征选择 决策树的生成 决策树的剪枝 CART 算法 决策树模型实现 决策树模型呈树形结...
    千与千与阅读 721评论 1 1
  • 运行平台:Windows Python版本:Python3.x IDE:pycharm 一、决策树 决策树是什么?...
    ghostdogss阅读 2,065评论 0 1
  • 决策树理论在决策树理论中,有这样一句话,“用较少的东西,照样可以做很好的事情。越是小的决策树,越优于大的决策树”。...
    制杖灶灶阅读 5,996评论 0 25
  • 我们首先看一看决策树长什么样子? 如果你学习过“数据结构”,那你就会知道,计算机中的“树”是倒着放的,树根在上面,...
    李威威阅读 1,994评论 0 0
  • 2018年1月4日 我在一片草地上醒来,青草软绵绵的触感让我一下子想到了飘飞的蒲公英,还有湿润的风,风?我加...
    一朵小允初阅读 148评论 0 0