决策树

树的组成

衡量标准——熵

熵:熵是表示随机变量不确定性的度量(解释:说明物体内部的混乱程度)
公式:H(X) = - ΣPi * logPi , i = 1,2……n
image.png


案例分析

image.png

image.png

image.png

剪枝处理——防止过拟合

  • 预剪枝:是指决策树生成过程中,对每个节点在划分前进行估计,若当前节点的划分不能带来决策树返话费能力的提升,则停止划分并将当前节点标记为叶结点————>缺点(有可能欠拟合)
  • 后剪枝:先从训练集生成一棵完整的决策树,然后自底而上地对非叶节点进行考察,若将该点对应的子树换为叶节点能带来决策树泛化能力的提升,则该子树替换为叶节点————>缺点(训练时间长)


    image.png

集成算法

image.png
Bagging模型

image.png

随机森林

Boost模型

Stacking模型
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 一. 决策树(decision tree):是一种基本的分类与回归方法,此处主要讨论分类的决策树。在分类问题中,表...
    YCzhao阅读 6,568评论 0 2
  • 决策树理论在决策树理论中,有这样一句话,“用较少的东西,照样可以做很好的事情。越是小的决策树,越优于大的决策树”。...
    制杖灶灶阅读 11,178评论 0 25
  • 1、模型原理 (一)原理 1、原理:引入信息熵(不确定程度)的概念,通过计算各属性下的信息增益程度(信息增益越大,...
    Python_Franklin阅读 14,268评论 0 17
  • 前言: 通过第前面的学习介绍了机器学习回归模型创建的流程,并且知道了机器学习要做的事情是找到目标函数,优化它,通过...
    飘涯阅读 11,551评论 4 83
  • 基本概念 决策树(decision tree)是一种常见的机器学习方法,它是基于树结构来进行决策的,这恰是人类在面...
    司马安安阅读 5,379评论 0 3

友情链接更多精彩内容