决策树

Paste_Image.png

如果是连续值的时候,需要分离,如温度是否大于70

是否购买电脑的决策树模型

Paste_Image.png

信息熵

Paste_Image.png

计算信息熵

Paste_Image.png

变量的不确定性越大,熵越大


1.ID3

构造决策树节点问题,如何构造根节点
信息量获取: Gain(A) = Info(D) - Info_A(D)

Paste_Image.png

本身数据的信息熵


Paste_Image.png

按照年龄分后的信息熵

Paste_Image.png
Paste_Image.png
Paste_Image.png
Paste_Image.png

已age为根节点后,继续以上边的步骤构造决策树

Paste_Image.png
Paste_Image.png

算法不同选择属性的度量方法

Paste_Image.png

避免树太深

Paste_Image.png

优缺点

Paste_Image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容