Excel-分类算法-决策树

1--理论

总结:“信息数据”越集中的地方熵值越小, “信息数据”越分散的地方熵值越大。

2--实操

1.1--信息熵的公式

1.2--计算出总的熵值

熵=-是的概率*LOG(是的概率,2)-否的概率*LOG(否的概率,2)

1.3--计算出天气维度的增益

PS:0不能参加log的计算

1.4--计算出每个维度的信息增益

1.5--排列每个信息维度

1.6--通过信息增益比例来算出每个维度的影响度

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容