C5.0算法

C5.0算法是在C4.5算法的基础上提出的

C5.0和C4.5算法的对比:

1.都是通过计算信息增益率来划分结点,两者的共同

2.C5.0算法通过构造多个C4.5算法,是一种boosting算法。准确率更高

3.C5.0算法运行速度快,可以出来例如,C4.5需要9个小时找到森林的规则集,但C5.0在73秒完成了任务。

4.C5.0运行内存小。C4.5需要超过3 GB.(工作不会对早些时候完成32位系统),但C5.0需要少于200 mb。

5.C5.0算法,可以人为的加入客观规则

6.C5.0可以处理较大的数据集,特征可以是:数字,时间,日期,名义字段

7.C5.0可以加入惩罚项,(也就是第2条中boosting过程) 

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 决策树理论在决策树理论中,有这样一句话,“用较少的东西,照样可以做很好的事情。越是小的决策树,越优于大的决策树”。...
    制杖灶灶阅读 11,191评论 0 25
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,731评论 4 65
  • 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...
    我偏笑_NSNirvana阅读 40,405评论 12 145
  • 目录 正则化算法(Regularization Algorithms) 集成算法(Ensemble Algorit...
    rol_ling阅读 3,736评论 0 0
  • AsyncTask Handler ANR、FC 避免 自定义控件 Adapter 图片缓存 常见设计模式 Pop...
    738bc070cd74阅读 2,490评论 0 2

友情链接更多精彩内容