文献资料
- 周志华教授的书 Ensemble Method: Foundations and Algorithms
- 对bias-variance介绍的文章Understanding the Bias-Variance Tradeoff
- JMLR 2014年对不同分类器的比较Do we Need Hundreds of Classifiers to Solve Real World Classification Problems?
-
sklearn机器学习算法图
帖子&博客
- 机器学习算法比较
-
为什么在实际的 kaggle 比赛中 gbdt 和 random forest 效果非常好?
马超的回答:模型理论:模型可控性好;数据角度:抗噪声能力强;系统灵活易用
eyounx的回答:自适应非线性,随着决策树的生长,能够产生高度非线性的模型;多分类器的组合,能够起到正则化的作用 - 学习 ensemble learning 要如何开始呢?
- 使用sklearn进行集成学习