【集成学习】boosting-bagging-random forest

集成学习中三个著名的算法boosting、bagging和random forest.

bagging算法使用了重采样的方法：即样本有放回的采样。

boosting：以AdaBoost为例。学习器的训练过程为串行。首先将初始训练集中的每一个样本（假设有m个）的权重设置为1/m。然后对每一个训练集进行T轮训练，在一轮训练中将错分的样本的权重提高。在一个训练集完成之后，新的训练集也有了相应的权重。

bagging:bagging是基学习器对每一个训练集进行训练，对分类问题采用学习器投票法，对回归问题采用学习器的简单平均法。

random forest:random forest是bagging算法的一个延展算法。基学习器采用决策树，在对每一个训练集训练时候采用随机的特征子集进行训练，分类和决策方法与bagging类似。

最后编辑于：2018.04.18 20:35:43

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文