【集成学习】boosting-bagging-random forest

集成学习中三个著名的算法boosting、bagging和random forest.

bagging算法使用了重采样的方法:即样本有放回的采样。

boosting:以AdaBoost为例。学习器的训练过程为串行。首先将初始训练集中的每一个样本(假设有m个)的权重设置为1/m。然后对每一个训练集进行T轮训练,在一轮训练中将错分的样本的权重提高。在一个训练集完成之后,新的训练集也有了相应的权重。

bagging:bagging是基学习器对每一个训练集进行训练,对分类问题采用学习器投票法,对回归问题采用学习器的简单平均法。

random forest:random forest是bagging算法的一个延展算法。基学习器采用决策树,在对每一个训练集训练时候采用随机的特征子集进行训练,分类和决策方法与bagging类似。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容