AdaBoost的基本步骤是调整每次分错样本的权值
训练过程中,如果某个样本点已经被准确地分类,那么在构造下一个训练集中,它的权值就被降低;相反,如果某个样本点没有被准确地分类,那么它的权值就得到提高。然后,权值更新过的样本集被用于训练下一个分类器,整个训练过程如此迭代地进行下去
一、算法步骤
1、初始化训练数据的权值分布
设训练数据集
c初始化权值分布:
2、使用具有权值分布的训练数据集进行学习,得到基分类器
, 例如得到如下基分类器:
3、计算在训练数据集上的分类误差率:
其中:
4、计算的系数:
5、更新训练数据集的权值分布
注:
分类器之所以会存在,大多数情况都小于0.5,即
,则
,如果分类错了,
,则
,则
,最终的结果是
,这样保证了分错的样本权重变大,分对的样本权重变小
其中:
他的目的是是使得,也使得
成为一个概率分布
6、利用更新权值后的训练样本训练新的基分类器,重复以上步骤
7、构建基本分类器线性组合:
8、