假如一个数据集,正负样本比例为1:100训练的模型倾向于所有的例子判为负例因为要保证整体的损失最小解决办法:重采样: 对多的欠采样: 对少的重采样:数据有重复人工生成样本使用对样本数量干扰少的算法(DT)