样本不均衡问题

样本不均衡的解决办法

  1. 上采样:将小样本集复制多份,复制样本的时候可以加入轻微扰动
  2. 下采样:将大样本集剃除多份,为了避免信息损失,可以用Ensemble:
    2.1 easyEnsemble:有放回的采样,从而训练多个不同的分类器,通过组合得到最终的结果
    2.2 BalanceCascade:增量学习,还没看过
    2.3 利用KNN挑选大众样本:Learning from Imbalanced Data
  3. 随机采样:很简单,但是大样本集中的样本会重复多次,小样本集中可能出现数据缺失
  4. 利用SMOTE进行数据合成Borderline-SMOTE,ADASYN
  5. 加权:focal loss
  6. 一分类:如果样本极度不平衡可以把他当成一分类问题One-Class SVM
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容