【论文笔记】MixMatch: A Holistic Approach to Semi-Supervised Learning

URL:
https://arxiv.org/abs/1905.02249v1

https://github.com/google-research/mixmatch

TL;DR

利用unlabeled的标签,半监督学习。


Dataset/Algorithm/Model/Experiment Detail

示意流程图

算法流程图

对于含标签数据 \mathcal{L_X} 及不含标签数据 \mathcal{X_U} ,通过mixmatch方法生成 \mathcal{X', U'}
其中mixmatch方法主要如下:

  • 首先对图片进行多次augment处理,通过模型预测求平均值作为“guessed label”
  • sharpen预测标签,拉开最大值和其他值的距离
  • 通过以下公式进行mixup操作


    mixup操作

接着分别用交叉熵和L2计算损失。 \mathcal{L_U} 用L2的原因是L2比交叉熵对不准确标签更不敏感。

优化损失

实验结果也涨点明显


实验结果
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容