PyTorch实现mixup

mixup与提高weight decay结合使用，可能对结果更有效。
更多数量的样本进行mixup不会带来更多收益。同类样本的mixup不会带来收益。
作者的实验是在同一个minibatch中进行mixup，但是注意需要shuffle。
α∈[0.1, 0.4]会使得模型性能相比较ERM提升，而过大的α会导致欠拟合。由于mixup后样本数量会增加，难样本也变相增加，因此训练epoch要增大，才能使模型得到收敛，性能稳定提升。
mixup训练完成后，再使用原始trainset + 低lr训练几个epoch，可能会进一步提升效果。

参考

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Mixup:Beyond Empirical Risk Minimization
——数据增强方法 ——https://github.com/hongyi-zhang/mixup 动机：机器学习...
斯文攸归阅读 4,777评论 0赞 4
SpaCy v2.0 （二）浅译--训练分析模型
Training spaCy’s Statistical Models训练spaCy模型 This guide d...
Joe_Gao_89f1阅读 6,661评论 1赞 5
李理：Theano tutorial和卷积神经网络的Theano实现 Part1
本系列文章面向深度学习研发者，希望通过Image Caption Generation，一个有意思的具体任务，深入...
imGeek阅读 1,869评论 0赞 8
神经网络：改进神经网络的学习方法（下）
改进神经网络的学习方法（下）权重初始化创建了神经网络后，我们需要进行权重和偏差的初始化。到现在，我们一直是根据...
nightwish夜愿阅读 1,957评论 0赞 0
闻君有两意故来相决绝
缘分代表着一种冥冥，一种既成，一种偶然中的必然。人总是越老了越笃信超自然的东西，因为看到了太多，经历了太多的痛苦，...
林火爱地球阅读 315评论 0赞 1

赞1赞

手机看全文