- 感觉方法超级简单,可能就改了两三行就能中
ICML
,理论推导也很简单,核心思想就是对抗训练,加入的噪声能让正确答案的概率最低,首先这个方法简单就简单在直接在训练的时候往正确答案的那一列加上噪声,其他的不加,而且同样是加噪声虚拟对抗训练那一篇是也是为了最小化正确答案,然后是往训练的embedding
上加噪声,一通推导得到了关于梯度的加噪声方法,还是挺work
的,通过调ε
基本上可以暴打分类上面的SoTA
,这个也能调ε
,而且翻译上面的实验用的是t2tbleu
, 报的也是原始transformer
代码里面的bleu
,感觉这篇论文就翻译而言实验work
的可信度是比较低的。
Improving Neural Language Modeling via Adversarial Training
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- Procedural Noise Adversarial Examples for Black-Box Attac...
- 摘要:在深度学习之前已经有很多生成模型,但苦于生成模型难以描述难以建模,科研人员遇到了很多挑战,而深度学习的出现帮...
- 论文:Bag of Freebies for Training Object Detection Neural N...
- 改进神经网络的学习方法(上) 当一个高尔夫球员刚开始学习打高尔夫时,他们通常会在挥杆的练习上花费大多数时间。慢慢地...