姓名:谢雨杉 学号:22011210940 通信工程学院
对抗样本的概念
对抗样本是指在数据集中通过故意添加细微的干扰所形成的输入样本,导致模型以高置信度给出一个错误的输出。即只需要在一张图片上做微小的扰动,分类器以很高的置信度将图片错误分类,甚至被分类成一个指定的标签(不是图片所属的正确标签)。
具体来说,有一个深度学习系统M及干净的输入样本(没有添加噪声的样本)C,我们假设样本C被深度学习系统M正确地分类,即,建立一个几乎与样本C相同但是却被错误分类的样本D﹐使,这样的样本D我们称之为对抗样本。