Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples

Athalye A, Carlini N, Wagner D, et al. Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples[J]. arXiv: Learning, 2018.

@article{athalye2018obfuscated,
title={Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples},
author={Athalye, Anish and Carlini, Nicholas and Wagner, David},
journal={arXiv: Learning},
year={2018}}

由于有很多defense方法都是基于破坏梯度(不能有效计算梯度, 梯度爆炸, 消失), 但是作者提出一种算法能够攻破这一类方法, 并提议以后的defense方法不要以破坏梯度为前提.

主要内容

f(\cdot): 模型;
f(x)_i: 样本x为类别i的概率;
f^j(\cdot): 第j层;
f^{1..j}(\cdot): 第1j层;
c(x): \arg \max_i f(x)_i;
c^*(x): 真实标签.

Obfuscated Gradients

  • Shattered Gradients: 一些不可微的defense, 或者一些令导数不存在的defense造成;
  • Stochastic Gradients: 一些随机化的defense造成;
  • Exploding & Vanishing Gradients: 通常由一些包括多次评估的defense造成.

BPDA

特例

有很多方法, 会构建一个不可微(或者其导数"不好用")的函数g, 然后用模型f(g(x))替代f(x), 从而防御一些基于梯度的攻击方法, 而且这类方法往往要求g(x) \approx x.

这类防御方法, 可以很简单地用
\nabla_x f(g(x))|_{x=\hat{x}} \leftarrow \nabla_x f(x)|_{x=g(\hat{x})},
替代, 从而被攻破(如果我们把g(x)视为模型的第1层, 那我们实际上就是攻击第二层).

一般情形

假设f^i(x)(即第i层)是不可微, 或者导数“不好用", 则我们首先构造一个可微函数g(x), 使得g(x) \approx f^i(x), 在反向传递导数的时候(注意只在反向用到g), 用\nabla_x g替代\nabla f^i(x).

注: 作者说在前向也用g(x)是低效的.

EOT

这类方法使用于攻破那些随机化的defense的, 这类方法往往会从一个变换集合T中采样t, 并建立模型f(t(x)), 如果单纯用\nabla f(t(x)) 来攻击效果不好, 可以转而用\nabla \mathbb{E}_{t \sim T} f(t(x)) = \mathbb{E}_{t \sim T} \nabla f(t(x))替代.

Reparameterization

重参用于针对梯度爆炸或者消失的情况, 因为这种情况往往出现于f(g(x)), 而g(x)是对x的一个多次评估(所以f(g(x))可以理解为一个很深的网络).

策略是利用构建x=h(z), 并且满足g(h(z))=h(z) (咋看起来很奇怪, 看了下面的DefenseGAN就明白了).

利用f(h(z)), 我们找到对应的对抗样本h(z_{adv}).

具体的案例

Thermometer encoding

这里的\tau是针对样本每一个元素x_{i,j,c}的, \tau:x_{i,j,c} \rightarrow \mathbb{R}^l:
\tau(x_{i, j, c})_k= \left \{ \begin{array}{ll} 1 & x_{i,j,c}>k/l \\ 0 & else. \end{array} \right.

只需令
g(x_{i,j,c})_k= \min (\max (x_{i, j, c} - k/l, 0),1).

Input transformations

包括:
image cropping, rescaling, bit-depth reduction, JPEG compression, image quilting

既包括随机化又包括了不可微, 所以既要用EPDA, 也要用EOT.

LID

LID能够防御
\min \quad \| x-x'\|_2^2 + \alpha(\ell(x')+\mathrm{LID_{loss}} (x')),
的攻击的主要原因是由于该函数陷入了局部最优. 因为LID高的样本不都是对抗样本, 也有很多普通样本.
忽视LID, 用原始的L2attack就能够有效攻破LID.

Stochastic Activation Pruning

SAP实际上是dropout的一个变种, SAP会随机将某层的f^i的某些元素突变为0(其概率正比于元素的绝对值大小).

这个方法可以用EOT攻破, 即用\sum_{i=1}^k \nabla_xf(x)来代替\nabla_x f(x).

Mitigating through randomization

这个方法的输入是229\times 229的图片, 他会被随机变换到r\times r大小, r\in[229, 331), 并随机补零使得其大小为331\times 331.

同样, 用EOT可以攻破.

PixelDefend

pass

DenfenseGAN

对于每一个样本, 首先初始化R个随机种子z_0^{(1)}, \ldots, z_0^{(R)}, 对每一个种子, 利用梯度下降(L步)以求最小化
\tag{DGAN} \min \quad \|G(z)-x\|_2^2,
其中G(z)为利用训练样本训练的生成器.

得到R个点z_*^{(1)},\ldots, z_*^{(R)}, 设使得(DGAN)最小的为z^*, 以及\hat{x} = G(z^*), 则\hat{x}就是我们要的, 样本x在普通样本数据中的投影. 将\hat{x}喂入网络, 判断其类别.

在这里插入图片描述

这个方法, 利用梯度方法更新的难处在于, x \rightarrow \hat{x}这一过程, 包含了L步的内循环, 如果直接反向传梯度会造成梯度爆炸或者消失.

所以攻击的策略是:

\min \quad \|G(z)-x\|_2^2 + c \cdot \ell (G(z))
找到z_{adv}, 于是x_{adv}=G(z_{adv}).

注意, 通过这个式子能找到对抗样本说明, 由训练样本训练生成器, 生成器的分布p_G, 实际上并不能能够撇去对抗样本.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355