Adversarially Robust Generalization Requires More Data

Schmidt L, Santurkar S, Tsipras D, et al. Adversarially Robust Generalization Requires More Data[C]. neural information processing systems, 2018: 5014-5026.

@article{schmidt2018adversarially,
title={Adversarially Robust Generalization Requires More Data},
author={Schmidt, Ludwig and Santurkar, Shibani and Tsipras, Dimitris and Talwar, Kunal and Madry, Aleksander},
pages={5014--5026},
year={2018}}

本文在二分类高斯模型和伯努利模型上分析adversarial, 指出对抗稳定的模型需要更多的数据支撑.

主要内容

高斯模型定义:\theta^* \in \mathbb{R}^n为均值向量, \sigma >0, 则(\theta^*, \sigma)-高斯模型按照如下方式定义: 首先从等概率采样标签y \in \{\pm 1\}, 再从\mathcal{N}(y \cdot \theta^*, \sigma^2I)中采样x \in \mathbb{R}^d.

伯努利模型定义:\theta^* \in \{\pm1\}^d为均值向量, \tau >0, 则(\theta^*, \tau)-伯努利模型按照如下方式定义: 首先等概率采样标签y \in \{\pm 1\}, 在从如下分布中采样x \in \{\pm 1\}^d:
x_i = \left \{ \begin{array}{rl} y \cdot \theta_i^* & \mathrm{with} \: \mathrm{probability} \: 1/2+\tau \\ -y \cdot \theta_i^* & \mathrm{with} \: \mathrm{probability} \: 1/2-\tau \end{array} \right.

分类错误定义:\mathcal{P}: \mathbb{R}^d \times \{\pm 1\} \rightarrow \mathbb{R}为一分布, 则分类器f:\mathbb{R}^d \rightarrow \{\pm1\}的分类错误\beta定义为\beta=\mathbb{P}_{(x, y) \sim \mathcal{P}} [f(x) \not =y].

Robust分类错误定义:\mathcal{P}: \mathbb{R}^d \times \{\pm 1\} \rightarrow \mathbb{R}为一分布, \mathcal{B}: \mathbb{R}^d \rightarrow \mathscr{P}(\mathbb{R}^d)为一摄动集合. 则分类器f:\mathbb{R}^d \rightarrow \{\pm1\}\mathcal{B}-robust 分类错误率\beta定义为\beta=\mathbb{P}_{(x, y) \sim \mathcal{P}} [\exist x' \in \mathcal{B}(x): f(x') \not = y].

注: 以\mathcal{B}_p^{\epsilon}(x)表示\{x' \in \mathbb{R}^d|\|x'-x\|_p \le \epsilon\}.

高斯模型

upper bound

定理18:(x_1,y_1),\ldots, (x_n,y_n) \in \mathbb{R}^d \times \{\pm 1\} 独立采样于同分布(\theta^*, \sigma)-高斯模型, 且\|\theta^*\|_2=\sqrt{d}. 令\hat{w}:=\bar{z}/\|\bar{z}\| \in \mathbb{R}^d, 其中\bar{z}=\frac{1}{n} \sum_{i=1}^n y_ix_i. 则至少有1-2\exp(-\frac{d}{8(\sigma^2+1)})的概率, 线性分类器f_{\hat{w}}的分类错误率至多为:
\exp (-\frac{(2\sqrt{n}-1)^2d}{2(2\sqrt{n}+4\sigma)^2\sigma^2}).

定理21:(x_1,y_1),\ldots, (x_n,y_n) \in \mathbb{R}^d \times \{\pm 1\} 独立采样于同分布(\theta^*, \sigma)-高斯模型, 且\|\theta^*\|_2=\sqrt{d}. 令\hat{w}:=\bar{z}/\|\bar{z}\| \in \mathbb{R}^d, 其中\bar{z}=\frac{1}{n} \sum_{i=1}^n y_ix_i. 如果
\epsilon \le \frac{2\sqrt{n}-1}{2\sqrt{n}+4\sigma} - \frac{\sigma\sqrt{2\log 1/\beta}}{\sqrt{d}},

则至少有1-2\exp(-\frac{d}{8(\sigma^2+1)})的概率, 线性分类器f_{\hat{w}}\ell_{\infty}^{\epsilon}-robust 分类错误率至多\beta.

lower bound

定理11:g_n任意的学习算法, 并且, \sigma > 0, \epsilon \ge 0, 设\theta \in \mathbb{R}^d\mathcal{N}(0,I)中采样. 并从(\theta,\sigma)-高斯模型中采样n个样本, 由此可得到分类器f_n: \mathbb{R}^d \rightarrow \{\pm 1\}. 则分类器关于\theta, (y_1,\ldots, y_n), (x_1,\ldots, x_n)\ell_{\infty}^{\epsilon}-robust 分类错误率至少
\frac{1}{2} \mathbb{P}_{v\sim \mathcal{N}(0, I)} [\sqrt{\frac{n}{\sigma^2+n}} \|v\|_{\infty} \le \epsilon ].

伯努利模型

upper bound

(x, y) \in \mathbb{R}^d \times \{\pm1\}从一(\theta^*, \tau)-伯努利模型中采样得到. 令\hat{w}=z / \|z\|_2, 其中z=yx. 则至少有1- \exp (-\frac{\tau^2d}{2})的概率, 线性分类器f_{\hat{w}}的分类错误率至多\exp (-2\tau^4d).

lower bound

引理30:\theta^* \in \{\pm1\}^d 并且关于(\theta^*, \tau)-伯努利模型考虑线性分类器f_{\theta^*},
\ell_{\infty}^{\tau}-robustness: f_{\theta^*}\ell_{\infty}^{\tau}-robust分类误差率至多2\exp (-\tau^2d/2).
\ell_{\infty}^{3\tau}-nonrobustness: f_{\theta^*}\ell_{\infty}^{3\tau}-robust分类误差率至少1-2\exp (-\tau^2d/2).
Near-optimality of \theta^*: 对于任意线性分类器, \ell_{\infty}^{3\tau}-robust 分类误差率至少\frac{1}{6}.

定理31:g_n为任一线性分类器学习算法. 假设\theta^*均匀采样自\{\pm1\}^d, 并从(\theta^*, \tau)-伯努利分布(\tau \le 1/4)中采样n个样本, 并借由g_n得到线性分类器f_{w}.同时\epsilon < 3\tau0 < \gamma < 1/2, 则当
n \le \frac{\epsilon^2\gamma^2}{5000 \cdot \tau^4 \log (4d/\gamma)},
f_w关于\theta^*, (y_1,\ldots, y_n), (x_1,\ldots, x_n)的期望\ell_{\infty}^{\epsilon}-robust 分类误差至少\frac{1}{2}-\gamma.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,907评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,987评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,298评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,586评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,633评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,488评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,275评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,176评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,619评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,819评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,932评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,655评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,265评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,871评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,994评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,095评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,884评论 2 354