ML-Leaks论文笔记

这篇论文更全面地研究了Membership Inference Attack在各种scenario下的表现,提出了三种情形下的adversary,通过实验论证membership得以attack的本质原因在于模型的overfitting,并据此提出了dropout和model stacking两种defense methods,在一定程度上减少了模型的overfitting,抵御了attack,下面分别介绍三种adversary的scenario和具体的攻击算法。

Adversary 1

第一种情形假设adversary具有和target model训练集同分布的D_{shadow},这也就是membership attack刚被提出时的重要假设。Adversary首先利用D_{shadow}训练得到shadow model模仿target model的行为,再利用shadow model的输出posterior probability来训练一个二分类器,也就是attack model。注意到target model对于训练集中的数据会由较高的置信度,于是我们只需取posterior中最高的三位作为feature即可实现准确度相当高的attack。另外,实验证明,这里的shadow model的模型结构可以不与target model相同,例如同为CNN网络,shadow model可以具有不同的卷积核大小,但如果两者不属于同一类型的模型,性能则会有显著的下降(例如target model为random forests,shadow model为neural network)。作者提出了一种解决方法,即训练多个不同类型的shadow model,训练attack model时同时对多个模型的输出训练,可以有效提升性能。

Adversary 2

第二种情形假设Adversary并不拥有D_{shadow},而且也不知道target model的模型细节,但攻击算法仍和第一种相同,实验证明,这仍能取得不错的效果,原因主要在于即便对于不同的模型,不同的数据集,membership的性质仍然成立,也就是对于训练集中的数据,模型会给出较高的置信度,攻击算法只取模型输出中最大的三位作为feature,使得攻击有较好的泛化性,实现了data transferring attack。

Adversary 3

第三种情形并不训练shadow model,直接根据模型输出的最大值进行分类,只要大于某一个阈值,则认为是在训练集中。阈值的选取比较tricky,首先随机生成若干样本,将target mode输出的最大值进行排序,取前t%(实验证明t为10)的值作为阈值。我们可以假定训练集数据以一定概率分布在整个样本空间中,进行随机采样后大约有t%的样本属于训练集,实验证明对于部分数据集,例如CIFAR100,攻击算法有不错的性能保证。

Defense Methods

Defense Methods主要从减小模型的overfitting出发,作者利用dropout(一种经典的正则化方式)和model stacking(经典的模型集成算法)进行实验,取得了一定的防御效果,这也进一步论证了membership inference attack和模型的overfitting密切相关。

总结

通过研究不同情形下的membership inference attack,我们可以发现通过置信度的高低即可作出非常准确的判断,但仍然留下了一些问题,首先被攻击的模型大多为浅层神经网络,它们在训练集和测试集上的表现差异非常明显,test accuracy远远低于training accuracy,作者并没有在例如VGG16,ResNet等深度神经网络上进行攻击。另外模型的过拟合与攻击性能的关系并没有得到数学上的证明,我认为相关的实验缺乏对不同模型表现的对比,所提出的defense methods也并不完全适用于深度神经网络。
论文地址:https://arxiv.org/abs/1806.01246

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容