比赛规则介绍

赛题背景

近年来,人工智能技术在视觉识别领域有飞速的发展,但与此同时,人工智能模型的安全问题却不容乐观。
通过引入对抗样本,攻击者很容易就可以通过肉眼几乎观察不到的微小扰动,使模型分类失误。
本次比赛希望可以让参赛选手了解和探索Cifar10上的对抗攻击场景,通过组合对抗攻击方案,实地体验不同对抗攻击算法特点。

数据说明及描述

  • 比赛采用 Cifar-10 数据集,我们筛选了500张图像,这些图像都是 32 * 32 大小,图像名称形如 X.jpg,其中 X[0, 500)范围内的整数
  • 比赛提供了标签文件 label.txt 存储每张图的分类标签。该文件中每一行内容代表:图像名称 图像类别

比赛流程

  1. 参赛者可通过本页面下方下载接口,下载本赛事提供的专有数据集。
  2. 参赛者本地自行实现相应的图像攻击算法,并对专有数据集做攻击
  3. 参赛者在该页面中提交个人攻击后数据集,数据集格式与原有数据集格式相同
  4. 平台对用户提交数据集做评测,并根据结果提供排名。

提交文件

  • 参赛者需要提交扰动好的样本,提交时需要将所有图像压缩为一个 zip 压缩包,其中包含 500 张修改后的图像,图像格式及名称都应和原始图像保持一致。
  • 压缩包的文件树如下所示:
|-- images
  |-- 0.jpg
  |-- 1.jpg
  |-- ...
  |-- 499.jpg
|-- label.txt

评测

本次比赛的提交评测,在该平台上进行,具体的计算指标如下:

客观分

假设原始图像为 X=\{ x_1, x_2, ..., x_n\}\,用户提交的 500 张攻击样本为 X'=\{x'_1, x'_2, ...,x'_n\}\,我们主要测试以下三个方面:

  1. 图像攻击性。通过测试选手提交样本在后台模型上的攻击成功率,来代表样本的攻击性,这个值的计算公式为:
    Score_{ASR}=\frac{||{x'|F(x')\neq y}||}{n}
    其中 n 表示样本数,F(x') 表示以模型对用户样本的预测结果, y 表示图像原始标签
  2. 图像结构相似性:计算原始图像与对抗图像间像素间关联性,判断是否介入了大规模修改,这个值的计算公式为:
    \mu_x=\frac{1}{N}\sum_{i=1}^N x_i

\sigma_x=( \frac{1}{N-1}\sum^N_{i=1}(x_i-\mu_x)^2 )^{1/2}

Score_{SSIM(x,x')}=\frac{(2\mu_x\mu_{x'}+C_1)(2\sigma_{x{x'}}+C_2)}{(\mu_x^2+\mu_{x'}^2+C_1)(\sigma_x^2+\sigma_{x'}^2+C_2)}
具体的,在本次竞赛中,测试的是攻击成功样本的,平均图像结构相似度。
更多结构相似度理论说明,可以参看
《Image Quality Assessment : From Error Visibility to Structural Similarity》

  1. 噪声容量估计:噪声容量估计(Noise Tolerance Estimation),对抗样本的鲁棒性可通过噪声容限来估计,噪声容限反映了对抗样本在保持分类类别不变的情况下,可容忍的噪声量,用于计算攻击方法本身的鲁棒性。这个值的计算公式为:
    Score_{NTE}=\frac{1}{n}\sum_{i=1}^n[P(X_i^a)_{F(X_i^a)}-maxP(X_i^a)_j]
    NTE值越高,说明对抗样本的鲁棒性越高。更多噪声容量估计相关说明,可以参看
    《Towards Imperceptible and Robust Adversarial Example Attacks against Neural
    Networks》
  • 整体的客观打分计算规则为
    Score_M = 100 * Score_{ASR} * Score_{SSIM} * Score_{NTE}

主观分

  1. 合规图像筛选
    为避免用户取巧,在客观打分基础上,额外通过人工评测的方式,筛选不合规图像,并按照合规图像比例打分。
    合规图像筛选部分的打分规则为
    Score_{valid}=\frac{1}{n} Count(Valid\ Sample)
    其中 Count 方法为计数统计,当样本合法时统计值为1,不合法时统计值为0。主要的不合规图像说明如下:
  2. 图像质量评分
    人为的,我们将图像质量按照肉眼可辨识度,分为5个档次,分别对应1-5分。图像质量评分部分大根规则为:
    Score_{quality}=\frac{1}{5n}\ *\ \sum_{i=1}^nquality(x_i)
    其中 quality(x_i) 为图像 x_i 的质量评分。质量评分规则如下:
  • 整体的主观打分计算规则为
    Score_H=Score_{valid}*Score_{quality}

  • 总分的计算规则为
    Score = 0.6 * Score_H + 0.4 * Score_M

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,029评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,395评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,570评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,535评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,650评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,850评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,006评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,747评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,207评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,536评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,683评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,342评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,964评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,772评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,004评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,401评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,566评论 2 349

推荐阅读更多精彩内容