2019-01-25 探索攻击逻辑回归图像多分类

盘一下多分类逻辑回归的攻击方案。

#修改label分布, 对于non-target

D(t|y(w,x)) = \prod_{n=1}^{N} \prod_{k=1}^{K} y_{n,k}^{1-t_{n,k}}

#还是梯度下降那一套

\nabla_{x} \hat{D} = \nabla_{x} log D = \nabla_{x} \sum_{n=1}^{N} \sum_{k=1}^{K} (1-t_{k}) \log y_{k}

\hat{D} = \sum_{n=1}^{N} \sum_{k=1}^{K} (1-t_{n,k}) \log y_{n,k}

 \partial_{x} \hat{D} = \sum_{n=1}^{N} \sum_{k=1}^{K} \frac {\partial \hat{D}}{\partial y_{k}} \frac {\partial y_{k}}{\partial x}

#求偏导数

\frac {\partial \hat{D}}{\partial y_{k}}  = \frac {1-t_{k}} {y_{k}}

 \frac {\partial y_{k}}{\partial x} = \frac{\Sigma \cdot \partial_{x} \exp(a_{k}) - \exp(a_{k}) \partial_{x} \Sigma}{\Sigma^{2}} = \frac {\sum_{c=1}^{K} \exp(a_{c}) \cdot \vec{w}_{k} \exp(a_{k}) - \exp(a_{k}) \sum_{c=1}^{K} \vec{w}_{c} \exp(a_{c})} {\sum_{c=1}^{K}\exp(a_{c}) \cdot \sum_{c=1}^{K}\exp(a_{c})}

 \frac {\partial y_{k}}{\partial x} =  y_{k} \vec{w}_{k} - y_{k} \cdot \sum_{c=1}^{K} y_{c} \vec{w}_{c}

结果为

 \nabla_{x} \log D = \sum_{k=1}^{K} (1-t_{k}) \cdot  (\vec{w}_{k} - \sum_{c=1}^{K} y_{c} \vec{w}_{c})

上式展开

 x_{p, m} = x_{m} + \delta x_{m} = x_{m} + \eta \cdot \nabla_{x_{m,c}} D_{m,c}

x_{p, m} = x_{m} + \eta \sum_{k=1}^{K} (1-t_{m,k}) \cdot  (\vec{w}_{k} - \sum_{c=1}^{K} y_{m,c} \vec{w}_{c})

#攻击经验总结

在不定向攻击里,得到fooltaget存在着 随着攻击参数变化的分布。可以用混淆矩阵描述这种攻击分布地图,在大部分的攻击里,尽量给图片造成微小的扰动,同时保证安全的区域。

攻击完后的fooledtaget样本,自然可以进行更强防御性模型的训练,有可能需要整整一层来进行防止。

#攻击的通用化,思考向GAN演化可能性

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 5,176评论 0 8
  • 昨天是期中考试的日子,虽然这次改了考察形式,但我和他爹还是挺在意儿子的表现和成绩,数学是口算检测,计算能力一直是儿...
    燕飞飞2017阅读 158评论 1 1
  • 转自: http://web.jobbole.com/92875/ 一、xss攻击 XSS这类安全问题发生的本质原...
    胡儒清阅读 893评论 0 1
  • 虚伪与激进伪装的本我在欲望中贪婪的汲取最后的快感——11月30
    takeshi_勇阅读 209评论 0 0