来源:PaperWeekly
本文约2000字,建议阅读5分钟
本文加入了很多新的 related works讨论,加入了多尺度Query攻击 / 黑盒攻击 / 防御三个不同角度的实验。

其实这篇文章初版 2018 年 5 月就写好了,最近 2022 年 12 月才中。四年中得到了老板们的很多支持和理解。这段经历也希望给在投稿的同学们一点鼓舞,paper 写好肯定能中的,不要轻易放弃。

与早期版本相比,我们在公式上做了一些调整,加入了很多新的 related works讨论,加入了多尺度Query攻击 / 黑盒攻击 / 防御三个不同角度的实验。加入 Food256, Market-1501CUB, Oxford, Paris等数据集上的新方法和较新的可视化方式。攻击了 Re-ID 中的 PCB 结构,攻击了 Cifar10 中的 WiderResNet。

论文标题:

U-Turn: Crafting Adversarial Queries with Opposite-Direction Features

论文链接:

https://link.springer.com/article/10.1007/s11263-022-01737-y

https://zdzheng.xyz/files/IJCV_Retrieval_Robustness_CameraReady.pdf

代码链接:

https://github.com/layumi/U_turn

arXiv早期版本:

https://arxiv.org/abs/1809.02681

1、实际案例

实际使用的话。举个例子,比如我们要攻击 google 或者百度的图像检索系统,搞大新闻(大雾)。我们可以下载一张狗的图像,通过 imagenet 模型(也可以是其他模型,最好是接近检索系统的模型)计算特征,通过把特征调头(本文的方法),来计算对抗噪声(adversarial noise)加回到狗上。再把攻击过后的狗 使用以图搜图,可以看到 百度谷歌的系统就不能返回狗相关的内容了。虽然我们人还能识别出这是狗的图像。

P.S. 我当时也试过攻击 google 以图搜图,人还能识别出这是狗的图像,但谷歌往往会返回 “马赛克” 相关图像。我估计谷歌也不全是用深度特征,或者和 imagenet 模型有较大差异,导致攻击后,往往趋向于“马赛克”,而不是其他实体类别(飞机啊之类的)。当然马赛克也算某种程度的成功!

2、What

本文的初衷其实特别简单,现有 Re-ID 模型,或者风景检索模型已经达到了 95% 以上的 Recall-1 召回率,那么我们是不是可以设计一种方式来攻击检索模型?一方面探探 Re-ID 模型的老底, 一方面攻击是为了更好的防御,研究一下防御异常 case。

检索模型与传统的分类模型的差异在于检索模型是用提取出来的特征来比较结果(排序),这与传统的 分类模型有较大的差异,如下表。

检索问题还有一个特点就是 open set 也就是说 测试的时候类别往往是训练时没见过的。如果大家熟悉 cub 数据集,在检索设置下,训练的时候训练集合 100 多种鸟,和测试时测试 100 多种鸟,这两个 100 种是没有 overlapp 种类的。纯靠提取的视觉特征来匹配和排序。所以一些分类攻击方法 不适合攻击检索模型,因为攻击时基于类别预测的 gradient 往往是不准的。

检索模型在测试时,有两部分数据:一部分是查询图像 query,一部分是图像库 gallery(数据量较大,而且一般不能 access)。考虑到实际可行性,我们方法将主要瞄准攻击 query 的图像来导致错误的检索结果。

3、How

很自然的一个想法就是攻击特征。那么怎么攻击特征?基于我们之前对于 cross entropy loss 的观察(可以参考 large-margin softmax loss 这篇文章)。往往我们使用分类 loss 的时候,特征 f 会存在一个放射形的分布。这是由于特征在学习的时候与最后一层分类层权重 W 计算的是 cos similarity。如下图,导致我们学完模型,同一类的样本会分布在该类 W 附近,这样 f*W 才能到达最大值。

所以我们提出了一个特别简单的方法,就是让特征调头。如下图,其实有两种常见的分类攻击方法也可以一起可视化出来。如(a)这种就是把分类概率最大的类别给压下去(如 Fast Gradient),通过给-Wmax,所以有红色的梯度传播方向沿着反 Wmax;如(b)还有一种就是把最不可能的类别的特征给拉上来(如 Least-likely),所以红色的梯度沿着 Wmin。

这两种分类攻击方法在传统分类问题上当然是很直接有效的。但由于检索问题中测试集都是没见过的类别(没见过的鸟种),所以自然 f 的分布没有那么紧密贴合 Wmax 或者 Wmin,因此我们的策略很简单,既然有了 f,那我们直接把 f 往 -f 去移动就好了,如图 (c)。

这样在特征匹配阶段,原来排名高的结果,理想情况下,与-f 算 cos similarity,从接近 1 变到接近 -1,反而会排到最低。达成了我们攻击检索排序的效果。

一个小 extension。在检索问题中,我们还常用 multi-scale 来做 query augmentation,所以我们也研究了一下怎么在这种情况下维持攻击效果(主要难点在于 resize 操作,可能把一些小却关键的抖动给 smooth 了)。

其实我们应对的方法也很简单,就如 model ensemble 一样,我们把多个尺度的 adversarial gradient 做个 ensemble 平均就好。

4、实验分析

在三个数据集三个指标下,我们固定了抖动幅度也就是横坐标的 epsilon,比较在同样抖动幅度下哪一种方法能使检索模型犯更多错。我们的方法是黄色线都处在最下面,也就是攻击效果更好。

同时我们也提供了在 5 个数据集上(Food,CUB,Market,Oxford,Paris)的定量实验结果。

为了展示模型的机制,我们也尝试攻击了 Cifar10 上的分类模型。可以看到我们改变最后一层特征的策略,对于 top-5 也有很强的压制力。对于 top-1,由于没有拉一个候选类别上来,所以会比 least-likely 略低一些,但也差不多。

黑盒攻击:我们也尝试了使用 ResNet50 生成的攻击样本去攻击一个黑盒的 DenseNet 模型(这个模型的参数我们是不可获取的)。发现也能取得比较好的迁移攻击能力。

对抗防御:我们采用 online adversarial training 的方式来训练一个防御模型。我们发现他在接受新的白盒攻击的时候依然是不行的,但是比完全没有防御的模型在小抖动上会更稳定一些(掉点少一些)。

特征移动的可视化:这也是我觉得最喜欢的一个实验。我们利用 Cifar10,把最后分类层的维度改为 2,来 plot 分类层的 feature 的变化。如下图,随着抖动幅度 epsilon 的变大,我们可以看到样本的特征慢慢 “调头”了。比如大部分橙色的特征就移动到对面去了。

编辑:于腾凯

校对:林亦霖

IJCV 2022 | 逆转特征让Re-ID模型从88.54%降至0.15%相关推荐

  1. #今日论文推荐# 顶刊IJCV 2022!华为GhostNet再升级,全系列硬件上最优极简AI网络

    #今日论文推荐# 顶刊IJCV 2022!华为GhostNet再升级,全系列硬件上最优极简AI网络 GhostNet作为近年来最流行的轻量级神经网络架构,其在ARM和CPU端的应用已经非常广泛.而在G ...

  2. 7000 字精华总结,Pandas/Sklearn 进行机器学习之特征筛选,有效提升模型性能

    作者 | 俊欣 来源 | 关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这 ...

  3. R语言随机森林模型:计算随机森林模型的特征重要度(feature importance)并可视化特征重要度、使用少数重要特征拟合随机森林模型(比较所有特征模型和重要特征模型在测试集上的表现差异)

    R语言随机森林模型:计算随机森林模型的特征重要度(feature importance)并可视化特征重要度.使用少数重要特征拟合随机森林模型(比较所有特征模型和重要特征模型在测试集上的表现差异) 目录

  4. 深圳大学梁臻博士提出EEGFuseNet高维脑电图混合无监督深度特征表征与融合模型及其在情绪识别中的应用...

    近期,深圳大学医学部生物医学工程学院梁臻博士(张治国教授团队MIND LAB核心成员)提出一种实用的基于无监督学习的卷积循环混合生成对抗网络,用以实现有效的脑电特征表征与融合,简称为EEGFuseNe ...

  5. 【Python】Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

    今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征的数量会带来许多的好处,例如 提高预测的精 ...

  6. 多值类别特征加入CTR预估模型的方法

    [摘要] 本文用图示的方法梳理和介绍了多值类别特征加入到CTR预估模型的一般方法,通俗易懂. 我们都知道一般单值类别特征加入到CTR预估模型的方法是先对单值类别特征进行one-hot,然后和embed ...

  7. 不为人知的稠密特征加入CTR预估模型的方法

    [摘要] 本文介绍了一种比较新颖的稠密特征加入CTR预估模型的方法并用图示的方法演示了基本稠密特征加入神经网络中过程. 稠密特征一般是相对稀疏特征来说的,我们知道类别特征经过独热编码之后比较稀疏,比如 ...

  8. 【2022 CCF BDCI 文心大模型创意项目】乐享词话—诗词意境辅助记忆工具

    [2022 CCF BDCI 文心大模型创意项目]「乐享词话」--诗词意境辅助记忆工具 唐诗宋词记忆不下来?快来领取你的专属辅助记忆工具! 「乐享词话」允许你将古诗词中的意境提取出来,更直观地感受古诗 ...

  9. [2022 CCF BDCI 文心大模型]还在愁没有头像?属于你的个人头像来了!

    [2022 CCF BDCI 文心大模型]还在愁没有头像?属于你的个人头像来了! 用文本就可以生成不错的图片??这不快来体验一下??! AiStudio项目地址,选择hub版,代码fork后无脑运行: ...

最新文章

  1. Ubuntu 15.10安装ns2.35+nam
  2. 10万视频,所有面部图像均获授权,Facebook创建大规模Deepfake数据集
  3. c语言unused variable错误,这个错误可能的原因是你忘了初始化变量
  4. django-Modelform
  5. TF-IDF算法讲解
  6. Spring组件扫描context:component-scan/使用详解
  7. python字典排序及字典集合去重高阶教程
  8. 关于 There is no getter for property named ‘id‘ in ‘class java.lang.Integer‘
  9. Java IO: Reader And Writer
  10. python opencv输出mp4_Python玩转视频处理(四):视频按场景进行分割
  11. 作者:汪疆平(1970-),男,北明软件有限公司技术研究院高级工程师、副院长。...
  12. 如何避免DevOps变革的六大“焦油坑”
  13. java文件怎么一行一行读,Java 读文件内容如何显示在一行上
  14. Nginx 设置文件缓存时间
  15. libevent源码分析系列
  16. Java接口配置框架magic-api
  17. JavaScript -- Map数据结构
  18. 【JS从入门到精通】09-数组
  19. 数字化转型进行时 | 区块链赋能政务数字化研讨会在零数科技举办
  20. Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读

热门文章

  1. 自学python(mac)之----读取文件
  2. 做公众号,这些事别去碰,碰就是死
  3. 1218直播节,花椒与北京卫视会密谋什么新局?
  4. 全国各省市名称和代号
  5. RStudio控制台(console)中出现少量中文乱码的解决方法
  6. 奇异矩阵 singular matrix
  7. 线元法输入曲线要素_机械图纸·每日一符:线轮廓度
  8. 基于 Python django 的小型论坛系统
  9. 局域网交换网络安全解决之道,免疫墙
  10. 嵌入式Linux应用开发完全手册.pdf 影印版 OCR可复制 高清 带书签