硬核!IBM对「神经网络鲁棒性」的理论分析
近期,CVPR 2021 安全AI挑战者大赛正在进行中 (报名截止3月24日),相关技术解析:
1. CVPR 2021大赛, 安全AI 之防御模型的「白盒对抗攻击」解析
2. 还在刷榜ImageNet?找出模型的脆弱之处更有价值!
报名链接:
https://s.alibaba.com/Challenge
借由此比赛,引起了不少同学对【神经网络鲁棒性】研究的兴趣,本文为该方向最新进展解读,作者来自中国台湾国立交通大学和IBM。
论文链接:https://arxiv.org/abs/2102.11935
1
引言
神经网络的鲁棒性研究一直是一个热门的话题,该论文出自IBM是一篇很硬核关于神经网络鲁棒性分析的理论性文章,作者在论文中的数学证明由浅入深层层递进推。
为了能够清晰的阐述论文中的贡献,我花了很大的力气将文章中没有展开的证明进行了补充,并对文章中的一些推导中一些小错误进行了更正。
论文中最关键的地方就是作者提出了一个基于理论实证的正则化损失函数,如果能把它看懂并为我们所用的话,应该是一个很好的涨点利器。
2
预备知识
为了能够更加清晰的介绍论文中的公式推导和核心思想,需要对论文中涉及到的预备知识和符号加以说明,具体的符号形式如下所示,相关的介绍会在z 之后证明中加以说明。
假定有一个 层的神经网络,其输入向量为 ,输出的类别是为 ,则有如下公式:
其中, 为包含了神经网络中所有的权重的集合,即 , 为非负单调激活函数(ReLU和Sigmoid)。神经网络输出的第 个元素被记作 ,输出中 和 两个类别的差值表示为。
在无对抗扰动的情况下,神经网络第 层( )的输出表示为 ,其中 。在有对抗扰动的情况下,神经网络的第 层的输出为 ,其中 。
2.1单隐层权重扰动
为了简化问题,作者考虑了一个含有激活函数的四层神经网络,并试图探究在对抗扰动下误差传播的边界。对于含激活函数的四层神经网络可以由如下公式所表示:
其中, 是第 层的权重矩阵。考虑对神经网络中第二层权重矩阵 中的任何一个元素加以 的扰动和对神经网络中输入层中 加以 的扰动这两种情况,即 , 。令向量 为第 层权重误差
(举例说明如果第三层的权重被加以扰动,则受影响的第3层之后的权重,输入层向量和第二层权重不会受到影响)
所以可以通过获得第一层的输出 来获得误差向量 ,具体的公式如下所示:
论文中如上公式的推导限于篇幅的影响省去了很多推导步骤,补充的完整过程如下所示:
对照之前的符号的表格,然后根据三角不等式即可推出结果
接下来考虑传播过程中的每个后续误差向量,由于所考虑的层之后没有层被扰动,则误差向量 的计算公式如下所示:
通过层层传播达到最后一层并能够评估扰动引起的预测误差。对于任何两个类 和 , 的相对误差的计算公式如下所示:
对上公式的补充扩展如下所示:
该公式的推导主要利用到了公式(6)的结果
3
理论推导
3.1输入向量和单隐层向量联合扰动联合扰动
将在输入向量和单隐层向量联合扰动联合扰动下第 层的权重误差向量记为 。 计算公式如下所示:
第二个误差 向量包括第一个误差向量 和权重扰动向量 ,具体的计算公式如下所示:
由于之后层没有添加权重扰动,则 的计算公式为:
最后一层中的 和 两类的差值的计算公式为:
综上可以发现一个现象,通过误差传播,无论扰动类型如何,误差都随着权重矩阵的范数而增长。作者给出了不同扰动设置下的边界定理。
定理一:令 为一个 层的神经网络,其中, , ,则有如下公式:
其中, 表示的是 行向量的维度, 表示输入向量 的维度。
定理二:令 为一个 层的神经网络,其中, , , 。 , 。 表示 行向量的维度,则有如下公式:
其中, 能被写成:
有如下形式:
其中,
以上的定理1和定理2分别给出了第 个类别和第 个类别在联合扰动中单层扰动和全层扰动这两种情况下的预测标签概率差值的上界。有坚实的理论做依靠使得作者能够提出基于理论推导得出的具有鲁棒性的损失函数。
3.2非奇异鲁棒性损失函数
根据以上严格的推导,作者提出了一种新的正则化损失函数用于训练神经网络使得其具有一定的鲁棒性,该损失函数公式如下所示:
其中,第一项 为标准的分类损失,而第二项和第三项分别用非负系数 和 调整对输入和权重空间的扰动敏感度。它们受到定理2的启发,可以解释为由联合输入权重扰动引起的最大误差。
4
实验结果
如下图所示展示了每个模型的鲁棒性能。标准模型(a)易受权重和输入扰动的影响。奇异鲁棒模型(b)和(c)只对可见的扰动类型鲁棒,而它们对不可见的扰动类型甚至具有更差的鲁棒性。比较测试准确性的曲线下面积(AUC)分数可以发现,使用本文提出的损失的非奇异稳健模型(d-f)明显优于标准和奇异稳健模型(a-c)。
END
备注:对抗
对抗学习交流群
扫码备注拉你入群。
我爱计算机视觉
微信号:aicvml
QQ群:805388940
微博知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net
点此报名AI大赛,赢10万美金大奖!
硬核!IBM对「神经网络鲁棒性」的理论分析相关推荐
- 算力≠智慧! MIT教授抛出「意识来源」新理论:人类认知与计算根本没关系
- 「Charles 应用」通过 Charles 分析社区话题功能
背景 App 目前没有运营引导工具对用户内容进行合理引导,需要增加话题运营工具.提供 App 社区内容质量和每天 UGC 量级. 参考 社区帖子添加标签是一个很常用的功能,大部分的社区 App 都有实 ...
- 真正的全栈工程师!B站硬核UP主自己造了一个激光雷达
机器之心报道 机器之心编辑部 转载自:机器之心 从零造一个激光雷达,需要多久? 激光雷达(LiDAR)是激光探测及测距系统的简称,目前广泛应用在无人驾驶和扫地机器人等领域.这种广泛的应用一方面得益于激 ...
- 【AI简报20220211期】硬核UP主自己造了一个激光雷达、详解AI加速器
嵌入式AI 详解AI加速器(一):2012年的AlexNet到底做对了什么? 原文: https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid ...
- 印度初创公司推出 AI「视频墙」 监视 70 所监狱【智能快讯】
By 超神经 AI 无处不在的时代,每天都有新的技术与研究成果出现.无论学术界还是商界,技术还是产品,AI 的新发现都源源不断,在带给我们全新视角的同时,也引起我们更深的思考. 想知道最近的 AI 动 ...
- PingCode入选36氪「WISE 2021新经济之王」年度硬核、新势力企业
近日,36氪在上海召开了"硬核时代"WISE2021新经济之王峰会.除大咖分享外,峰会还发布了『WISE 2021新经济之王』年度硬核企业.新势力企业榜单. 在本次榜单中 Ping ...
- Yoshua Bengio团队通过在网络「隐藏空间」中使用降噪器以提高深度神经网络的「鲁棒性」...
原文来源:arXiv 作者:Alex Lamb.Jonathan Binas.Anirudh Goyal.Dmitriy Serdyuk.Sandeep Subramanian.Ioannis Mit ...
- Yoshua Bengio团队通过在网络「隐藏空间」中使用降噪器以提高深度神经网络的「鲁棒性」
原文来源:arXiv 作者:Alex Lamb.Jonathan Binas.Anirudh Goyal.Dmitriy Serdyuk.Sandeep Subramanian.Ioannis Mit ...
- B站up主硬核打造「螃蟹火星车」,遥控、拍照、测距,还能做人脸检测;网友:赛博螃克...
鱼羊 白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI 吃完的螃蟹壳是干垃圾还是湿垃圾? 或者,裹上一层黑科技,让它变身「火星车」,馋哭隔壁家小孩. 更硬核的是,这样一台螃蟹火星车,并非只是 ...
最新文章
- 自动红眼移除算法 附c++完整代码
- 微服务架构:注册中心 ZooKeeper、Eureka、Consul 、Nacos 对比!
- JS学习笔记(一)DOM事件和监听
- 机器学习(MACHINE LEARNING)MATLAB进行概率统计分析
- C#中WinForm程序退出方法技巧总结
- 图像的灰度级数越多越好_数字图像处理:Reducing Gray Levels, Zooming and Shrinking
- 二值图像的距离变换研究
- mysql 内存越界_linux内存管理浅析
- MongoDB和Java(5):Spring Data整合MongoDB(注解配置)
- 前辈学习C语言的四种方法,实际上不管学什么语言,都行之有效!
- 2015年C语言组混搭 C/C++
- 5大主流主链排行版出炉; 以太坊新生合约数持续3周下跌; 各大榜单均现“黑马”冲榜!| 数据周榜...
- Heartbeat实现web服务器高可用
- 自动批量多渠道打包(腾讯VasDolly、美团walle),分渠道更新
- 计算机科学与技术专业毕业答辨问题,计算机科学与技术论文答辩问题(问题及技巧介绍)...
- 天津理工大学2018年计算机硕士真题
- Android驱动——WiFi驱动移植
- 江苏大学计算机学院姚奕如,小博传递 || 江苏大学第一届计算机文化节成功举办!...
- 【IT圈内事】2019互联网企业100强
- 阿里实习生测试一面(2017.3.29)
热门文章
- 情迁机器人Tim_情迁QQ机器人1.8.2更新说明
- 公主同盟自然流程攻略(GBA版)第1关 盗贼山寨
- 护理转专业计算机,我好像是护理系唯一一个转专业的男生,不过个人建议不要学医,24小时班了解一下...
- 使用Frida 实现 Hook 功能
- 手机的这些隐藏功能非常的便利,你有用过吗?
- 关于Lucene的词典FST深入剖析
- 学校计算机室 qq管理,学校机房电脑屏蔽qq怎么办?
- android 手机听筒和扬声器切换 听筒没声音问题
- 已阅论文汇总:迁移学习
- 因子分析之ggplot2