【动手学深度学习】06-ResNet解析
目录
ResNet解析
0 前言
1 基础
2 残差块
3 总结
参考
ResNet解析
0 前言
论文:《Deep Residual Learning for Image Recognition》
论文地址:Deep Residual Learning for Image Recognition | IEEE Conference Publication | IEEE Xplore
1 基础
经典网络ResNet(Residual Networks)由Kaiming He等人于2015年提出, 它在2015年的ImageNet图像识别 挑战赛夺魁,并深刻影响了后来的深度神经⽹络的设计。
在ResNet网络提出之前,传统的卷积神经网络都是通过将一系列卷积层与下采样层进行堆叠得到的。但是当堆叠到一定网络深度时,就会出现两个问题。
1)梯度消失或梯度爆炸。
2)退化问题(degradation problem)。
在ResNet论文中说通过数据的预处理以及在网络中使用BN(Batch Normalization)层能够解决梯度消失或者梯度爆炸问题。但是对于退化问题(随着网络层数的加深,效果还会变差,如下图所示)并没有很好的解决办法。
我们可以设想:当我们直接对网络进行简单的堆叠到特别长,网络内部的特征在其中某一层已经达到了最佳的情况,这时候剩下层应该不对改特征做任何改变,也就是说,对一个特别深的深度网络而言,该网络的浅层形式的解空间应该是这个深度网络解空间的子集,换句话说,相对于浅层网络更深的网络至少不会有更差的效果,但是因为网络degradation的问题,这并不成立。
那么,我们退而求其次,已知有网络degradation的情况下,不求加深度能提高准确性,能不能至少让深度网络实现和浅层网络一样的性能,即让深度网络后面的层至少实现恒等映射的作用。
2 残差块
使用残差块之后随着网络层数的加深,效果变好而不是变差(图来自论文)。
RseNet 网络具体参数图
3 总结
- 学习嵌套函数(nested function)是训练神经⽹络的理想情况。在深层神经⽹络中,学习另⼀层作为恒等映射(identity function)较容易(尽管这是⼀个极端情况)。
- 残差映射可以更容易地学习同⼀函数,例如将权重层中的参数近似为零。
- 利⽤残差块(residual blocks)可以训练出⼀个有效的深层神经⽹络:输⼊可以通过层间的残余连接更快地向前传播。
- 残差⽹络(ResNet)对随后的深层神经⽹络设计产⽣了深远影响,⽆论是卷积类⽹络还是全连接类⽹络。
- 使用BN层加速训练,丢弃了Dropout.
参考
李沐 《动手学深度学习》
(44条消息) 深度学习网络篇——ResNet_PRIS-SCMonkey的博客-CSDN博客_深度学习网络
(44条消息) 六、ResNet网络详细解析(超详细哦)_会哭泣的猫的博客-CSDN博客_resnet网络
【动手学深度学习】06-ResNet解析相关推荐
- 伯禹公益AI《动手学深度学习PyTorch版》Task 06 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 06 学习笔记 Task 06:批量归一化和残差网络:凸优化:梯度下降 微信昵称:WarmIce 批量归一化和残差网络 BN和Res ...
- 《动手学深度学习v2》之细致解析(1)内容及介绍及安装
前言 作者来自北京某不知名985,现在是本科在读学生,专业是数据科学与大数据技术,班上同学都太卷了,没办法,需要学习深度学习,经大佬介绍,在B站上找到了一个很不错的资源,李沐老师的<动手学深度学 ...
- 《动手学深度学习》课后习题3
<动手学深度学习>学习网址: 参考资料 <动手学深度学习>中文版官网教材: PyTorch中文文档: 部分PyTorch代码来自GitHub开源仓库: <动手学>: ...
- 「动手学深度学习」在B站火到没谁,加这个免费实操平台,妥妥天花板!
论 AI 圈活菩萨,非李沐老师莫属. 前有编写「动手学深度学习」,成就圈内入门经典,后又在B站免费讲斯坦福 AI 课,一则艰深硬核讲论文的视频播放量36万,不少课题组从导师到见习本科生都在追番. 如此 ...
- 资源 | 李沐等人开源中文书《动手学深度学习》预览版上线
来源:机器之心 本文约2000字,建议阅读10分钟. 本文为大家介绍了一本交互式深度学习书籍. 近日,由 Aston Zhang.李沐等人所著图书<动手学深度学习>放出了在线预览版,以供读 ...
- 《动手学深度学习》PyTorch版本
Dive-Into-Deep-Learning-PyTorch-PDF 简介 本项目对中文版<动手学深度学习>中的代码进行整理,并参考一些优秀的GitHub项目给出基于PyTorch的 ...
- (d2l-ai/d2l-zh)《动手学深度学习》pytorch 笔记(2)前言(介绍各种机器学习问题)以及数据操作预备知识Ⅰ
开源项目地址:d2l-ai/d2l-zh 教材官网:https://zh.d2l.ai/ 书介绍:https://zh-v2.d2l.ai/ 笔记基于2021年7月26日发布的版本,书及代码下载地址在 ...
- 李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!
点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 李沐,亚马逊 AI 主任科学家,名声在外!半年前,由李沐.Aston Zhang 等人合力打造 ...
- 【深度学习】李沐《动手学深度学习》的PyTorch实现已完成
这个项目是中文版<动手学深度学习>中的代码进行整理,用Pytorch实现,是目前全网最全的Pytorch版本. 项目作者:吴振宇博士 简介 Dive-Into-Deep-Learnin ...
最新文章
- java输入输出及文件_java输入输出流及文件操作
- ICML新研究提出泛化能力评估新指标:直接上向量余弦距离就OK,还开源了相关代码...
- OS / Linux / 文件描述符以及 file 结构体
- Get JSON with the jQuery getJSON Method
- i春秋DMZ大型靶场实验(四)Hash基础
- eclipse鼠标变十了_Eclipse在过去十年中的主要成就
- win8 打开计算机配置,win8.1 更改电脑配置无法使用
- 调查VMware View Composer失败代码(2085204)
- [CodeForces 372A] Counting Kangaroos is Fun
- java输出long最大值_Java调用long的最大值和最小值
- html怎么统计总访问量,如何实现对网站页面访问量的统计?
- 水花兄弟(Splash Brothers)
- 假如生活欺骗了你 (普希金诗歌)
- 微信公众号多域名回调系统
- proxmox的安装
- 求解单位冲激响应的笔记
- java秒表计时器_Java实现的计时器【秒表】功能示例
- 实时系统vxWorks - timer定时应用
- mysql难不难_mysql数据库难学吗?
- Nginx 相关问题(持续更新一:Cookie问题)