摘要

CNN具有非常强大的能力,然而,由于它的学习能力非常强,有时会导致过拟合现象的出现。为了解决这个问题,文章提出了一种简单的正则化方法:cutout。

它的原理是在训练时随机地屏蔽输入图像中的方形区域。它不仅容易实现,且实验证明,它能够与其它的数据增强方法一起作用,来提高模型的表现。

介绍

近些年深度学习在许多有挑战性的领域中,如目标识别、语义分割、图像描述和人类姿态评估等做出了很好的表现。而这些表现的主要贡献者就是CNN。但随着需要解决的问题的复杂性上升,CNN模型所需的资源也随之上升,且过于强大的能力也常常会导致过拟合现象的出现,并降低模型的泛用性。

为了解决这个问题,人们提出了很多不同的方法:向数据、参数、激活层审慎地加入噪音;简单且有效的数据增强方法,如水平翻转和cropping。其中一个常用的方法是dropout:它在训练时随机地丢弃一些神经元的激活层,以降低特征检测时的协同适应。

本文提出的方法类似于dropout,但有两个主要的区别:1、它丢弃的是输入图像的数据。2、它丢弃的是一整块区域,而不是单个神经元。这能够有效地帮助CNN关注不同的特征,因为去除一个区域的神经元可以很好地防止被去除的神经元信息通过其它渠道向下传递。

同时,dropout由于1、卷积层拥有相较于全连接层更少的参数,因此正则化的效果相对欠佳;2、图像的相邻元素有着很强的相关性的原因,在卷积层的效果不好。而cutout因为去除了一块区域的神经元,且它相比更接近于数据增强。因此在卷积层的效果要相对更好。

cutout提出的最初动机来源于机器视觉的一个常见的问题:目标遮挡。开始时它的思想有些接近于max drop:在每个epoch时提取并存储被激活得最多的特征,并在接下来的epoch中将其用一个特征图的均值掩膜覆盖。这样做的效果很好,但后来经过研究发现,随机擦除一个固定大小的区域的图像取得的效果和它一样好。由于后者更为简单些,因此作者最终采取了这种做法。

实现细节

作者发现,比起形状,cutout区域的大小更为重要。因此为了简化,他们选择了方形,且如果允许cutout区域延伸到图像外,效果反而会更好。

Improved Regularization of Convolutional Neural Networks with Cutout相关推荐

  1. CV:翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第一章~第三章

    CV:翻译并解读2019<A Survey of the Recent Architectures of Deep Convolutional Neural Networks>第一章~第三 ...

  2. DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout

    今天真的要开始正式进入科研状态了,之前一直都进入失败,咳!那就先来看一篇相关领域的论文吧 ---------------------------------------------- 题目:DEEPC ...

  3. 《每日论文》ImageNet Classification with Deep Convolutional Neural Networks

    这篇论文是剖析 CNN 领域的经典之作,也是入门 CNN 的必读论文.作者训练了一个面向数量为 1.2 百万的高分辨率的图像数据集 ImageNet, 图像的种类为 1000 种的深度卷积神经网络. ...

  4. AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...

  5. 论文研读 —— 6. ImageNet Classification with Deep Convolutional Neural Networks (1/3)

    文章目录 Authors and Publishment Authors Bibtex Abstract 1. Introduction 2. The Dataset Authors and Publ ...

  6. ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照

    文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书 翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers- ...

  7. 回顾一些重要的CNN改进模型(你真的了解 Convolutional Neural Networks 么)

    转载自: 干货 | 你真的了解 Convolutional Neural Networks 么 https://mp.weixin.qq.com/s?__biz=MzAwMjM3MTc5OA==&am ...

  8. 干货 | 你真的了解 Convolutional Neural Networks 么

    干货 | 你真的了解 Convolutional Neural Networks 么 原创2016-01-11小S程序媛的日常程序媛的日常 首先,先感谢大家支持我们周六推送的第一次线下活动:程序媛们一 ...

  9. (zhuan) Building Convolutional Neural Networks with Tensorflow

    Ahmet Taspinar Home About Contact Building Convolutional Neural Networks with Tensorflow Posted on a ...

最新文章

  1. python的git_Pygit: 用Python实现Git的功能
  2. HDU - 3338 Kakuro Extension(最大流+思维建边)
  3. 硬件工程师电路设计必须紧记的十大要点
  4. spring vaadin_在Spring Boot中使用Vaadin的简介
  5. codeforces 158B-C语言解题报告
  6. 【华为云技术分享】iSulad轻量化容器实践解析
  7. 【Elasticsearch】我在 Elasticsearch 集群内应该设置多少个分片?
  8. 【转载】TCP拥塞控制算法 优缺点 适用环境 性能分析
  9. c语言标准化考试程序报告,在线考试系统-c语言报告.doc
  10. pytorch学习笔记(二十一):Channels
  11. Fatal Error LNK1123:转换到COFF期间失败:文件无效或损坏
  12. Atitit.gui api自动化调用技术原理与实践
  13. 解决使用七牛CDN导致AJAX评论报错{“ERROR”:”GET FROM IMAGE SOURCE FAILED: E405″}
  14. 数据库在线自生成ER图
  15. c语言为什么不能自动free,求大神帮忙看看 为什么cfree没有报错但是就是运行不了...
  16. KiCad坐标文件(.pos)转表格(.xlsx)工具
  17. 拜尔滤色拜尔滤色镜_如何在Windows 10上启用滤色器以更清晰地阅读屏幕
  18. C语言将UTC时间转为时区时间的方法参考
  19. mathcad如何创建分段函数图形
  20. 【KGAT】Knowledge Graph Attention Network for Recommendation

热门文章

  1. WEB渗透面试(360)
  2. 360 for Linux 与 setuid
  3. 11个springboot快速开发的项目,接私活利器
  4. C# 第六章『交互式图形界面』◆第4节:FileDialog类 、OpenFileDialog类、SaveFileDialog类、示例
  5. 【绝悟】腾讯最强策略协作型AI开放人机对战,五一节放松一下吧!
  6. ECharts 提示框(tooltip)
  7. matlab怎么匹配特征参数,sift特征匹配matlab
  8. 清华大学刘徐舟老师经典语录
  9. java cloneable_java.lang.Cloneable的理解
  10. javascript——变量、数据类型