【语义分割】【TPAMI2017】DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

核心思想

  • 采用空洞卷积的方式在不增加参数数量的情况下扩大感受野,减少下采样次数。
  • 采用空洞空间金字塔池化(ASPP)解决目标尺度不一的问题。
  • 将CNN与条件随机场(CRF)结合,用于更好地处理分割目标边界等细节。

算法流程

  1. 将在图像分类问题上预训练的深度卷积网络(VGG-16或ResNet-101)的末尾所有全连接层转变为卷积层,并用空洞卷积替换普通的卷积来增大特征分辨率,将原来的1/32原图尺寸提升至1/8原图尺寸。
  2. 对网络输出结果使用双线性插值的方法增大8倍至原图尺寸。
  3. 使用全连接条件随机场处理放大后的特征图,得到最终的分割结果。

空洞卷积

传统CNN中的池化层或步长会大大降低特征图的分辨率,一些方法采用反卷积层来恢复图像尺寸,空间和时间开销较大。

DeepLab采用空洞卷积的方式来扩大感受野,即:

其中空洞率r控制了感受野的范围,当r=1时即为普通的卷积操作。1维上的原理:

由于空洞卷积代替池化层达到了扩大感受野的作用,因此原来下采样-卷积-上采样的过程只需要用一次空洞卷积即可替代,如图:

考虑到算法开销,5个下采样层中的最后两个用空洞卷积替换,得到的特征图为1/8原图尺寸,随后使用双线性插值的方式将特征图放大至原图大小。

空洞空间金字塔池化(ASPP)

该模块仿照R-CNN的空间金字塔池化,用多个空洞率各不相同的空洞卷积层平行地提取特征,并组合成最终的结果,目的是利用不同空洞率产生的不同感受野更好地捕捉不同大小尺度的目标。

条件随机场(CRF)

单纯由CNN得到的语义分割图像通常对于边界的预测并不精确。DeepLab采用了全连接条件随机场,来更好地预测分割的边界。条件随机场的效果如图,其中上图为得分图,下图为softmax之后的概率图:

实验细节

  • 主干网络使用在ImageNet上预训练的VGG-16和ResNet-101网络,与FCN一致。
  • 损失函数为输出的特征图在各个位置上的交叉熵之和,且所有位置以及所有标签都拥有相同的权重。
  • 优化算法采用随机梯度下降,整个网络所有参数都参与学习。
  • CNN的训练和条件随机场的训练分开进行。

结果

作者测试了几种不同的卷积核尺寸搭配不同的空洞率情况下的计算速度和准确率,结果如图,其中最后一列为平均IOU,FOV为感受野大小:

该结果表明使用3x3卷积核以及12空洞率可以在准确率相似的情况下大大减少参数数量,加快计算速度。该模型在PASCAL VOC 2012的官方测试集上达到了70.3%的平均IOU。

作者也比较了给予VGG-16的单分支结构和ASPP结构的效果,结果如图,其中三种方法分别为单分支、小空洞率的四分支ASPP和大空洞率的四分支ASPP:

另外,使用ResNet-101结构代替VGG-16,以及采用多尺度输入、预训练、数据增强、条件随机场等方法都能不同程度地提升算法的准确度。作者的最优的模型在PASCAL VOC 2012测试集上达到了79.7%的平均IOU:

准确度判断 语义分割_【语义分割】DeepLab v1/v2相关推荐

  1. gcn语义分割_语义分割该如何走下去?

    来自 | 知乎    编辑 | 深度学习这件小事链接 | https://www.zhihu.com/question/390783647本文仅供交流,如有侵权,请联系删除   问题语义分割该如何走下 ...

  2. 语义分割和实例分割_语义分割入门的一点总结

    点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Yanpeng Sun https://zhuanlan.zh ...

  3. CNN:RCNN、SPPNet、Fast RCNN、Faster RCNN、YOLO V1 V2 V3、SSD、FCN、SegNet、U-Net、DeepLab V1 V2 V3、Mask RCNN

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) CNN: 目标检测: RCNN SPPNet Fast RCN ...

  4. 英语 语义分割_语义分割细度的文化成因与英语词语搭配

    语义分割细度的文化成因与英语词语搭配 吕英 [摘 要] 语言与文化双生双息--语言是文化最重要的载体 , 是文化的管窥.镜像 , 它承载着一个民族文化发生.发展和传承的全过程 ; 同时 , 文化又制约 ...

  5. 实例分割语义分割全景分割_角色分割

    实例分割语义分割全景分割 Good article on the ongoing fragmentation of roles in the Software Industry. [From Sylv ...

  6. PCL中分割_欧式分割(1)

    基于欧式距离的分割和基于区域生长的分割本质上都是用区分邻里关系远近来完成的.由于点云数据提供了更高维度的数据,故有很多信息可以提取获得.欧几里得算法使用邻居之间距离作为判定标准,而区域生长算法则利用了 ...

  7. 语义计算_语义多态性如何在量子计算中起作用

    语义计算 A few months ago, I published an article about an obscure mathematical concept which can be use ...

  8. android怎样判断插入数据是否成功_Android 端 V1/V2/V3 签名的原理

    Android 的安装包签名方案到目前有3个版本,分别是: 最初签名方案V1: 为了提高验证速度和覆盖度在 7.0 引入的 V2: 以及为了实现密钥轮转在 9.0 引入的 V3. 让我们分别了解一下这 ...

  9. 网件r6300安装mysql数据库_网件(NETGEAR)R6300 V1/V2路由器设置教程【图文】

    连接方式请参考上面,电话线上网时的连接. 网件(NETGEAR)R6300路由器 电话线/光钎接入上网时,NETGEAR R6300路由器的正确连接方式 第一步.设置电脑IP地址在设置网件(NETGE ...

最新文章

  1. 远程过程调用RPC简介
  2. React Native填坑之旅--动画篇
  3. 【Android 组件化】路由组件 ( 使用 JavaPoet 生成路由表类 )
  4. OpenCV均值漂移的跟踪mean-shift based tracking的实例(附完整代码)
  5. openresty 前端开发进阶一之http后端
  6. linux命令中的cp,Linux高级技术:关于cp命令中拷贝所有的写法
  7. 【OpenCV 例程200篇】01. 图像的读取(cv2.imread)
  8. android 捕捉home键
  9. PHP 表单文件上传的原理,php多文件上传功能实现原理及代码
  10. PyTorch 1.0 中文官方教程:使用 PyTorch 进行图像风格转换
  11. linux数据,Linux数据
  12. 前端利器!让AI根据手绘原型生成HTML | 教程+代码
  13. 构建大数据网络 需要重视这五个地方
  14. android 动态表情包,动图GIF表情包下载
  15. vue 获取当前本机ip_Vue项目启动时自动获取本机IP地址
  16. kernel中的日志打印
  17. Android Studio 插件-Android Styler 的使用 (转)
  18. ASP.NET网页响应莫明其妙反应奇慢,原来故障根源在于DNS解析冲突
  19. 转大神的日志 【大杂烩】杂7杂8的东西
  20. 电脑蓝屏,报错信息0xc000007b

热门文章

  1. C++头文件<functional>和bind、placeholders占位符使用简单例子
  2. 双层玻璃窗的功效模型matlab,数学建模实例双层玻璃的功效
  3. python with关键字_python中用with关键字来实现上下文管理器.
  4. linux是不是显示不了中文版,Linux为什么OpenOffice下不能显示中文
  5. 人工学院2卡顿_浙大宁波理工学院就业率怎么样 | 就业情况 | 前景好的专业
  6. 用集合return多个值_十五个常用的 Laravel 集合(Collection)
  7. oracle mseq,一次RMAN备份报错的诊断过程(一)
  8. 牧马人鼠标g13鼠标宏_达尔优第五代牧马人EM915游戏鼠标评测
  9. 卡耐基梅隆大学计算机工程录取率,热点:卡内基梅隆大学爆出2020年新生数据,计算机学院录取率堪比藤校...
  10. 计算机考研去哪个城市,2019计算机考研:考研热门城市院校排名