本文出自ECCV2018,腾讯优图实验室和香港中文大学汤晓鸥教授团队笔下,是一篇顶会的论文。论文的应用场景应该是无人驾驶这一块。

网络细节

ICnet的网络分为三个分支,Lowest、medium、high resolution Branch。

在此定义图片的初始化输入大小为 H x W。

Lowest resolution branch

低分辨率分支使用原图片的 1/4大小作为输入,1/32大小作为输出。
这一部分网络基于金字塔池化、FCN结构,使用空洞卷积,并且在残差模块的基础上设计阶段 4和阶段 5的空洞率为 2、4.所以能够得到输入大小的1/8。金字塔池化后,图像的空间尺寸变成 C x H/32 x W/32 ,后接减少用于通道维度的C‘ x 1 x 1核的卷积层,C’ 《 C, 最终得到的结果为 C‘ x H/32 x W/32。
详细见图1!!

Medium resolution branch

中分辨率分支使用原图的1/2 大小作为输入,1/16 大小作为输出。
这部分的网络可分解为三个步骤,每一步都使用rate = 2 的下采样,最终形成相比较输入8倍的下采样,结果为 H/16 x W/16。相比较低分辨率分支,这个水平的细节恢复是有重要意义的。因此,在这两个分支上的权重核下采样的步骤是共享的。以PSPnet50为例,17层的卷积层作为第一步三个stage( 1、2、3)是共享权重的,然后在中间分支的以二倍的大小压缩,喂给剩下的顶部分支,(这个应该是以分辨率来分的)。最后,将得到的1/16大小的分支输出与来自低分辨率分支的1/32输出进行多尺度特征融合,得到本分支的目标 C x H/16 x W/16。

High resolution branch

看完上面两部分的内容,这里就好理解了。高分辨率分支主要的工作就是将来自低、中分辨率分支的结果进行融合,然后通过三次上采样得到最终的分割结果(大小为1/4 )-- 与之配套训练的各种大小的ground truth就不再赘述了。在训练的时候是如此,而在测试阶段,还要经过一次上采样(直接对1/4 大小的图片进行插值恢复到与原图像大小一致)才能得到最终的分割结果。

与其他网络结构的结合结果

ICnet能够用于更多不同的场合,这也说明他的generation。通过与deeplabv3结合,ICnet能够提升五倍的速度且准确率不下降!!

结果展示

总结

这是我看到第一篇ECCV的论文,很是简洁明了,这等写作手法可以借鉴!

ICnet实时场景分割网络相关推荐

  1. Real_time实时语义分割网络 SegNet, ENet, ICNet, BiSeNet,ShelfNet

    1. SegNet 论文地址:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 本不应该将segnet作 ...

  2. 北航、旷视联合,打造最强实时语义分割网络

    来源:AI科技评论 编辑:Camel 导语:MSFNet在Cityscapes测试集上达到77.1%mIoU/41FPS(注意是1024*2048),在Camvid测试集上达到75.4 mIoU/97 ...

  3. 实时语义分割网络 BiSeNet(附代码解读)

    实时语义分割网络 BiSeNet BiSeNet Contributions BackGround BiSeNet 结构 Loss function Experimental Results 采用数据 ...

  4. CVPR 2020|图网络引导的实时语义分割网络搜索 (GAS)

    论文链接:https://arxiv.org/abs/1909.06793 之后代码将会开源:https://github.com/L-Lighter/LightNet 作者:林培文*,孙鹏*,程光亮 ...

  5. 详解ENet | CPU可以实时的道路分割网络

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 OpenCV DNN模块支持的图像语义分割网络FCN是基于V ...

  6. 实时语义分割算法大盘点

    本文转载自计算机视觉工坊 语义分割论文 语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用.在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动 ...

  7. CFPNet:用于实时语义分割的通道特征金字塔

    论文地址:CFPNet: Channel-wise Feature Pyramid for Real-Time Semantic Segmentation 代码地址: https://github.c ...

  8. 基于多特征地图和深度学习的实时交通场景分割

    https://www.toutiao.com/a6623529829402673667/ 2018-11-14 09:58:33 Ⅰ.介绍 交通场景分割是智能车辆在检测障碍物.规划路径和自主导航中的 ...

  9. 旷视科技提出双向网络BiSeNet:实现实时语义分割

    转于:https://zhuanlan.zhihu.com/p/41475332 全球计算机视觉三大顶会之一 ECCV 2018 (European Conference on Computer Vi ...

最新文章

  1. 抛弃Anchor box和NMS,目标检测新范式开源:Sparse R-CNN
  2. android 启动其它apk
  3. Android Widget 中ListView加载网络图片
  4. matlab dmodce,吧里有没有大神可以教我怎么改dmodce函数,用的matlab2012a版本
  5. [css] 怎么才能让图文不可复制?
  6. HTML+CSS+JS实现 ❤️echarts省市区地图城市选择❤️
  7. 开源大数据平台HBase对接OBS操作指南
  8. BZOJ 1068: [SCOI2007]压缩
  9. PostgreSQL查询计划剖析
  10. fedora13上安装mhvtl报错
  11. 【SQL】Mysql常用sql语句记录
  12. Cesium:去除原生自带右上角弹窗
  13. linux系统 锐捷_锐捷校园网Linux客户端认证xrgsu
  14. Edraw Max 9.x 安装
  15. Cadence OrCad Allegro SPB 16.6 下载及安装破解指南
  16. python接受前端传递的参数
  17. java对台湾同胞身份证号码验证
  18. Ubuntu16.0.4 安装rebar3指南
  19. MySQL命令行导出数据库(sql脚本)
  20. Vue学习之前端路由

热门文章

  1. 电线之间:采访开发商和企业家Guillermo Rauch
  2. 百度人脸识别技术简单入门
  3. java keystore生成,探讨如何生成keystore
  4. Qt Quick 示例 - StocQt股票趋势图开发
  5. 将PPT文件内容转换为图片放在Email邮件正文中发送
  6. ios 视频播放代码Demo
  7. vue中将链接转二维码图片,2张图合成为1张图
  8. 信息化幼儿园解决方案
  9. java执行反射代码导致频繁创建奇怪的类从而发生元数据区被占满FUllGc案例
  10. 很精彩的一篇传道文 (寻找罗素的三激情时发现的)