ICnet实时场景分割网络
本文出自ECCV2018,腾讯优图实验室和香港中文大学汤晓鸥教授团队笔下,是一篇顶会的论文。论文的应用场景应该是无人驾驶这一块。
网络细节
ICnet的网络分为三个分支,Lowest、medium、high resolution Branch。
在此定义图片的初始化输入大小为 H x W。
Lowest resolution branch
低分辨率分支使用原图片的 1/4大小作为输入,1/32大小作为输出。
这一部分网络基于金字塔池化、FCN结构,使用空洞卷积,并且在残差模块的基础上设计阶段 4和阶段 5的空洞率为 2、4.所以能够得到输入大小的1/8。金字塔池化后,图像的空间尺寸变成 C x H/32 x W/32 ,后接减少用于通道维度的C‘ x 1 x 1核的卷积层,C’ 《 C, 最终得到的结果为 C‘ x H/32 x W/32。
详细见图1!!
Medium resolution branch
中分辨率分支使用原图的1/2 大小作为输入,1/16 大小作为输出。
这部分的网络可分解为三个步骤,每一步都使用rate = 2 的下采样,最终形成相比较输入8倍的下采样,结果为 H/16 x W/16。相比较低分辨率分支,这个水平的细节恢复是有重要意义的。因此,在这两个分支上的权重核下采样的步骤是共享的。以PSPnet50为例,17层的卷积层作为第一步三个stage( 1、2、3)是共享权重的,然后在中间分支的以二倍的大小压缩,喂给剩下的顶部分支,(这个应该是以分辨率来分的)。最后,将得到的1/16大小的分支输出与来自低分辨率分支的1/32输出进行多尺度特征融合,得到本分支的目标 C x H/16 x W/16。
High resolution branch
看完上面两部分的内容,这里就好理解了。高分辨率分支主要的工作就是将来自低、中分辨率分支的结果进行融合,然后通过三次上采样得到最终的分割结果(大小为1/4 )-- 与之配套训练的各种大小的ground truth就不再赘述了。在训练的时候是如此,而在测试阶段,还要经过一次上采样(直接对1/4 大小的图片进行插值恢复到与原图像大小一致)才能得到最终的分割结果。
与其他网络结构的结合结果
ICnet能够用于更多不同的场合,这也说明他的generation。通过与deeplabv3结合,ICnet能够提升五倍的速度且准确率不下降!!
结果展示
总结
这是我看到第一篇ECCV的论文,很是简洁明了,这等写作手法可以借鉴!
ICnet实时场景分割网络相关推荐
- Real_time实时语义分割网络 SegNet, ENet, ICNet, BiSeNet,ShelfNet
1. SegNet 论文地址:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 本不应该将segnet作 ...
- 北航、旷视联合,打造最强实时语义分割网络
来源:AI科技评论 编辑:Camel 导语:MSFNet在Cityscapes测试集上达到77.1%mIoU/41FPS(注意是1024*2048),在Camvid测试集上达到75.4 mIoU/97 ...
- 实时语义分割网络 BiSeNet(附代码解读)
实时语义分割网络 BiSeNet BiSeNet Contributions BackGround BiSeNet 结构 Loss function Experimental Results 采用数据 ...
- CVPR 2020|图网络引导的实时语义分割网络搜索 (GAS)
论文链接:https://arxiv.org/abs/1909.06793 之后代码将会开源:https://github.com/L-Lighter/LightNet 作者:林培文*,孙鹏*,程光亮 ...
- 详解ENet | CPU可以实时的道路分割网络
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 OpenCV DNN模块支持的图像语义分割网络FCN是基于V ...
- 实时语义分割算法大盘点
本文转载自计算机视觉工坊 语义分割论文 语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用.在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动 ...
- CFPNet:用于实时语义分割的通道特征金字塔
论文地址:CFPNet: Channel-wise Feature Pyramid for Real-Time Semantic Segmentation 代码地址: https://github.c ...
- 基于多特征地图和深度学习的实时交通场景分割
https://www.toutiao.com/a6623529829402673667/ 2018-11-14 09:58:33 Ⅰ.介绍 交通场景分割是智能车辆在检测障碍物.规划路径和自主导航中的 ...
- 旷视科技提出双向网络BiSeNet:实现实时语义分割
转于:https://zhuanlan.zhihu.com/p/41475332 全球计算机视觉三大顶会之一 ECCV 2018 (European Conference on Computer Vi ...
最新文章
- 抛弃Anchor box和NMS,目标检测新范式开源:Sparse R-CNN
- android 启动其它apk
- Android Widget 中ListView加载网络图片
- matlab dmodce,吧里有没有大神可以教我怎么改dmodce函数,用的matlab2012a版本
- [css] 怎么才能让图文不可复制?
- HTML+CSS+JS实现 ❤️echarts省市区地图城市选择❤️
- 开源大数据平台HBase对接OBS操作指南
- BZOJ 1068: [SCOI2007]压缩
- PostgreSQL查询计划剖析
- fedora13上安装mhvtl报错
- 【SQL】Mysql常用sql语句记录
- Cesium:去除原生自带右上角弹窗
- linux系统 锐捷_锐捷校园网Linux客户端认证xrgsu
- Edraw Max 9.x 安装
- Cadence OrCad Allegro SPB 16.6 下载及安装破解指南
- python接受前端传递的参数
- java对台湾同胞身份证号码验证
- Ubuntu16.0.4 安装rebar3指南
- MySQL命令行导出数据库(sql脚本)
- Vue学习之前端路由