max-pooling indics:在SegNet中,深度编码器 - 解码器网络被联合训练用于监督学习任务。Segnet移除了全连接层,这样可以使其比其他许多近来的结构(FCN,DeconvNet,ParseNet和Decoupled)显著的小并且训练起来更容易。SegNet的关键部件是解码器网络,每个解码器对应于一个编码器。其中,解码器使用从相应的编码器得到的max-pooling indices,来进行输入特征图的非线性upsampling。这个想法来自用于无监督功能学习的架构设计。在解码网络中重用max-pooling indices有多个实践好处
1)它改进了边界划分;
2)减少了实现端到端训练的参数数量;
3)这种upsampling的形式可以仅需要少量的修改而合并到任何编码-解码形式的架构。
        Deconvolution:网络中的Upsampling,2x2的输入,变成4x4的图,但是除了被记住位置的Pooling indices,其他位置的权值为0,因为数据已经被pooling走了。因此,SegNet使用的反卷积在这里用于填充缺失的内容,因此这里的反卷积与卷积是一模一样的,在图1中跟随Upsampling层后面的是也是卷积层。
       网络结构:编码器部分使用的是VGG16的前13层卷积网络,可以尝试使用Imagenet上的预训练。我们还可以丢弃完全连接的层,有利于在最深的编码器输出处保留较高分辨率的特征图。与其他最近的架构FCN和DeconvNet相比,这也减少了SegNet编码器网络中的参数数量。每个编码器层具有对应的解码器层,因此解码器网络具有13层。最终解码器输出被馈送到多级soft-max分类器以独立地为每个像素产生类概率。注意,最后一个解码器产生一个多通道的特征图,而不是3通道的(RGB)。然后输入到一个softmax分类器。这个soft-max独立地分类每个像素,soft-max分类器的输出是K通道图像的概率,其中K是类的数量.预测的分割对应于在每个像素处具有最大概率的类. 

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation要点相关推荐

  1. SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

    SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 1. SegNet--<SegN ...

  2. Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries论文阅读

    Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries Code link:https://gith ...

  3. 语义分割-- SegNet:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

    SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation PAMI 2017 http://mi ...

  4. 【SegNet】 A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

    日常吐槽 为什么明明英文论文动辄8,9页,十来页的,结果最后看人家翻译成中文,也并不多!!??我还是看的很吃力?? 反(上)卷积-反(上)池化-上采样 反卷积 Deconvolution 如上图的(a ...

  5. Semantic Segmentation--SegNet:A Deep Convolutional Encoder-Decoder Architecture..论文解读

    title: Semantic Segmentation–SegNet:A Deep Convolutional Encoder-Decoder Architecture-论文解读 tags: Obj ...

  6. 谣言检测文献精读——13.2020-A Graph Convolutional Encoder and Decoder Model for Rumor Detection

    这篇文章解决的问题 作者提出,之前的工作大多专注于文本挖掘和学习文本的语义特征,他们忽略了学习谣言的传播.之前有方法使用RvNN,与标准RvNN不同的是,输入是一个从源文章而不是解析树根的传播树,每个 ...

  7. 语音合成论文优选:Efficiently Trainable Text-to-Speech System Based on Deep Convolutional Networks with Guide

    声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 Efficiently Trainab ...

  8. VGGNet 阅读理解 - Very Deep Convolutional Networks for Large-Scale Image Recognition

    论文理解 - VGGNet - Very Deep Convolutional Networks for Large-Scale Image Recognition [VGG-Paper] [原文地址 ...

  9. VGG - Very Deep Convolutional Networks for Large-Scale Image Recognition

    Very Deep Convolutional Networks for Large-Scale Image Recognition ICLR 2015 (oral) http://www.robot ...

最新文章

  1. SAP MM MIGO移动类型311试图做批次确定,系统报错-Stock Determination or batch determination not possible-
  2. tensorflow教程 开始——Premade Estimators(预制评估器)
  3. Generate a String CodeForces - 710E(dp)
  4. 可变cell,自适应cell,理解iOS 8中的Self Sizing Cells和Dynamic Type
  5. vue.js+koa2项目实战(四)搭建koa2服务端
  6. await原理 js_深入浅出node.js异步编程 及async await原理
  7. Atitit.url 汉字中文路径  404 resin4 resin  解决  v2 q329
  8. 【论文笔记】Image Tampering Localization Using a Dense Fully Convolutional Network
  9. 英伟达显卡虚拟化vGPU实践指南
  10. 原生JS实现中文简繁切换,引入即可整站变繁体
  11. Spring Boot项目WebService接口发布、调用、以及常见错误详解
  12. matlab怎么取消科学计数法_在MATLAB中更改数据科学计数法
  13. 6月24日BEA成都User Group活动PPT下载
  14. ae中计算机打字预设,Typewriter Pro(AE电脑打字动画特效预设)
  15. 周口师范学院计算机科学,关于公布周口师范学院-计算机科学与技术学院.doc
  16. python卸载后第三方库_Python第三方库安装和卸载
  17. 普源DG1022U信号发生器技术参数
  18. ROS 问题(2):解决了bash: /home/yan/catkin_ws_txt/devel/setup.bash: 没有那个文件或目录
  19. 知识图谱初步学习(一)——本体+Protege新手学习
  20. GJB151B CS106测试方法

热门文章

  1. BZOJ4810:[YNOI2017]由乃的玉米田(莫队,bitset)
  2. android中wifi输入的密码保存的路径
  3. 13.Azure流量管理器(上)
  4. sendBroadcast和sendStickyBroadcast的区别
  5. virtualbox启用远程桌面
  6. ProgressBar--进度条
  7. 快速判断一个数是否是2的幂次方
  8. 路由代码WebApi设置namespace路由参数
  9. Eclipse过滤多余无用的Link文件和文件夹
  10. 弹出模态窗口,关闭并刷新页面