论文地址:https://arxiv.org/pdf/1904.04514.pdf

1 Background

深度学习代表是很强的并且在许多视觉任务上实现了很好的结果。目前主要的表示分为两类:用于图像分类的低分分辨率表示,对其它视觉问题重要的高分辨率表示,比如语义分割、人体姿态估计、目标检测等等。高分辨率的表示仍然存在很多问题没有解决,因此吸引了很多人的关注。

解决高分辨率表示主要有两种方式:(1)从低分辨率中来恢复得到高分辨率。(2)从高分辨卷积中获得高分辨率表示并且从平行的低分辨率卷积中来加强高分辨表示

本文沿着第(2)种方式来进一步研究HRNet来增加研究范围。它是研究HRNet的所有的 high-to-low分辨率平行卷积而不是仅仅研究低分辨率研究。简单的修改增加了一些开销但是产生了分辨率更高的表示。

2 Motivation

  • 为了广泛的视觉任务(比如语义分割、目标检测等),进一步研究HRNet(仅仅用于人体姿态估计)。

3 Related Work

  • Learning low-resolution representations:eg,FCN, Holistic edge detection
  • Recovering high-resolution representations:使用子网络(如decoder)来从低分辨率表示中恢复高分辨率表示。eg,SegNet, DeconvNet, U-Net, encoder-decoder, FPN等。 不对称的上采样网络也被经常使用,eg,RefineNet
  • Maintaining high-resolution representations:通常是通过连接多分辨率(从高分辨率到低分辨率)并行卷积并在并行卷积之间重复信息交换而形成的网络,eg,GridNet , convolutional neural fabrics , interlinked
    CNNs , HRNet等

4 Method

4.1 Architecture


总共包含4个stages,其中2、3、4stage都是重复模式化 multi-resolution blocks,一个multi-resolution blocks包含一个 multi-resolution group convolution(下图(a))和一个multi-resolution convolution(下图(b))

multi-resolution group convolution是分组卷积 https://zhuanlan.zhihu.com/p/355123135的一个简单扩展。 multi-resolution convolution它类似于正常卷积的全连接方式(如下图(c)),它们的区别有两方面:(1)multi-resolution convolution中通道的每个子集都有不同的分辨率(2)输入通道和输出通道的连接需要通过使用几个 2-strided的3×3卷积来处理分辨率下降。分辨率增加仅仅通过使用最近邻插值上采样操作。

4.2 Modification

HRNetV1(如下图)的特征选择,只使用分辨率最高的特征图

本文(HRNetV2,如下图)的特征选择,将所有分辨率的特征图(小的特征图进行upsample)进行concate,主要用于语义分割和面部关键点检测。这个修改仅仅增加了很少的参数和计算量。

在目标检测中的应用,HRNetV2p是在HRNetV2的基础上增加了一个特征金字塔

4.3 Instantiation

使用类似于 HRNetV1的方式来实例化网络。网络从一个包含两个 strided 3 × 3 convolutions的主干网络开始,使得分辨率变为原先的1/4。第一个stage包含4个残差单元。第二、第三和第四个stage分别包含1个、4个和3个multi-resolution blocks。宽度分别是C、2C、4C、8C

5 Experiments

5.1. Semantic Segmentation

  • Cityscapes

  • PASCAL context:
  • LIP:

5.2. COCO Object Detection



6 Conclusions

在本文中,作者通过一个简单的修改,对高分辨率表示网络在广泛的视觉应用中进行了实证研究。实验结果表明,改进后的神经网络学习到的高分辨率和多层次表征在语义分割、人脸标志检测和目标检测等方面是有效的。

HRNetV2:《High-Resolution Representations for Labeling Pixels and Regions》相关推荐

  1. Paper:《YOLOv4: Optimal Speed and Accuracy of Object Detection》的翻译与解读

    Paper:<YOLOv4: Optimal Speed and Accuracy of Object Detection>的翻译与解读 目录 YOLOv4的评价 1.四个改进和一个创新 ...

  2. 重读经典(CLIP下):《Learning Transferable Visual Models From Natural Language Supervision》

    上文链接:重读经典(CLIP上):<Learning Transferable Visual Models From Natural Language Supervision> 5. 实验 ...

  3. BlockChain:《区块链技术在医疗领域应用分析》—中投顾问《2016-2020年区块链技术深度调研及投资前景预测报告》听课笔记

    BlockChain:<区块链技术在医疗领域应用分析>听课笔记 导读      医疗行业接纳区块链技术的时间相对来说比较晚,不过并没错过应用区块链的时机.区块链技术正在改变全球医疗行业,逐 ...

  4. 谁说菜鸟不会数据分析python下载_刻意练习9:《谁说菜鸟不会数据分析python篇》第3章编程基础总计46页学习笔记...

    学习计划MyPlan9 主题:<谁说菜鸟不会数据分析python篇>第3章节 编程基础,总计46页. 时间:7.15-7.21 周内完成 各位星友们,在这个星球里每个人都要逼迫自己学习未知 ...

  5. 预见2021:《2021年中国呼叫中心产业全景图谱》 未来十年八大预测

    预见2021:<2021年中国呼叫中心产业全景图谱> 未来十年八大预测 按业务划分来看,呼叫中心的业务大类归到了BPO(商务流程外包)当中.呼叫中心具有高附加值.低碳经济.提高城市服务业水 ...

  6. 零基础学python书籍-图书推荐:《零基础学Python(全彩版)》

    原标题:图书推荐:<零基础学Python(全彩版)> 书皮 书皮 内容简介 <零基础学 Python>是针对零基础编程学习者研发的 Python 入门教程.从初学者角度出发,通 ...

  7. 计算机系大神和数学系系花,小甜文:《一贱钟情,大神求放过》1v1双C,男主小奶狗,全程高甜...

    最近很多书迷都反应不知道看什么书好,不知不觉的就陷入了书荒的境地,作为老书迷的小编对此也感同身受.今天小编继续给书迷们介绍好看的小说,分分钟让书迷朋友们看上瘾不睡觉!看好的话记得收藏,不怕以后再书荒了 ...

  8. 甘教课标版小学生计算机课,测评:《第6课 制作简单的表格教案》小学信息技术甘教课标版五年级上册教案4696(2)...

    5.如果应改变表格的长度跟高度,则把鼠标移到表格的竖线和横线上,当鼠标变成"|"和"="时,按住滑鼠左键,拖动鼠标,即可拖动半径和高度. 6.在表格中输入火车时 ...

  9. 2022-07-12 读书笔记:《写给所有人的极简统计学》

    2022-07-12 读书笔记:<写给所有人的极简统计学> 该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动! 本书作者:永野裕之 一直想学习一下数理统计的基础内容 ...

最新文章

  1. A股融资融券余额是什么意思?
  2. React兄弟组件之间通信
  3. YouCompleteMe unavailable: requires Vim compiled with Python 2.x support
  4. vue防重复点击(指令实现)
  5. java 程序是由什么组成的 java_从零开始的JAVA -2. java程序的构成及命名规则
  6. 理解ConstraintLayout 对性能的好处
  7. 流浪猫流浪狗H5完整运营源码下载/可封装APP
  8. DataTable的Merge方法和添加datatable到dataset
  9. Oracle分析函数-nulls first/nulls last
  10. 自学了三天的SeaJs学习,解决了前端的一些问题,与小伙伴们一起分享一下!...
  11. 【雕刻机】使用雕刻机雕刻PCB
  12. 黑马程序员Python教程——Python从入门到精通教程
  13. 软件架构设计---软件架构文档化
  14. 肠道微生物群与过敏性鼻炎
  15. java 按英文名排序_输入5种水果的英文名称,用java编写一个程序,输出这些水果名称按照字典出现的先后循序输出?...
  16. 网线直接插电脑能上网 接路由器就连不上了
  17. UliPad常用技巧小贴士
  18. 接口编写 文档规范 总结
  19. 计算电磁学(五)矩量法
  20. 我的CSDN 2007 MVB 最有价值BLOG 奖杯碎了,心疼

热门文章

  1. hadoop报错Wrong FS: hdfs:/, expected: file:///
  2. OllyDbg基础教程
  3. 极客日报:华为P50系列将于7月29日发布;阿里巴巴启动史上最大规模校招;iOS 14.7 正式发布
  4. Linux开机自动启动ORACLE设置_仁者无敌_新浪博客
  5. 【先定一个小目标】数据挖掘学习进度总结
  6. MSCRM中报表开发二:创建基于FetchXML报表
  7. Java多线程案例8-2Svip优先办理服务
  8. mysql执行非查询语句_iBatis执行非查询语句(CRUD,函数和过程)
  9. 根据身份证号中的日期判断某人是否已满18岁及是否已满60岁
  10. React从入门到放弃 Day2