图像金字塔和特征金字塔
图像金字塔
图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。
在OpenCV中,有关图像金字塔的操作有pyrup()和pyrdown(),分别用来完成上采样和下采样,其实在OpenCV中有关于图片缩放的更直接的函数,即resize()。
图像金字塔分为两类:高斯图像金字塔和拉普拉斯图像金字塔
高斯金字塔是通过高斯平滑(用高斯函数生成的核进行滤波)和亚采样(通过对进行过高斯平滑处理的图像进行隔行隔列采样而得到)获得一些列下采样图像,也就是说第K层高斯金字塔通过平滑、亚采样就可以获得K+1层高斯图像,每层是按从下到上编号的。
高斯金字塔的上采样和下采样是非线性处理,是不可逆的有损处理,因此,如果下采样后的图像想还原回原来的尺寸的话会丢失很多信息,使图片变得模糊,为了解决这个问题,需要提前保存因下采样而造成的缺失信息,拉普拉斯金字塔可以近似地做到这一点。
特征金字塔 Feature Pyramid Networks
为解决目标检测在处理多尺度变化问题时的不足,现在的很多网络都使用了利用单个高层特征(比如说Faster R-CNN利用下采样四倍的卷积层——Conv4,进行后续的物体的分类和bounding box的回归),但是这样做有一个明显的缺陷,即小物体本身具有的像素信息较少,在下采样的过程中极易被丢失,为了处理这种物体大小差异十分明显的检测问题,经典的方法是利用图像金字塔的方式进行多尺度变化增强,但这样会带来极大的计算量。所以提出了特征金字塔的网络结构,能在增加极小的计算量的情况下,处理好物体检测中的多尺度变化问题。
FPN,使每一层不同尺度的特征图都具有较强的语义信息。
这种网络结构,能够在增加较少计算量的前提下融合低分辨率语义信息较强的特征图和高分辨率语义信息较弱但空间信息丰富的特征图。
其实在这篇论文之前,也有人提到得出一张既具有高分辨率又具有较强语义信息的特征图进行预测,但FPN的独特之处在于,它是在以特征金字塔为基础结构上,对每一层级的特征图分别进行预测。
参考
图像金字塔:图像金字塔 - 简书
特征金字塔:【论文笔记】FPN —— 特征金字塔 - 知乎
图像金字塔、特征金字塔(FPN)_福尔摩斯帅双的博客-CSDN博客_图像金字塔和特征金字塔
图像金字塔和特征金字塔相关推荐
- 图像金字塔、特征金字塔(FPN)
图像金字塔 参考: https://www.jianshu.com/p/436e96200f80 图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构.一幅图像的金字塔是 ...
- 深度学习阅读导航 | 04 FPN:基于特征金字塔网络的目标检测
写在前面:大家好!我是[AI 菌],一枚爱弹吉他的程序员.我热爱AI.热爱分享.热爱开源! 这博客是我对学习的一点总结与记录.如果您也对 深度学习.机器视觉.算法.Python.C++ 感兴趣,可以关 ...
- AI大视觉(六) | 特征金字塔(FPN)如何进行特征融合?
本文来自公众号"AI大道理". 这里既有AI,又有生活大道理,无数渺小的思考填满了一生. 在深度学习的很多工作中(例如目标检测.图像分割),融合不同尺度的特征是提高性能的一个重要手 ...
- 【CV】FPN:用于目标检测的特征金字塔网络
论文名称:Feature Pyramid Networks for Object Detection 论文下载:https://arxiv.org/abs/1612.03144 论文年份:2016 论 ...
- 图像多尺度特征融合、特征金字塔总结
参考链接: https://blog.csdn.net/qq_36268755/article/details/106192524?spm=1001.2014.3001.5502 https://zh ...
- (01)ORB-SLAM2源码无死角解析-(06) 图像金字塔_ORB特征点
讲解关于slam一系列文章汇总链接:史上最全slam从零开始,针对于本栏目讲解的(01)ORB-SLAM2源码无死角解析链接如下(本文内容来自计算机视觉life ORB-SLAM2 课程课件): (0 ...
- 性能超FPN!北大、阿里等提多层特征金字塔网络
作者 | Qijie Zhao等 编译 | 李杰 出品 | AI科技大本营(ID:rgznai100) 特征金字塔网络具有处理不同物体尺度变化的能力,因此被广泛应用到one-stage目标检测网络(如 ...
- ECCV2020 | 即插即用,涨点明显!FPT:特征金字塔Transformer
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 这篇文章收录于ECCV2020,将Transformer机制应用于对特征金字塔FPN的改进上,整体思路 ...
- 详解何恺明团队4篇大作 !(附代码)| 从特征金字塔网络、Mask R-CNN到学习分割一切
来源:新智元 作者:krish 本文5000字,建议阅读10+分钟. 本文介绍FAIR何恺明.Tsung-Yi Lin等人的团队在计算机视觉领域最新的一些创新,包括特征金字塔网络.RetinaNet. ...
最新文章
- 【干货】CNN与Transformer的强强联合!谷歌最新开源BoTNet,ImageNet达84.7%准确率
- Docker Compose 配置文件详解
- Vue指令之v-for——迭代数组、迭代对象中的属性、迭代数字||v-for循环中key属性的使用
- 多项式输出(NOIP2009 普及组第一题)
- backbone.js全栈开发
- OpenCASCADE:形状愈合之概述
- 关于Mac设置alias别名访问服务器
- python读取大文件内容_python读取大文件
- bitcount java_Java源码解释之Integer.bitCount
- import pandas as pd什么意思_Pandas万花筒:让绘图变得更美观
- c语言win api函数,Win2K下的Api函数的拦截
- 持续集成部署Jenkins工作笔记0016---测试验证整个自动化持续集成流程
- SQLi LABS Less-18
- 0点睡觉很会养生”苏宁高管的这话让IT人很憋屈
- 二、安装Robot framework-selenium2library
- css字体红色调用,如何在这段CSS代码中字体变成红色?
- 谈谈面向对象分析和设计
- 思科路由器及交换机基本配置
- 记 Linux 学习知识总结 -- 寒江老师视频(七) - SHELL 讲解
- java 对大数据的处理
热门文章
- [附源码]Java计算机毕业设计SSM个人相册管理系统
- 2022-2028年全球及中国药片压片机行业发展现状调研及投资前景分析
- 系统开发c语言技术参数,1 C语言 gcc 介绍 C 语言编译 main接受参数
- 2022年全球与中国机器人操作系统(ROS)市场现状及未来发展趋势
- 淘宝联盟新版订单接口taobao.tbk.sc.order.details.get如何计算佣金?
- 直接调用python3.6(做一个软连接)
- Oracle EBS进化史
- 使用代码刷QQ的跨年红包
- 2017年江苏大学885代码题(含答案)
- 日期格式转换,24时制和12小时制