计算机视觉研究院专栏

作者:Edison_G

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

源码获取|扫码回复“GWD”获取源码

边界不连续及其与最终检测度量的不一致一直是旋转检测回归损失设计的瓶颈。

1

简要

边界不连续及其与最终检测度量的不一致一直是旋转检测回归损失设计的瓶颈。仅分享的,有研究者就提出了一种基于高斯Wasserstein距离的回归损失作为解决该问题的基本方法。具体地说,旋转边界框被转换为二维高斯分布,使近似高斯Wasserstein距离(GWD)引起的不可微旋转物单位的损失,可以通过梯度反向传播有效地学习。即使在两个旋转的边界框之间没有重叠,GWD仍然可以提供学习信息,这通常是小目标检测的情况。

由于它的三个独特的特性,GWD也可以很有效地解决边界不连续和类方形的问题,无论它是如何定义边界框的。使用不同的检测器在五个数据集上进行的实验表明了该方法的有效性。

2

背景及动机

在该领域,主要的工作采用一种回归方法来预测旋转角度,这已经取得了最先进的性能。然而,与传统的水平检测器相比,角度回归模型将带来新的问题,总结如下:

i)度量与损失之间的不一致,

ii)边界不连续性,

iii)类平方问题。

事实上,这些问题没有统一的解决方案仍然开放,它们可能在很大程度上损害最终的性能,特别是在边界位置,如下图左图所示。研究者利用二维高斯分布建模任意面向目标检测边界框,并通过计算两个框的高斯Wasserstein距离(GWD)来近似联合上不可微旋转相交(IoU)引起的损失。

GWD有效地将模型学习与最终的检测精度度量对齐,这一直是一个瓶颈,在现有的旋转检测器中没有实现。研究者基于GWD的探测器不受边界不连续和类方形问题的影响,这种免疫与如何定义边界框协议无关,如上图右所示。

3

相关工作

  • Approximate differentiable rotating IoU loss

使用方向边界框(OBB)进行目标检测可以通过减少与背景区域的重叠来更好地定位旋转对象。现有的OBB方法大多是通过引入由距离损失优化的附加角度尺寸而在水平边界框检测器上构建的。但是,由于距离损失仅使OBB的角度误差最小,并且与IoU的相关性较松散,因此它对具有高纵横比的对象不敏感。

  • Boundary discontinuity and square-like problems

由于角度参数的周期性和边界框定义的多样性,基于回归的旋转检测器经常存在边界不连续和类方形的问题。许多现有的方法试图从不同的角度解决上述部分问题。例如,SCRDet和RSDet提出了IoU-smooth L1损失和modulated损失来平滑边界损失跳跃。CSL将角度预测从回归问题转换为分类问题。DCL进一步解决了长边定义引入的类方形物体检测问题,是指近似为方形的实例的旋转不敏感问题。

  • Approximate differentiable rotating IoU loss

PIoU提出了一种新的损失,即Pixels-IoU(PIoU)损失,以利用角度和IoU进行精确的OBB回归。PIoU损失是从IoU度量导出的,具有像素级形式,这很简单,适用于水平和定向边界框。

4

新框架分析

  • Bounding Box Definition

如上图所示,给出了基于参数的旋转边框角度的两个流行定义:Doc表示的OpenCV协议和Dle表示长边定义。注:前者的θ∈[−90◦,0◦)表示边界框与x轴之间的夹角或右间隙。相比之下,后者定义的θ∈[−90◦,90◦)是边界框的长边角与x轴之间的角度。这两种参数化可以相互转换:

案例1:如上图3a描述了角差与损失函数之间的关系。虽然它们都具有单调性,但只有Smooth L1曲线是凸的,而其他的曲线则不是。

案例2:如上图3b显示了在不同长宽比条件下的两个损失函数的变化。可以看出,两个边界框的Smooth L1损失为恒定(主要来自角度差),但随着展宽比的变化而大幅变化。

案例3:如上图3c探讨了中心点位移对不同损失函数的影响。同样地,尽管有相同的单调性,但也没有高度的一致性。

两个边界框定义(顶部),边界不连续性和类方形问题的说明(底部)

  • Wasserstein Distance for Rotating Box

其中R表示旋转矩阵,S表示特征值的对角矩阵。最终函数如下:

  • Gaussian Wasserstein Distance Regression Loss

与[Arbitrary-oriented object detection with circular smooth label. In Proceedings of the European Conference on Computer Vision, pages 677–694. Springer, 2020]一致,研究者使用单级检测器ResNet作为基线。旋转矩形由五个参数表示(x、y、w、h、θ)。在实验中,主要遵循Doc,回归方程如下:

5

实验总结

Ablation experiment of training strategies and tricks

Comparison between different solutions for inconsistency between metric and loss (IML), boundary discontinuity (BD) and square-like problem (SLP) on DOTA dataset. The ???? indicates that the method has corresponding problem. † and ‡represent the large aspect ratio object and the square-like object, respectively. The bold red and blue fonts indicate the top two performances respectively.

AP on different objects and mAP on DOTA

Different forms of GWD-based regression loss curve

© THE END 

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

源码下载| 回复“GWD”获取下载

往期推荐

????

  • 目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载)

  • SSD7-FFAM | 对嵌入式友好的目标检测网络,为幼儿园儿童的安全保驾护航

  • 目标检测新方式 | class-agnostic检测器用于目标检测(附论文下载链接)

  • 干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测(致敬袁老)

  • CVPR 2021 | 不需要标注了?看自监督学习框架如何助力目标检测

旋转目标检测 | 基于高斯Wasserstein距离损失的目标检测(附源代码)相关推荐

  1. GWD:基于高斯Wasserstein距离的旋转目标检测 | ICML 2021

      论文详细描述了当前旋转目标检测的主要问题,提出将旋转回归目标定义为高斯分布,使用Wasserstein距离度量高斯分布间的距离用于训练.目前,常规目标检测也有很多将回归转化为概率分布函数的做法,本 ...

  2. 红外小目标:基于深度学习的红外小目标检测研究方法(持续更新中)

    深度学习红外小目标研究现状_2021.7.6更新 2019年 TBC-Net(TBC-Net: A real-time detector for infrared small target detec ...

  3. 动态多目标优化--基于决策变量分类的动态多目标进化算法 笔记

    阅读论文:A Dynamic Multiobjective Evolutionary Algorithm Based on Decision Variable Classification (Zhen ...

  4. matlab ycrcb肤色检测,基于HSV与YCrCb颜色空间进行肤色检测的研究

    862012. 10 电脑编程技巧与维护 1 引言 皮肤检测是人脸检测.手势识别等任务的关键步骤.因此,如果能增加肤色识别的准确性就可以提高人脸识别.手势识别的准确性.而肤色识别的准确性又受到多种因素 ...

  5. 基于EVEBITDA倍数估值法Apha冲略附源代码

    原 基于EV/EBITDA倍数估值法的Alpha对冲策略(附源代码) Alpha对冲策略简介 什么是Alpha对冲策略? ​ 投资者在市场交易中面临着系统性风险(即Beta风险)和非系统性风险(即Al ...

  6. matlab道路检测,基于MATLAB的车道保持辅助车道检测

    模拟车道以下 您可以修改LKA的Safe Lateral Offset的值以忽略驱动程序输入,将控制器置于纯通道跟随模式.通过增加该阈值,横向偏移总是在由车道保持辅助设定的距离内.因此,车道偏离的状态 ...

  7. Swim-Transform V2:用于目标检测,视觉大模型不再是难题(附源代码)

    关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2111.09883.p ...

  8. 基于FCM算法优化的图像分割研究(附源代码)

    摘要: 图像分割是指把图像分解成各具特性的区域并提取出有用目标的技术, 它是由图像处理到图像分析的一个关键步骤, 已在诸如计算机视觉.图像编码.模式识别和医学图像分析等很多领域有着实际的应用.根据图像 ...

  9. 基于Transformer的交通预测模型部分汇总【附源代码】

    交通预测一直是一个重要的问题,它涉及到交通运输系统的可靠性和效率.随着人工智能的发展,越来越多的研究者开始使用深度学习模型来解决这个问题.其中,基于Transformer的交通预测模型在近年来备受关注 ...

最新文章

  1. 系统架构设计的原则和模式
  2. 1003. [ZJOI2006]物流运输【区间DP+最短路】
  3. 泰康人寿信息化三大核心战略:移动优先、数据驱动和云计算
  4. 用filter实现web程序的统一认证
  5. 用python念数字_Python-数据类型之数字
  6. struts2学习笔记之十一:struts2的类型转换器
  7. 数学建模-7.多元线性回归分析
  8. visio 2013免费激活
  9. c语言皮尔森系数程序,【R语言编程】---根据表达量计算mRNA与lncRNA的皮尔森相关系数...
  10. 推荐七个逆天神器APP,让你分分秒秒变优秀
  11. 2020-2022年最全湖南省矢量数据(路网含城市道路、铁路(包括地铁、轻轨)高速、国道、省道、县道、乡道+几百万个poi数据+省市县乡镇行政区划+河流水系网+建筑轮廓+30米dem等shp数据
  12. 搜狐自媒体还是蛮拼的 竟拉着加多宝做了一档美食节目
  13. 阴阳师2017 7服务器维护,《阴阳师》手游4月17日维护更新公告
  14. 内网异地备份_服务器数据全自动异地备份解决方案
  15. 机械硬盘提示格式化的常见原因|3种数据恢复方法
  16. 去爱一个无缘无故责备你的人,你就学到了生命的艺术。
  17. 吴恩达OpenAI基于ChatGPT的Prompt开发教程
  18. 解决mysql安装后无法设置初始密码的问题,亲测有效
  19. AssemblyBuilder以及Activator双剑合璧
  20. 《人物》:计算机世界第一人 - 艾兰·图灵

热门文章

  1. 使用php描述快速排序算法,PHP描述冒泡排序和快速排序算法
  2. 关于Email地址验证的正则表达式
  3. 应变测量的传统方法与DIC(数字图像相关)方法
  4. 微信公众号开发-php-sdk接口
  5. 黄金投资技术分析入门的时候要学点什么
  6. nginx 301 302重定向跳转配置 (一般都做301,对seo好)
  7. #25 李雷向韩梅梅求婚
  8. 【中缀、后缀表达式(整数)的介绍、转换及运算】
  9. 投资博弈(协调博弈)
  10. HTML5网页列表与段落设计