倍赛专利解读:数据标注行业目标检测预标注实现技术新突破
在追求科技创新的道路上,倍赛科技从未停止前进的步伐。近日,由倍赛科技申请的关于面向人工数据标注的图像目标边界框位置调节方法的发明专利成功被国家知识产权局受理。
下面将简要对此专利进行解读。
技术亮点
1.模拟标注员视角,从边界差距的角度,对画框进行评估。
2.以缩小边界差距为目标,指导画框模型训练和筛选。
简单来讲,此专利可用于优化目标检测预标注技术,通过自动化的标注工具,对数据进行预处理,使其在进行标注时变得更加简单高效,从而提升数据标注的精度与速度,降低标注成本。
痛点
目标检测是计算机视觉中的一个常见任务。其评估指标则通常从分类、重叠区域、性能等多方面进行考量。其中,重叠区域就是指预测的目标物体的边界框(简称:预测框)与真实答案中的边界框(简称:真实框)的重叠程度,通常基于IoU交并比(Intersection over Union)来评估:用P代表预测框,G代表真实框。IoU = (P∩G) / (P∪G)。
然而,基于IoU的评估指标并不适用于标注场景。在标注员而言,当模型提供的预测框与目标边框差距超过容忍范围时(例如:3个像素),就会认为两个框的边不是贴合的。也就会认定模型的结果有错。至于两个框重叠率有多高并不是非常在意。
所以,按照常规方式训练的模型对于标注场景并不友好。
解决方案
专利提出了一种在训练的评估环节遵照标注场景进行边界框重合程度衡量的方法。用它自动筛选合适的模型超参数,并进一步将这种评估指标调整成可导形式,融入到损失函数中,指导模型的训练。
以此来模拟标注员在审核预测框时对边界误差的容忍程度,自动评估预测框与真实框之间的差距,并统计所需的手工调整次数。
例如:标注员容忍的框边的误差为4个像素。那么对于上图的真实框(绿色)和预测框(红色)。有三条边都已经满足要求,而左边因差5个像素,需要手动做一次调整。
对于验证集里的每个样本,都采用上述方式,衡量各个边是否需要调整,并统计整个验证集上需要做的手动操作次数M。这个值就反映了当前模型在标注场景里的效果。
藉由这种自动化的评估方式,可以在模型训练的任意阶段,用验证集对模型进行评测。同样,还可用它来帮助挑选模型的超参数。
以网格搜索法为例,假设模型含有A、B两个超参数,A考察三个值(a1,a2,a3),B考察两个值(b1,b2),则穷举后,产生6种超参数组合(a1b1,a1b2,a2b1,a2b2,a3b1,a3b2)。针对每组超参数,训练模型,并记下最低的M值和模型。最后,选取6组中M值最低的模型。
作为评估指标,一条边是否需要手动调整是确定的。操作次数m为:
d表示预测框与真实框的某条对应边的距离。k表示标注员容忍的距离差。
m值是分段的,无法直接作为损失函数的一部分指导模型训练,将其转化为概率的形式。
我们参考sigmoid函数和二分类交叉熵函数,提出如下的损失函数来评估边的预测位置:
其中,k是容忍的(2倍)边距差。β是一个缩放因子,用于控制函数对边距的敏感程度。下图是当k=6,β=90时的样子(用来模拟3个像素的边距差):
当k=6,β=10时:
将m视作操作惩罚,追加到模型训练时的损失函数中,就可以从标注员要求的角度对模型的训练进行管控。
专利价值
在引入了上述方法后,便可自动实现了模型的超参数筛选和权重调整,用以贴合标注人员的评判场景。经实验,该优化方案,在自动驾驶场景中,可使目标检测预标注模型节省高达44.5%的人工标注操作,同时数据质量及标注效率都将得到进一步提升。
倍赛专利解读:数据标注行业目标检测预标注实现技术新突破相关推荐
- LabelStudio + MMDetection 实现目标分割预标注
在 Label Studio ML Backend 提供的预标注模型示例中,只有 mmdetection 这个 目标检测预标注 示例,而没有 目标分割预标注 示例,因此我参考野生的 目标分割预标注 代 ...
- 丰厚奖学金博士招生 | 澳大利亚OPTIMA 招募博士,多光谱时间序列数据的时空目标检测/分割方向...
关注公众号,获取更多AI领域发展机会 OPTIMA 介绍 OPTIMA 是墨尔本大学.蒙纳士大学.三所国际大学和11个行业合作伙伴之间的合作组织.这些合作伙伴属于先进制造业.能源资源和关键基础设施部门 ...
- YOLOv3目标检测图片标注方法--快速入手
文章目录 1. YOLOv3目标检测图片标注方法--快速入手 1.1 常用快捷键操作 1.2 界面操作 1.3 文件夹创建要求 1.4 标记过程示例: 1. YOLOv3目标检测图片标注方法–快速入手 ...
- LCFinder 0.3.0 Beta 发布,图像标注与目标检测工具
LCFinder 0.3.0 Beta 发布了,LC-Finder 是一个支持图像标注和目标检测的图片管理工具,由 C 语言编写,基于 LCUI 和 LCUI.css 开发. 更新日志如下: 添加图像 ...
- 睿智的目标检测12——使用labelimg进行目标检测数据集标注
睿智的目标检测12--使用labelimg进行目标检测数据集标注 学习前言 labelimg的安装 进行批量标注 学习前言 好久没写博文了,先水一水. labelimg的安装 其实安装labelimg ...
- MoCo不适用于目标检测?MSRA提出对象级对比学习的目标检测预训练方法SoCo!性能SOTA!(NeurIPS 2021)...
关注公众号,发现CV技术之美 本文分享 NeurIPS 2021 论文『Aligning Pretraining for Detection via Object-Level Contrastive ...
- 目标检测中特征融合技术(YOLO v4)(上)
目标检测中特征融合技术(YOLO v4)(上) 论文链接:https://arxiv.org/abs/1612.03144 Feature Pyramid Networks for Object De ...
- 基于对比学习的目标检测预训练方法
基于对比学习的目标检测预训练方法 参考链接:目标检测预训练模型(基于对比学习)相关论文梳理 本文主要记录以下几片论文: 1.DenseCL(CVPR21 oral) 2.DetCo(ICCV21) 3 ...
- 雷达原理之动目标检测及测速技术
雷达原理笔记之动目标检测及测速技术 --南京理工大学许志勇老师的<雷达原理课程>浅析 文章目录 雷达原理笔记之动目标检测及测速技术 1.杂波对消处理 1.1任务 1.2一次杂波对消器: 1 ...
- 目标检测中特征融合技术(YOLO v4)(下)
目标检测中特征融合技术(YOLO v4)(下) ASFF:自适应特征融合方式 ASFF来自论文:<Learning Spatial Fusion for Single-Shot Object D ...
最新文章
- mysql大规模读写性能_十招搞定 MySQL 大规模数据库的性能和伸缩性优化
- SharePoint 2010应用开发系列
- 【JFreeChart】JFreeChart—输出组合图表
- php cdi_DI / CDI –基础
- 什么是PermGen泄漏?
- 【Makefile】
- 微型计算机各部件之间通过总线传递各种信息,2015年9月计算机一级考试基础及MSOffice应用选择真题...
- php海外研发,国外主流PHP框架比较
- 【Python】实现输出成绩最高或最低分的学生姓名以及低于平均分的学生姓名
- PHP实现上升沿,可编程控制器(PLC)编程如何使用ST语言实现上升沿和下降沿触发...
- 工业机器人 答案 韩建海_探秘沈阳高科技机器人产业,玩转辽宁科技馆体验感爆棚...
- SpringBoot项目瘦身指南,大厂如何面试看出你的水平
- C 小白的 thrift 环境搭建
- C++的对象,变量初始化
- 浅谈java实现桌面小程序
- 几款实用Chrome插件
- word2vec模型原理及实现词向量训练案例
- 基于蚁群算法的MTSP问题
- 从天问一号拍摄到高清火星影像图说起
- CISC和RISC的优缺点
热门文章
- 08_改善性能措施高阶系统动态性能线性系统的稳定性分析
- POJ-3211 Washing Clothes
- Python Day 8: html 基本知识
- 2021/7/3爬虫第三十二次课(反反爬措施二之突破行为验证,opencv)
- Rider: 创建空Web API Controller
- HVM(硬件辅助虚拟化)技术
- 每天“考”一次科目三,下次还不给我过?
- 28_String类
- Windows下搭建MySQL Master Slave
- 服务器操作系统的安装流程图,服务器操作系统的安装流程图