欢迎关注“

计算机视觉研究院

计算机视觉研究院专栏

作者:Edison_G

近期三星堆正在发掘,大家都在翘首以盼揭开它的真相,这次出土非常多的物品,其中最期待的就是希望能找出三星堆文明和其他文明之间的联系,然后理清楚它的前世今生,当然了,这点很难,不,应该是前所未有的难!今天我们小数据训练来试试三星堆铜面具检测。

长按扫描二维码关注我们

回复“sxd”获取论文下载

由于真实世界数据的固有long-tail分布,Few-shot目标检测是一个迫切而持久的问题。它的性能在很大程度上受到新类数据稀缺的影响。但是,不管数据的可用性如何,新类和基类之间的语义关系是恒定的。

今天分享中,研究者研究了利用这种语义关系和视觉信息,并将显式关系推理引入到新的目标检测的学习中。具体来说,通过从大量文本语料库中学习的语义嵌入来表示每个类概念。检测器被训练成将目标的图像表示投影到这个嵌入空间中。研究者还发现了使用启发式知识图的原始嵌入的问题,并提出用动态关系图来增强嵌入。因此,将Few-shot检测器,称为SRR-FSD,针对新物体的shots是鲁棒和稳定。实验表明,SRR-FSD可以在较高的shots下获得竞争较好结果,更重要的是,在较低的外显和内隐shots下,SRR-FSD的性能显著提高。提出的基准协议与隐式shots从预先训练的分类数据集可以作为一个更现实的设置,为未来的研究打基础。

如果我们事先了解到新类别的“自行车”看起来像“摩托车”,可以与“人”互动,并且可以携带一个“瓶子”,那么学习“自行车”这个概念将比仅仅使用一些图片更容易。当视觉信息难以访问[Xiaolong Wang, Yufei Ye, and Abhinav Gupta. Zero-shot recognition via semantic embeddings and knowledge graphs. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 6857–6866, 2018]时,这种显式的关系推理甚至更为重要。如下图:

Relation Reasoning

语义空间投影学习将视觉空间的概念与语义空间对齐。但它仍然独立地处理每个类,并且在类之间没有知识传播。因此,研究者进一步引入了一个知识图来建模它们的关系。知识图G是一个N×N邻接矩阵,代表每个相邻类对的连接强度。G通过图卷积操作[T.N. Kipf and M. Welling. Semi-supervised classification with graph convolutional network. In International Conference on Learning Representations (ICLR)]参与分类。从数学上看,更新的概率预测如下公式:

heuristic definition of the knowledge graph

在zero-shot或few-shot识别算法中,知识图G是基于启发式的预定义。它通常是从常识知识规则数据库中通过规则路径对子图进行采样,从而使语义相关的类具有很强的连接。例如,来自ImageNet数据集的类具有从WordNet中采样的知识图。然而,FSOD数据集中的类在语义上并不高度相关,也不像ImageNet类那样形成层次结构。研究者发现的唯一适用的启发式方法是基于来自[Zhao-Min Chen, Xiu-Shen Wei, Peng Wang, and Yanwen Guo. Multi-label image recognition with graph convolutional networks. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 5177– 5186]的目标共现。虽然共现的统计量很容易计算,但共现并不一定等同于语义关系。

Network architecture of the relation reasoning module for learning the relation graph

研究者部分实验

FOSD在VOC数据集上的评估结果

FOSD在COCO数据集上的评估结果

基于该框架,利用少量数据对三星堆铜器雕塑家检测,具体如下:

下例是基于Face++的Api测试:(未检出出)

*后期将代码上传于Github

© THE END

我们开创“计算机视觉协会”知识星球一年有余,也得到很多同学的认可,我们定时会推送实践型内容与大家分享,在星球里的同学可以随时提问,随时提需求,我们都会及时给予回复及给出对应的答复。

如果想加入我们“计算机视觉研究院”,请扫二维码加入我们。我们会按照你的需求将你拉入对应的学习群!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

计算机视觉研究院

长按扫描二维码关注我们

回复“sxd”获取论文地址

小样本学习 | 尝试用于三星堆脸型目标检测(附论文框架下载)相关推荐

  1. 提升精度 | 新的小样本学习算法提升物体识别精度(附论文地址)

    计算机视觉研究院专栏 作者:Edison_G 提出一种基于度量学习的小样本学习算法(DeepEMD).之前的基于度量学习的小样本学习算法通常是利用一个特征提取网络将支持集图像和查询集图像映射到一个特征 ...

  2. 目标检测经典论文——R-CNN论文翻译(纯中文版):用于精确物体定位和语义分割的丰富特征层次结构(技术报告(第5版))

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[R-CNN中英文对照版] 用于精确物体定位和语义分割的丰富特征层次结构 技术报告(第5版 ...

  3. CVPR2018论文看点:基于度量学习分类与少镜头目标检测

    CVPR2018论文看点:基于度量学习分类与少镜头目标检测 简介 本文链接地址:https://arxiv.org/pdf/1806.04728.pdf 距离度量学习(DML)已成功地应用于目标分类, ...

  4. 43.6% mAP! 阿里巴巴提出:用于一阶段目标检测的半锚式检测器

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 摘要 标准的一阶段检测器包括两个任务:分类和回归.为特征图中的每个 ...

  5. 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状

    参考   基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状 - 云+社区 - 腾讯云 目录 一.概述 二.通用目标检测方法 1.类不平衡问题 2.复杂背景 3.目标的尺度变化 4.特殊视角 5 ...

  6. DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《我要打篮球》视频段进行实时目标检测

    DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对<我要打篮球>视频段进行实时目标检测 目录 输出结果 设计思路 核心代码 相关文章 成功解决AttributeError ...

  7. DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《俄罗斯总统普京对沙特王储摊的“友好摊手”瞬间—东道主俄罗斯5-0完胜沙特》视频段实时检测

    DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对<俄罗斯总统普京对沙特王储摊的"友好摊手"瞬间-东道主俄罗斯5-0完胜沙特>视频段实时检测 导读   ...

  8. 深度学习笔记(34) 目标检测

    深度学习笔记(34) 目标检测 1. 目标检测算法 2. 图像滑动窗口操作 3. 滑动窗口目标检测算法缺点 1. 目标检测算法 了解对象定位和特征点检测,现在来构建一个目标检测算法 通过卷积网络进行对 ...

  9. 目标检测YOLO实战应用案例100讲-基于深度学习的水下图像增强及目标检测算法研究与应用

    目录 基于迁移学习的水下图像增强与目标检测研究 基础知识 2.1  迁移学习

最新文章

  1. 网络编程学习笔记(recvfrom很奇怪的一个地方)
  2. 改善程序代码质量的一些技巧
  3. CHROME开发者工具的小技巧
  4. [CXF REST标准实战系列] 一、JAXB xml与javaBean的转换(转)
  5. C# 之 获取文件名及拓展名
  6. 图片模糊化处理_10个JavaScript图像处理库,收藏好留备用
  7. Qt QString to char*
  8. 计算机打字过程中,关于电脑打字过程中的疑问?
  9. Gradle的使用教程
  10. python---plot函数对应的颜色参数
  11. JAVA流浪猫狗救助平台
  12. Word控件Spire.Doc 【页面背景】教程(8) ;在 C# 中将文本水印和图像水印添加到 Word 文档
  13. 移动端APP设计规范
  14. 连接MySQL实现增删改查的动态网页
  15. msrcr(Multi-Scale Retinex with Color Restoration) 带色彩恢复的多尺度视网膜增强算法 整理
  16. Mac苹果电脑思维导图Xmind 2022中文
  17. Surface实现TF卡槽引导Ventoy加载Fydeos,不格式化硬盘,不重装Windows!
  18. 对项目软件产品化的思考
  19. 拓嘉辰丰:怎样把买家秀做好促进转化
  20. lr0文法分析表示例_LR0分析表

热门文章

  1. TCP的ACK机制学习日志
  2. hanlp词性对照表
  3. halcon多条线合并为一条问题
  4. iphone 密码输入错误_如何使用iPhone在Apple TV上输入密码
  5. 基于深度学习的目标检测DET - SSD
  6. 能否将上述几点方法举例并进行内容润色?
  7. py魔法方法(__new__/metaclass元类、__init__、__getattr__、__callable__等)
  8. 股票数据接口l2有哪些过人之处?
  9. 黑马C++基础 p84-p90
  10. 结构型设计模式(五) 之 享元模式是池技术的表现