自动图像标注总述:

是图像语义理解的热点,是 无标注图像内容的语义关键词
属于图像检索领域,是图像 语义检索(相当成熟 )关键
涉及计算机视觉,机器学习,信息检索
总实现思路:用(已标注图像集)或 关联,映射关系(可获信息 自动学习语义空间 与 视觉特征空间)。预测未知图像标注。

现实现方法:

基于分类的标注,概率关联标注,图学习的标注

相关的领域:

基于内容的 图像检索,瓶颈,巨大挑战(语义鸿沟:低层视觉特征,颜色 纹理形状 ,不能完全匹配 用户查询信息)
基于语义的 图像检索,仍旧是 难题

应用:

网络搜索引擎:用户喜好关键词查询,互联网搜索引擎基于 文本的图像检索,人工标注费时费力
个人桌面照片管理,互联网广告自动投放


题目:自动图像标注技术 研究进展

搜索源:知网
关键词:自动图像标注; 多示例学习; 多标记学习; 图学习; 概率建模;

摘要

自动图像标注(AIA):是图像语义理解的热点,是无标注图像内容的语义关键词
思想:用(已标注图像集)或 关联,映射关系(可获信息 自动学习语义空间 与 视觉特征空间)。预测未知图像标注。
现实现的方法:基于分类的标注,概率关联标注,图学习的标注
基于全局特征,基于区域划分

0     引言

基于内容的 图像检索,瓶颈,巨大挑战(语义鸿沟:低层视觉特征,颜色 纹理形状 ,不能完全匹配 用户查询信息)
基于语义的 图像检索,仍旧是 难题
为什么 出现了 AIA:用户喜好关键词查询,互联网搜索引擎基于 文本的图像检索,人工标注费时费力
AIA:解决 语义鸿沟(高层语义,底层特征 间 联系)
现有算法:在图像级别实现关键词标注, 未建立一一对应关系(图像和关键词 之间),
标准方法:标注,区域命名
不同角度分析标注:
图像特征表示机制:图像全局视觉信息 ,基于区域划分

  1. 图像全局视觉信息:面向图像场景 语义,图像特征,文本标注词完全分离,纯视觉比较图像相似性,有监督
    已经标注 图像(图像特征,标注词间关系),标注(比较视觉特征,传播标注词)
  2. 图像划分若干同 质区域,图像子块。基于区域划分(主流),图像语义标注。图像分割算法,有效划分语义对象单元。

本文 :

基于全局特征,基于区域划分(根据特征提取,表示机制 的不同)
其中,基于区域划分:分类的标注算法 ,概率关联模型的标注方法,基于图学习的标注方法(学习算法 不同 )

1     基于全局特征的自动图像标注方法

早期:相当于图像场景的自动分类

ova:面向 图像 场景语义(图像空间属性,产生现实场景有意义描述,验证 全局统计特征, 分析场景的对象存在与否),免去(图像分割)
面向显著兴趣点:显著区域的 局部描述 子向量空间,通过相似图像传播语义实现自动标注
Yav sk:单纯用(图像全局特征)语义标注,建模框架(鲁棒的非参数密度估计法),核平滑技术–>用全局的 颜色信息可以标注性能。分割方法硬划分

优点:

免除过程(图像区域分割,区域聚类,三维注释,面向对象分析)
适用:简单图形,背景单一(纹理图形,自然场景,建筑物图像)
特点:只提供粗粒度语义描述,无前景物体和背景差异(人注重有语义信息的特定目标,非背景)

缺点:

因为粗粒度,不能反映丰富的细节语义内容,标注性能不理想

希望改进:

将图像前景目标区域,从背景中分割,想要对象级语义描述,减少背景变化的影响,更接近语义检索目标
提取区域级的低层视觉特征,比全局特征更贴近实际理解,出现了基于区域划分的图像标准

2     基于区域划分的自动图像标注方法

基于区域划分:分割图像成若干区域(图像分割算法) --> 提取每个区域的低层视觉特征 --> 建立关联(图像区域和 标注词间,区域分块的标注算法不同:基于分类图像标注,概率关联模型的图像标注,基于图学习 )

2.1   基于分类的自动图像标注算法

标注问题看成图像语义分类问题(每个语义关键词–看成–类别标记,图像标注问题 --转化–图像分类问题 ):从图像分类角度解决标注问题。
传统图像分类:每幅图像 只属于某个语义类别
自动图像标注:

关键词角度 :每幅图像可同时属于多个语义类别(标注有多个关键词),标注问题是多标记学习问题
图像角度:整幅图看成多个 示例(区域)组成 的包,示例(没有概念标记),包(有概念标记),正包(包中正例>=1),反包(包中正例=0),给定的训练集上关键词只标注在整幅图像,未知对应关系(关键词和图像区域之间)

目前:分类标注(从示例学习的角度,或多标记学习 角度)标注 问题
相同点:利用(已知的标注数据)建立模型,描绘 关联或映射 关系(文本词汇 图像特征间)

2.2   基于概率关联模型的自动图像标注算法
2.3   基于图学习的自动图像标注算法
3     总结

论文梳理(图像标注)相关推荐

  1. 论文笔记--基于 FCM 聚类的跨模态人物图像标注方法-2015

    期刊论文-基于 FCM 聚类的跨模态人物图像标注方法-2015-微型电脑应用-赵昀,张翌翀 文末附人脸标注相关论文下载地址 文章目录 摘要 技术 人脸检测与特征表示(与2012年吴伟硕士论文<跨 ...

  2. 华人一作统一「视觉-语言」理解与生成:一键生成图像标注,完成视觉问答,Demo可玩...

    来源:机器学习研究组订阅 这个 BLIP 模型可以「看图说话」,提取图像的主要内容,不仅如此,它还能回答你提出的关于图像的问题. 视觉 - 语言预训练 (Vision-Language Pre-tra ...

  3. 横向比较图像标注中的两种基于近邻思想的方法 TagProp和SGSSL

    利用近邻传递标签的思想进行图像标注在近几年的图像标注工作中取得了很好的效果,甚至有点难以超越的感觉了.其中最具有代表性的是09年ICCV上的 <TagProp:Discriminative Me ...

  4. ACL/NAACL‘22 推荐系统论文梳理

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  5. 【图像标注】NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing

    因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具.  .  . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...

  6. 计算机视觉中的图像标注工具总结

    本文来自公众号CV技术指南资源分享系列 创建高质量的数据集是任何机器学习项目的关键部分.在实践中,这通常比实际训练和超参数优化花费的时间更长.因此,选择合适的标注工具至关重要.在这里,我们总结了一些用 ...

  7. 资源 | 深度学习图像标注工具汇总

    作者 | chaibubble 来源 | CSDN 网站 对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限.世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务.但是数据 ...

  8. Curve-GCN图像标注

    Curve-GCN是一种高效交互式图像标注方法,其性能优于Polygon-RNN++.在自动模式下运行时间为29.3ms,在交互模式下运行时间为2.6ms,比Polygon-RNN ++分别快10倍和 ...

  9. 图像分割 | FCN数据集制作的全流程(图像标注)

    图像分割 | FCN数据集制作的全流程(图像标注) 一 全卷积神经网络 文章所有代码已上传至github,觉得好用就给个star吧,谢谢 https://github.com/315386775/FC ...

最新文章

  1. SAP QM初阶之事务代码QS28
  2. 内核同步机制——自旋锁
  3. pdf屏幕取词 android,===C#屏幕取词Demo热键版鼠标划词版【含语音版】【附源码】===...
  4. 图数据库之Pregel
  5. [转]Python 字符串操作实现代码(截取/替换/查找/分割)
  6. “dedeCMS 提示信息!”跳转页,如何修改文字?
  7. pythondifflib详解_python difflib模块示例讲解
  8. Spring Cloud随记----分布式配置中心再探---消息总线的引入
  9. 安卓从入门到进阶推荐学习方法与书籍整理(pdf)
  10. 网络带宽的检测工具介绍
  11. 【HTML5】------- JavaScript 实现网页版HTML5发送语音功能
  12. post_thumbnail_html,使用WordPress函数the_post_thumbnail_url()获取特色图片缩略图URL
  13. 将两个有相连关系的数据表进行归类
  14. 【信号处理】脑机接口P300信号处理(MATLAB实现)
  15. Android8.1 MTK平台 修改蓝牙默认名称
  16. Vue+TS+子组件回调父组件的方法
  17. #第六章 曲率二维表达的拟合应用 ​一、四维时空曲率的二维几何表达
  18. Bzoj4826 [Hnoi2017]影魔
  19. Android 创建以太坊钱包
  20. python脚本自动化盲注_python dvwa布尔盲注自动化脚本(level=low)

热门文章

  1. 奥斯特电流的磁效应及其实验
  2. 选择软件测试会不会后悔??
  3. spring cloud实践
  4. 运算放大器设计常见问题
  5. Hardhat工具包3--多条链网络配置、部署
  6. 阿里巴巴张勇:继续在全球舞台上提升技术先进性
  7. 何以从IT时代到DT时代?
  8. DT时代,企业要有“经营安全、安全经营”新思维
  9. K12在线教育小班模式带动行业新动向
  10. 兰顿蚂蚁 蓝桥 模拟