Introduction

细粒度图像识别 (fine-grained image recognition),即 精细化分类

精细化分类

识别出物体的大类别(比如:计算机、手机、水杯等)较易,但如果进一步去判断更为精细化的物体分类名称,则难度极大。

最大的挑战在于,同一大类别下 不同 子类别 间的 视觉差异 极小。因此,精细化分类 所需的图像分辨率 较高。

目前,精细化分类的方法主要有以下两类:

基于图像重要区域定位的方法:该方法集中探讨如何利用弱监督的信息自动找到图像中有判别力的区域,从而达到精细化分类的目的。

基于图像精细化特征表达的方法:该方法提出使用高维度的图像特征(如:bilinear vector)对图像信息进行高阶编码,以达到准确分类的目的。

RA-CNN

MSRA通过观察发现,对于精细化物体分类问题,其实形态、轮廓特征显得不那么重要,而细节纹理特征则起到了主导作用。

因此提出了 “将判别力区域的定位和精细化特征的学习联合进行优化” 的构想,从而让两者在学习的过程中相互强化,也由此诞生了 “Recurrent Attention Convolutional Neural Network”(RA-CNN,基于递归注意力模型的卷积神经网络)网络结构。

RA-CNN 网络可以更精准地找到图像中有判别力的子区域,然后采用高分辨率、精细化特征描述这些区域,进而大大提高精细化物体分类的精度:

该项工作已经被CVPR 2017接收。


[1] 基于递归注意力模型的卷积神经网络:让精细化物体分类成为现实
[2] RA-CNN

【深度学习】细粒度图像识别 (fine-grained image recognition)相关推荐

  1. [王晓刚]深度学习在图像识别中的研究进展与展望(转发)

    [王晓刚]深度学习在图像识别中的研究进展与展望(转发) (2015-06-04 08:27:56) 转载▼     深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计 ...

  2. 【AI学院】有三AI博士小姐姐带你学深度学习之图像识别下篇,附上篇回顾

    带学营第一期(上)圆满结束回顾 有三 AI 深度学习之图像识别带学营第一期(上)圆满结束,这一期我们主要的培训内容是深度学习基础+项目实战(人脸表情识别和鸟类细粒度识别). 以上的课程可以说是干货满满 ...

  3. 【AI学院】新手如何学CV?老司机带学有三书籍《深度学习之图像识别》,赠书8本...

    为什么以及怎么学计算机视觉? 作为一个普通的程序员,如果能转型成为一个计算机视觉算法工程师,带来的不仅是高薪,还有从劳动密集型工种转化为智力密集型工种带来的"阶级跃迁".因为相对于 ...

  4. 基于深度学习的图像识别进展:百度的若干实践

    来源:<中国计算机学会通讯> 2015年第4期<专题> 作者:都大龙 余轶南 罗 恒 等 概述:深度学习和图像识别 近年来在人工智能领域最受关注的,非深度学习莫属.自2006年 ...

  5. 论题:基于深度学习的图像识别系统

    本文为论题:基于深度学习的图像识别系统 的编写思路. 目录 摘要: 引言 2.深度学习技术及卷积神经网络原理 3.图像识别系统设计 4.实验评估与改进策略 5.改进策略及未来发展趋势 6.结论 摘要: ...

  6. 深度学习细粒度图像研究汇总

    引言 因为之前做过一些细粒度图像的研究,所以对该方向比较敏感,特此将看到的一些文章汇总到这里. 2022-09-15 Fine-Grained Image Analysis with Deep Lea ...

  7. 王晓刚:深度学习在图像识别中的研究进展与展望

    深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域都取得了巨大成功.本文将重点介绍深度学习在物体识别.物体检测.视频分析的最 ...

  8. 基于深度学习的图像识别模型研究综述

    基于深度学习的图像识别模型研究综述 摘要:深度学习是机器学习研究中的一个新的领域,其目的在于训练计算机完成自主学习.判断.决策等人类行为并建立.模拟人脑进行分析学习的神经网络,它模仿人类大脑的机制来解 ...

  9. 深度学习在图像识别中的发展进程与展望

    本文是转载,出自:http://blog.csdn.net/linj_m/article/details/46351053点击打开链接 深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识 ...

  10. 读“基于深度学习的图像识别技术研究综述”有感

    "基于深度学习的图像识别技术研究综述"总结 现在流行的图像识别技术都是基于深度学习的算法,经过前辈们的探索改进,图像识别技术经历很多阶段,现如今图像识别技术已经广泛的应用于生活的方 ...

最新文章

  1. php 开发restful api,用PHP创建RESTful API?
  2. java中源代码的类_java中源代码功能了解
  3. create view必须是批处理中仅有的语句_sqlserver 脚本和批处理指令小结
  4. 权限管理-SpringSecurity介绍
  5. ai钢笔工具怎么描线_骨灰级的AI钢笔工具运用技巧
  6. 富编译器汇总及二次开发Demo
  7. 【Http】PKIX(PKIX path building failed) 问题 unable to find valid certification path to requested target
  8. 【Android】PA4D_CH6 使用Internat资源
  9. 如何进行多云环境中的数据管理?
  10. python 求解二次规划(quadprog)
  11. 年后跳槽高峰期,字节跳动面试题拿走不谢(含答案)
  12. python计算圆锥体积和表面积_圆锥体积公式和表面积
  13. 我奋斗十八年不是为了和你一起喝咖啡
  14. js 去掉浏览器打印默认的页头页尾和打印背景图片
  15. python中timeout什么意思_Python爬虫(五)timeout以及retrying的使用
  16. 如计算机网络如何建立内部网,如何建立局域网【图文教程】
  17. mysql_affect_array_Mysql代理类 支持Master/Slave 读写分离
  18. 信创办公--基于WPS的Word最佳实践系列(目录的插入及更新)
  19. 分享个免费的图文识别orc接口
  20. 服务器主机安装win10系统稳定吗,服务器主机上安装win10

热门文章

  1. Python获取计算机唯一机器码,机器标识(支持虚拟机)
  2. 项目经理压力太大怎么办?
  3. 中国古诗文Python爬虫JJJ
  4. 如何在 Debian11系统上设置静态IP地址 ?
  5. 羊皮卷之四-我是自然界最伟大的奇迹(中英对照)
  6. 安卓手机管理软件_【软件合集】那些安卓系统应用的替代品
  7. html table font-weight,font-weight
  8. 判断能否构成三角形C++
  9. 2.文本预处理(分词,命名实体识别和词性标注,one-hot,word2vec,word embedding,文本数据分析,文本特征处理,文本数据增强)
  10. 手提计算机重启快捷键,笔记本重启快捷键是什么