磨染的初心——计算机视觉的现状(3.2):纹理与材质

在前文中提到的分割算法中,基于区域的方法和基于图割的方法都利用了基于纹理的相似性度量方法。另外,除了基于卷积神经网络的算法之外,目前所有的分割算法都存在严重的过分割,区域合并将是不得不采纳的选择。对于区域合并来说,纹理相似性是一种非常重要的相似性度量方法。那么纹理是什么呢?到目前为止,这个问题并没有被广泛认同的答案,甚至已经鲜有人继续关注了。但是基于我们的第一个感觉可以很容易的给出一个答案,纹理是反应空间上同质性的视觉特征,它体现了物体表面的具有缓慢变化或者周期性重复的视觉要素的组织排列属性。这个答案包含了纹理描述的线索——缓慢变化或者周期性重复,然而除了缓慢变化或者周期性重复这个两个特征本身的描述之困难外,组成纹理的视觉要素是什么也没有明确的答案,不同算法对其做出了不同的假设。目前纹理描述与分析算法归纳起来可以分为五类——结构分析方法、统计方法、特征描述法、模型拟合法、信号处理法。

在介绍这些纹理描述和分析方法之前,先来观察一些纹理图像。左上角的两幅纹理图像是严格符合周期性重复这一直觉的,至于其他纹理图像,如果仔细比对一下人类能够提取出来的组成纹理的视觉要素,将会发现没有任何两个视觉要素是一模一样的。如果观察到了由一模一样的视觉要素组成的纹理图案,人类只要一眼就能强烈地感受出来,这一定是人造物,一定是机械制造的。如果因而就将纹理的特点总结为“整体表现出规律性,局部表现出随机性”是没有任何意义的,还应该追根究底地继续问一问。我们确实感受到了“缓慢变化和周期性重复”这两个规律性,这到底是什么原因呢?回到上面的纹理图像,稍作思考可以给出一个初步的回答——视觉要素的大小、间距、方向、形状在统计上反应出来了趋同性

在上面的叙述中,一直在使用“视觉要素”一词,那么组成纹理的视觉要素到底是什么?相信所有考虑过纹理问题的研究者都会感觉到这个问题的答案就在脑子里萦绕,就在嘴边。然而有些人自信满满地认为这样就算是解答了,有些人却焦虑地发现近在眼前的答案就是抓不住,我就是其中一个抓不住的。但是关于如何回答这个问题,有一个模糊的思路——搜集很多纹理,让很多人来描述,然后分析人类对纹理的描述。例如,“按行排列的方砖,行之间有交错,方砖之间的间距均等”,“紧密排列的细杆,两排细杆相互交叠”,“镶嵌铺陈的碎石板,石板有大有小,边缘略平直”,“表面稍有起伏,无尖锐突起的石板”,“平整多坑的红砖面”,“坑坑洼洼的泥土裹挟碎石的土墙”,“表面平整,有纵横交错长短不一的平直划痕”,“在一个方向上相互压叠的鳞片状蛇腹皮”,“布满长短不一平直或弧形浅细沟槽的皮革”,“挤压粘连在一起的碎木片形成的平板”,“一环套一环的圈纹,还有放射状裂缝”,“纵向延展的细裂纹树皮”,“纵向延展的粗裂纹树皮”,“一端尖、一端宽的狭长条带,宽端集束,尖端发散,草皮”,“丝状交错盘绕的草皮,散布了一些落叶”……

这一系列关于纹理的语言描述仿佛让纹理描述和分析变得更难了,其中提到的视觉要素,如方砖、细杆、石板、尖锐凸起、坑、划痕、鳞片、裂痕、条带,竟然是需要识别的目标!甚至还需要用到三维感知的结果! 但是又有什么别的办法呢?!这总算是让组成纹理的视觉要素变得具体一些了。直接对纹理的描述是如此艰难,或许应该跳出来,看看纹理之间有那些显然的区别。从上面的纹理图案中可以看出,组成纹理的视觉要素有的大,有的小,有的规整,有的复杂,有的排布整齐,有的排布错乱,有的狭长,有的短粗……这些区别对于斑块状纹理的区分是很有意义的,对于丝状、网状、脉状纹理(上图的划痕纹理)彷佛并没有太大的价值。斑块状纹理易于分割出组成纹理的视觉要素,而组成丝状、网状、脉状纹理的视觉要素则难以分割出来,他们只是图上细小的前景,分割后易于混入背景。那么是否需要开发用于分割丝状、网状、脉状纹理图的分割算法呢

带着这些关于纹理的思考,开始纹理描述与分析算法的介绍吧。当然,不会深入到细节,因为他们都不好使。另外关于纹理分析和描述方法的分类是依据方法所基于的假设而不是具体的算法,如,属于结构分析方法的具体算法也会用到统计、滤波等手段。

结构分析方法假设纹理是由纹理基元(即组成纹理的视觉要素的一种)按某种规则排列形成的,这类方法的两个核心要点在于基元建模和排列建模,但是并没有广泛使用的好方法出现。此外结构方法只适合于描述和分析规则的纹理

统计方法认为纹理可以通过像元值的空间分布来描述,这里涉及到两个不同维度——像元值维度和空间维度。值得注意的是,这两个维度相对于一般意义上多维向量有很大的区别——量纲不同,且量纲具有至关重要的作用,各自又可以有多个维度(二维平面,三维空间,以及RGB波段)。一般为了兼顾两者,都会采用加窗的方式进行统计,又带来了需要设置窗口宽度这个超参数的问题。实践发现,很多不同的纹理在多种统计值上是相同的。统计方法中较为常用的是灰度共生矩阵(GLCM),知道其原理的人都会承认这个算法对纹理的描述实际上是挂一漏万的,仅从方向和步长两方面来说,要完全描述纹理将会需要无法忍受的计算量和数据量。

特征描述方法认为图像局部的灰度变化表现出一定的特征,将局部特征用某种特征提取手段提取出来,获取与图像对应的特征图像。局部二值模式(LBP)应该是该模式的早期代表,当前大火的CNN也应该归于此类。在《纹理图像分析》一书中将纹理描述和分析方法归为了4类,LBP归于模型方法中。在论文《图像纹理特征提取方法综述》中将纹理描述和分析方法同样归为4类,LBP归于统计方法中。笔者认为将LBP归于这两类都是不合适的,LBP更类似于通过经验和观察总结出来的类似于HAAR、HOG的特征提取算子。一个特征提取算子能提取某一方面的特征,通常需要大量的特征描述算子才能对纹理进行有效的描述。到目前为止,到底有多少可用的特征提取算子呢?

模型拟合法认为图像上的灰度值是一个以二维图像坐标为自变量之一灰度值为因变量的参数化模型,从而将纹理特征提取归结为参数估计问题, 如何采用各种优化参数估计的方法进行参数估计是模型家族研究的主要内容。显然可以预见该类算法必然计算量大,效果也定然不如人意。图像内容千差万别,简单模型必然难以有效表达,复杂模型更加难以求解

信息号处理方法的主要依据是纹理的周期性特点,将图像视作承载信号的波函数,从而从信息滤波器设计的角度对纹理进行描述和分析。较为常用的是小波分解,人工设计不同的小波核对图像进行滤波,提取出符合不同小波结构的分量。然而通过对上面纹理图像的观察可以发现,很多自然纹理并不严格具有周期性,周期性更多的体现在组成纹理的视觉要素的抽象概念层面和统计层面。另外一个问题就是噪声干扰严重

除了纹理的描述和分析之外,还需要注意到的是,纹理和材质是有对应关系的。而材质则对应了一些物理属性——硬度、弹性、质量、可塑性,说明了材料潜在的功用。在纹理描述和分析的基础上,是否有必要开展材质识别的研究?笔者认为是很有必要的。纹理的描述和分析首先是有利于图像分割,其次对于目标识别也有很大的促进作用。

转载于:https://www.cnblogs.com/tgis/p/11350175.html

磨染的初心——计算机视觉的现状(3.2):纹理与材质相关推荐

  1. 2020年计算机视觉市场现状与竞争格局分析,集成化、小型化的产品将会成为主要发展方向之一「图」

    一.计算机视觉行业发展历程 计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取.处理.理解和分析图像以及图像序列的能力.利用摄像机(眼睛)等视觉传感装置代替人眼对物体进行识别.跟踪 ...

  2. CVPR 2022大会主席、港科大教授权龙:计算机视觉的现状与未来

    来源:AI科技评论 本文约5200字,建议10+分钟. 权龙教授发表了题为<三维视觉重新定义人工智能安防>的演讲. 近日,由雷锋网主办的第二届中国人工智能安防峰会在杭州召开. 峰会现场,香 ...

  3. 从CVPR 2021的论文看计算机视觉的现状

    作者丨Georgian 来源丨DeepHub IMBA 编辑丨极市平台 导读 本文根据今年的CVPR录用结果总结出了一些CV领域相关的发展现状. 计算机视觉(Computer Vision, CV)是 ...

  4. 钛磨产品行业调研报告 - 市场现状分析与发展前景预测

    [出版商]贝哲斯咨询 [免费目录下载]钛是一种化学元素,符号为Ti,原子序数为22.是一种有光泽的过渡金属,呈银色,密度低,强度高.钛磨产品具有高熔点.低比重.高比强度.韧性好.抗疲劳.耐腐蚀.导热系 ...

  5. 山世光:计算机视觉技术现状展望和产业化

    首先,我们说计算机视觉是什么样的学科,要做什么的事情? 很多人不了解这件事为什么那么难?如果看一下我们需要处理的对象,就会发现它确实是非常难的任务. 我们所谓的图像是用摄像头来捕捉物体表面反射的不同颜 ...

  6. it生活的第一年总结

    千般荒凉,以此为梦.万里蹀躞,以此为归. 去年的这个时候,选完了专业,选完了学校,心里其实大概有了底,以后走的就是程序员的路 迷迷糊糊的买了两本c语言的书,自顾自的看起来,对于未来一片模糊,对于编程一 ...

  7. 2.11 计算机视觉现状-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.10 数据扩充 回到目录 2.12 总结 计算机视觉现状 (The State of Computer Vision) 深度学习已经成功地应用于计算机视觉.自然语言处理. ...

  8. 计算机视觉--CV技术指南文章汇总

    前言  本文汇总了过去本公众号原创的.国外博客翻译的.从其它公众号转载的.从知乎转载的等一些比较重要的文章,并按照论文分享.技术总结三个方面进行了一个简单分类.点击每篇文章标题可阅读详细内容 欢迎关注 ...

  9. 2022年全球及中国面粉加工机械行业竞争现状与发展前景规模分析报告

    2022年全球及中国面粉加工机械行业竞争现状与发展前景规模分析报告 --------------------------------------- <修订日期>:2021年12月 < ...

最新文章

  1. python subprocess_python subprocess
  2. IE和火狐都支持的方法(输入用户名和密码后按下 enter 键)
  3. 删除docker-register的镜像 none无效镜像讲解
  4. [JS]格式化Date和分析格式化Date字符串的JS代码
  5. Oracle11gR2 数据库客户端PL/SQL中文乱码的问题
  6. Java8之lambda表达式的总结
  7. php解析html类库simple_html_dom
  8. jvm系列(九):如何优化Java GC
  9. 计算机可以按用户观点分吗,2016-2017杭州师范大学操作系统期末考试选择题
  10. 获取指定域名的IP地址
  11. [Linux] 常用Linux命令
  12. 使用linux服务器实现路由器的功能(实验)
  13. Android计算器输入错误纠正,Android计算器低级错误?都是二进制惹的祸!
  14. 中国地质大学英语语音学习笔记(二):辅音(辅音,与清辅音浊化)
  15. 一道九宫格算法面试题
  16. 继被Twitter永久封杀后!Sci-Hub再遭英国网络运营商封禁!
  17. String Shifting- 今日头条校招2016-09-28在线编程题
  18. Ubuntu16.0.4 安装rebar3指南
  19. JMS(Java Messaging Service)基础
  20. cuteftp连接ubuntu虚拟机

热门文章

  1. 同样是E6同样是摩托罗拉,06年上市与19年上市,差距到底有多大
  2. 我崩溃了!大连java培训机构哪家好
  3. 最新期货交易时间一览表(日盘+夜盘)2017年3月更新
  4. 用ChatGPT生成Excel公式,太方便了!
  5. LBS邵永强:GPS是怎么知道你在哪的?
  6. MYSQL——内置函数
  7. Word2003的另类超级BT玩法(转)
  8. untiy 鼠标输入判断不灵敏(不准确)
  9. server 2003蓝屏代码0X0000007B解决
  10. GitHub 上只卖 5 美元的脚本,却给我带来了一年数十万元报酬