原文地址:图像分割之静态背景分割综述 作者:pursuiting

静态背景分割方法的比较

摘要: 在静态或运动补偿的照相机中,静态背景分割方法能应用于从背景分割出有意义的前景物体。尽管提出了许多方法,但通用的评价是不可行的(a general assessment of the state of the art is not available)。一个重要问题是以质量(精度)和计算复杂度(时间和内存占用)来比较各种现有的方法。选择最近技术中具有代表性的方法来应用和相互比较。一个巨大的视频集用于完成所有的结果,室内和户外视频都具有不同的环境条件。把视觉分析用于质量的主观评价,把基于像素级的可用地面真实数据用于客观评价。而且计算复杂度是通过计算每个算法的消耗时间和内存需求来估计的。本文评价了各种技术的优缺点;而且,这对在这个领域里为特殊环境和方向的深入研究选择一个优化的方法具有很好的指导意义。

1.      介绍

将移动对象分割的视频分割引起了图像和视频处理领域里许多研究者的关注,因为它在许多应用中起着非常重要的作用,比如监督系统、交通监控、基于对象的压缩。尽管视频分割被研究了几十年,但它对计算机自动地和精确地从视频序列中分割出移动对象仍然是困难的。这个所谓的时空分割结合了空域方法(基于图像分割)和时域方法(视觉流、图像差分)。这个技术的选择极大地依靠于环境条件和应用。

在一些情况下(静态相机或运动补偿照相机),假定背景是固定不动的,变化是由前景对象单一引起的。这种假设会产生出特殊情况下的静态背景分割方法,即利用基于背景和实际帧差分方法来获取有意义的前景物体。

尽管许多算法是针对特殊领域,当前已有方法是综合评价还是不可行。这主要是由不同应用要求和使用环境特征所造成的。既然把分割作为以后分析的初步处理,就需要对不同方法作一个客观的比较,来为特定环境挑选出最合适的方法。因此,我们的任务就是以分割质量(所获对象模型的精度)和分割复杂度(时间和内存消耗)来比较目前已有的方法。

2.      现状

⑴ 图像差分(Image Differencing 1982)

简单的图像差分是第一种方法,结果仅仅依赖于阈值的选取,这在不同的算法,比如OTSU, PUN等中使用过。

⑵ Haritaoglu (1998)

Haritaoglu是所有研究方法中的一种,它只用于灰度的信息。首先,用一定数量的帧生成一个背景模型,这里每个像素用三个值来描述。这三个值是:最小亮度(M: Minimal intensity)、最大亮度(N:Maximal intensity)、两个连续帧的最大差分值。用当前图像和M图像与N图像计算差分图像。这些结果用来分类,如果差分值大于最大帧内差分值,就赋予前景图像像素。在二值化后,需要采用一些后加工步骤来消除噪声。而且,为了考虑瞬时的环境变化,已分出的背景图像用来更新背景模板。

⑶ Francois (1999)

Francois假设在背景中只有非常慢的全局变化能被获得,以后每个像素的颜色值在RGB空间中建立一个范围群(sphere cluster)。出于这样的假设,背景模板成为一个由对每个像素的均值与标准方差产生的高斯分布。在Francois系统中,HSV颜色空间替换了RGB空间,均值模板与每个像素的差分值相减得到的当前图像给出了与标准方差模型一致的前景或背景的分类信息。而且,也给出了一个背景模板的更新。

⑷ Horprasert (1999)

Horprasert假设在RGB空间通过生成一个新颜色模型使得亮度和色度不得不分离。所以,这里就有一条期望的染色线(chromaticity),这里的像素值应该保留。期望的染色线通过在一些背景图像中计算每个像素RGB值的算术平均值来获得。由这条线产生的失真是有标准方差产生的色度和亮度失真。针对这些失真,设置一些阈值来分类下面这些类型的像素:前景、背景、阴影和高亮背景。通过这个,一幅输入图像能被分成这些里面的一种。

⑸ Mckenna (2000)

与Francois假设类似,Mckenna也用均值和标准方差来对背景建模。然而,这个系统考虑到归一化rgb颜色空间和边缘。对每个通道生成模型,分别来计算颜色模型和边缘模型。共同的问题是,当前图像从边缘图像和rgb图像转化成一个合适的,边缘图像与rgb图像分别用于以后的分类。至少两个分类结果的结合给出最终的分割任务。

⑹ Jabri (2000)

Jabri系统用到类似于Mckenna中的颜色和边缘信息。通过计算每个颜色通道的每个像素的均值和标准方差,在前面两者中训练背景模板,随着每个通道的输入当前图像的减少,具有颜色和边缘信息的置信图(confidence map)会被生成。在这之后,通过取最大值来利用两个图的交点,至少这个结果是全局阈值二值化的结果。

⑺ Cavallaro (2001)

对使用的YCbCr颜色空间的每个通道,对图像与背景和当前图像进行差分。对每个初始结果,使用Sobel算子进行边缘检测。然后所有子结果融合到一起,在这里仍然会有检测的边缘不是一个封闭的整个轮廓这样的问题。因此,需要后加工步骤,比如形态学操作,来得到最后的结果。

⑻ Hong (2003)

Hong也是对背景建模,但这次采用了众所周知的RGB和归一化rgb两种颜色。正如先前方法提出的一样,再次使用均值和标准方差,要对每种颜色元素计算。每个颜色空间有自己的分类部分,在这里当前图像被首次在每个颜色空间中转化。在每个颜色空间中,像素被分成四类。Hong是仅有的一个把像素分成多于两类的方法。

⑼ Shen (2004)

Shen使用众所周知的RGB颜色空间,该系统能被表示成两部分。一部分是模糊分类生成的块,另一部分是错误检测分割区域而被消除的块。

采用模型分类是考虑到像素精确地移动,而不是所谓的二进制分类。因此,在模糊块中,对每个RGB颜色空间元素生成一个差分图像。对每个通道结果,对考虑到的移动像素模糊集采用单峰分布阈值化方法来得出一个对应的阈值,然后这些阈值有利于生成模糊图像,这些图像至少是由一个最终模糊图像结合而成的。随后,通过阈值化来得到一个初始模型,它描述了所有检测到的移动像素。

为了克服亮度变化问题,虽然还没有一个瞬间适应的更新背景,将时域信息和上面提到的模糊颜色分类结合被提出来。时域信息通过对连续帧之间的图像差分和最后的模型进行OR操作来获得,输出与模糊分类块的初始模型结合起来。

3.      实验

①      分割质量(Segmentation quality)

客观质量:为了对分割质量作一个客观评价,使用了ground truth based measures。尽管存在一些感知测量,我们仅仅使用了基于像素的方法。当真的正值产生一定数量的正确检测出的前景像素时,真的负值也产生一定数量的正确识别的背景像素。与此相反,假的负值是那些被错误地标识为背景的像素,而假的正值是被错误地检测出的前景。

Ground-truth

Positive

Negative

Segmentation

Positive

TP

FP

TP+FP

Negative

FN

TN

FN+TN

TD+FN

FP+FN

真的正值率(TPR)定义为: TPR=TP/(TP+FN)

真的负值率(TNR)定义为: TNR=TN/(TN+FP)

假的正值率(FPR)定义为: FPR=FP/(FP+TN)

假的负值率(FNR)定义为: FNR=FN/(TP+FN)

当把上述的方法用于任意一种类型的分类时,传统方法的两类问题是:R是正确检测出的像素的个数与在ground truth数据中的相关像素个数之间的比值,定义为:

R=TP/(TP+FP)

精度P是正确检测出的像素的个数与整个像素个数之间的比值,定义为:

F=2*P*R/(P+R)

主观质量:既然客观质量方法不是很老练,通过人们观察的主观质量评价就是不可避免的。它允许深入分析不同分割方法的错误。

总结:首先,必须知道在不同视频中,客观质量评价与主观质量评价差别是很大的,这个差别也取决于采用的方法。一些方法具有较少的限制,因此比其他方法具有较高的稳定性。

精度用来分析一种算法过分割的趋势。精度越高,过分割的可能性越小。另一方面,the recall用于估计欠分割(undersegmentation)的趋向,recall越高,欠分割的可能性越小。主观质量评价支持客观质量评价方法的结果。另一方面,图像差分方法显示出与欠分割相对应的高PN值。

②      计算复杂性

除了分割质量外,一种分割方法的计算复杂度是另一个重要的标准。这在那些给定帧率必须达到或采用特别低的硬件时的实时应用中特别地真实。

计算机复杂性可分为两部分:时间和内存消耗。在某种程度下两者是可互换的。使用复杂的数据结构增加了更高内存需求的速度。另一方面,通过使用通常影响速度的精细的数据获取函数来减少内存需求。时间消耗是通过测量分割一帧所有的时间来定义的。内存消耗是以用于一个背景模板的内存大小来定义的。假设所有值是以32bit存储的。当然,可以通过把浮点数近似为整数来降低内存的使用大小,但是这也可能导致在性能上的降质。

4.      总结

主要阐述了静态背景现有的分割方法,而且以使用方法、分割质量和计算复杂度对它们进行了相互比较。完全的调查支持多个结论,会考虑到信息、背景模型、分类和使用的策略。对把前景物体从背景中分割出来,颜色是一个很有力的线索,灰度信息对要求严格的检测是不够的。就颜色空间而言,亮度和色度信息的分离能提供第阴影的鲁棒性。单独的边缘信息缺少鲁棒性是因为错误地检测出的边缘,但如果与颜色信息结合起来能提高性能。一般来说,把补充的信息(颜色、边缘、运动)结合起来会产生更好的效果。统计背景模型比简单的均值背景模型更好,因为它们也把由摄像机噪声产生的背景变化量建立模型。具有多类的复杂分类器和模糊分类,比只有两类的简单分类器和以牺牲计算复杂度的阈值化,会产生较高的性能。而且,可以推断分割性能在很大程度上取决于有用信息、背景模型、分类和结合策略的理想组合。特别地,对实时应用方面,记住分割性能不仅决定于有许多特征、非常复杂的模型和分类器,而且还决定于不同步骤的优化组合是非常重要的。

在严格条件下(由特殊应用产生的),大多数方法都能运用地很好,但它们在阴影、ghost效果、highlights、reflection、illumination变化、dark环境和前景对象与背景相似的情况下缺少鲁棒性。尽管在分析方法中一些效果是直接的或间接的,但仍需要更多的研究来开发一个鲁棒性强的分割系统。一种方法是对背景使用更复杂的模型来抑制噪声。上面提到的问题应该分别对待,那些导致多类分类的问题,应把多高补充的特征和算法结合起来提高鲁棒性。非常有希望的是,通过先前的检测结果或把分割与检测步骤和跟踪步骤结合起来考虑时域信息。另一个可能性是把轮廓跟踪方法,比如蛇形法结合起来提高精度。

图像分割之静态背景分割综述相关推荐

  1. Python+OpenCV利用KNN背景分割器进行静态场景行人检测与轨迹跟踪

    前言 视频图像中的目标检测与跟踪,是计算机视觉的基础课题,同时具有广泛的应用价值.视觉目标(单目标)跟踪任务就是在给定某视频序列初始帧的目标大小与位置的情况下,预测后续帧中该目标的大小与位置.本篇文章 ...

  2. 史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[分割]术交流群 后台回复[分割综述]获取语义分割.实例分割.全景分割.弱监督分割等超全 ...

  3. 深度学习应用篇-计算机视觉-语义分割综述[5]:FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等

    [深度学习入门到进阶]必看系列,含激活函数.优化策略.损失函数.模型调优.归一化算法.卷积模型.序列模型.预训练模型.对抗神经网络等 专栏详细介绍:[深度学习入门到进阶]必看系列,含激活函数.优化策略 ...

  4. 笔记:基于DCNN的图像语义分割综述

    写在前面:一篇魏云超博士的综述论文,完整题目为<基于DCNN的图像语义分割综述>,在这里选择性摘抄和理解,以加深自己印象,同时达到对近年来图像语义分割历史学习和了解的目的,博古才能通今!感 ...

  5. mask rcnn算法分析_实例分割综述(单阶段/两阶段/实时分割算法汇总)

    作者:Danny明泽 来源:公众号@3D视觉工坊 链接:实例分割综述(单阶段/两阶段/实时分割算法汇总) 简介 目标检测或定位是数字图像从粗到细的一个渐进过程.它不仅提供了图像对象的类,还提供了已分类 ...

  6. 静态背景下运动目标检测

    前言:运动对象常用在视频监控领域,目的是从序列图像中将变化区域从背景图像中提取出来,运动区域的有效检测对目标分类.跟踪.行为理解等后期处理非常重要.根据摄像机与运动目标之间的关系可分为静态背景下的运动 ...

  7. 【深度学习】语义分割-综述(卷积)

    这里写目录标题 0.笔记参考 1. 目的 2. 困难点 3. 数据集及评价指标 3.1数据集 3.2评价指标 4.实现架构 5. 模型发展 5.1基于全卷积的对称语义分割模型 5.1.1FCN(201 ...

  8. 半监督医学影像分割综述

    <半监督医学影像分割综述> 引言 两种不同类型的图像分割问题. 相应的语义类对每个像素进行分类,从而给图像中属于这个类的所有对象或区域一个相同的类标签. 实例分割试图更进一步,试图区分同一 ...

  9. 【转载】语义分割综述2020.01

    转载: 作者: http://blog.csdn.net/john_bh/ 出处:https://blog.csdn.net/john_bh/article/details/107044528 论文链 ...

最新文章

  1. 字符串的模式匹配,KMP算法
  2. 皮一皮:这就是我的开发水平...
  3. python-正则表达式知识点积累
  4. 如何成为一名入门级 iOS 开发者
  5. RabbitMQ自学之路(九)——RabbitMQ实现延时队列的两种方式
  6. 通过项目逐步深入了解Mybatis二
  7. linux 单例模式改密码,Java 利用枚举实现单例模式
  8. 思科光传输功率查询_常见的6款40G QSFP+光模块型号介绍及应用
  9. python网络爬虫系列(六)——数据提取 lxml模块
  10. informatica 许可_Informatica安装教程
  11. python requests verify=True vs verity=Flase
  12. 水文特点是什么意思_自动气象站应建在什么地方?
  13. 大连理工大学计算机视觉实验室,首个镜子分割网络问世,大连理工、鹏城实验室、香港城大出品 | ICCV 2019...
  14. win98万能显卡驱动_万能显卡驱动下载
  15. 红茶的功效与作用,喝红茶的好处和坏处,红茶的种类有哪些
  16. 关于SVN无法cleanup的问题
  17. 数据分析 | R语言绘制中国地图
  18. html中怎么录音,HTML5怎么实现录音和播放功能
  19. word,excel,ppt在线预览功能
  20. oracle设置字符集为gbk,rac 环境下修改oracle数据库字符集为GBK

热门文章

  1. Flutter系列之showDialog拦截返回键
  2. 大数据发力 LTE端到端KPI指标可精细优化
  3. 23.Android之颜色码制表
  4. VC++运行库 集32位/64位整合版
  5. 企业网盘市场期待大爆发,联想能否“六连庄”?
  6. 成绩统计(数位计算)
  7. 河道水文标尺监测系统 OpenCv
  8. 从ChatGPT看知识管理及知识图谱的发展
  9. Smoke Test和BVT Test的区别
  10. Snowflake Snow Snowflakes(hash)