数字图像处理知识体系小结
http://blog.csdn.net/hitwengqi/article/details/8292675
目录(?)[+]
- 一数字图像基础
- 二数字图像存储与显示
- 三图像变换
- 四形态学图像处理
- 五图像边缘检测
- 六图像增强和复原
- 七图像压缩
- 八图像分割
- 九图像特征提取与匹配wq11
- 十图像分类识别
站得高,才能看得远!
花了点时间整理了一下数字图像处理知识体系,从宏观上把握图像处理,使自己的学习思路就更加清晰。
1.本文大部分内容来自:http://blog.csdn.net/byxdaz/article/details/4375228
2.有些内容待添加,特别是opencv相关的算法实现。
目录
一、数字图像基础... 3
二、数字图像存储与显示... 3
三、图像变换... 4
1.卷积... 4
2.梯度和Sobel导数... 5
3.拉普拉斯变换... 5
4.Canny算子... 5
5.霍夫变换... 5
6.重映射... 5
7.几何操作:拉伸、收缩、扭曲和旋转... 5
8.离散傅里叶变换(DFT)... 5
9.离散余弦变换(DCT)... 5
四、形态学图像处理... 5
1.平滑处理... 5
2.膨胀与腐蚀... 5
3.开操作与闭操作... 5
4.漫水填充算法... 5
5.尺寸调整... 5
6.图像金字塔... 6
7.阈值化... 6
五、图像边缘检测... 6
六、图像增强和复原... 8
1.图像增强... 8
(1)空间域增强处理... 8
(2)频率域增强处理... 9
2.图像复原... 11
七、图像压缩... 11
八、图像分割... 12
九、图像特征提取与匹配... 13
十、图像分类(识别)... 15
数字图像处理[wq1] 是对图像进行分析、加工、和处理,使其满足视觉、心理以及其他要求的技术。图像处理是信号处理在图像域上的一个应用。目前大多数的图像是以数字形式存储,因而图像处理很多情况下指数字图像处理。此外,基于光学理论的处理方法依然占有重要的地位。 数字图像处理是信号处理的子类, 另外与计算机科学、人工智能等领域也有密切的关系。 传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上,比如降噪、量化等。然而,图像属于二维信号,和一维信号相比,它有自己特殊的一面,处理的方式和角度也有所不同。大多数用于一维信号处理的概念都有其在二维图像信号领域的延伸,它们中的一部分在二维情形下变得十分复杂。同时图像处理也具有自身一些新的概念,例如,连通性、旋转不变性,等等。这些概念仅对二维或更高维的情况下才有非平凡的意义。图像处理中常用到快速傅立叶变换,因为它可以减小数据处理量和处理时间。
数字图像处理应用在以下方面 :
摄影及印刷 (Photography and printing)
卫星图像处理 (Satellite imageprocessing)
医学图像处理 (Medical image processing)
面孔识别, 特征识别 (Face detection,feature detection, face identification)
显微图像处理 (Microscope imageprocessing)
汽车障碍识别 (Car barrier detection)
一、数字图像基础
图像的基本概念、图像取样和量化、数字图像表示、空间和灰度级分辨率、图像纹理、像素间的一些基本关系(相邻像素、邻接性、连通性、区域和边界、距离度量)[wq2] 、线性和非线性变换操作。[wq3]
常用色彩空间分类:
二、数字图像存储与显示
三、图像变换
3. 拉普拉斯变换[wq7]
4. Canny算子
5. 霍夫变换
6. 重映射
7. 几何操作:拉伸、收缩、扭曲和旋转[wq8]
8. 离散傅里叶变换(DFT)
9. 离散余弦变换(DCT)
四、形态学图像处理
五、图像边缘检测
迄今为止,已经出现了许多成熟的算法。例如微分算法,掩模算法等。在微分算法中,常使用N*N的像素块,例如3*3或者4*4。3*3的像素块如下,
f(i-1,j-1) f(i-1,j) f(i-1,j+1)
f(i+1,j-1) f(i+1,j) f(i+1,j+1)
我们不妨设f(i,j)为待处理的像素,而g(i, j)为处理后的像素。
g(i, j) = sqrt( (f(i, j) - f(i + 1, j))^2 + (f(i + 1, j) - f(i, j +1))^2 )
g(i, j) = |f(i,j) - f(i + 1,j)| + |f(i+1,j) - f(i,j+1)|
对数字图像的每一个像素f(i,j),考察它的上、下、左、右邻域灰度的加权值,把各方向上(0度、45度、90度、135度)的灰度值加权之和作为输出,可以达到提取图像边缘的效果。
fxr = f(i-1,j-1)+2*f(i-1,j)+f(i-1,j+1)-f(i+1,j-1)-2*f(i+1,j)-f(i+1,j+1)
fyr = f(i-1,j-1)+2*f(i,j-1)+f(i+1,j-1)-f(i-1,j+1)-2*f(i,j+1)-f(i+1,j+1)
Laplace算子是一种二阶微分算子。它有两种形式:4邻域微分算子和8邻域微分算子。
g(i,j)=|4*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)|
g(i,j)=|8*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)-f(i-1,j-1)-f(i-1,j+1)-f(i+1,j-1)-f(i+1,j+1)|
prewitt算子是一个边缘模板算子,由八个方向的样板组成,能够在0度,45度,90度,135度,180度,225度角
A1*f(i-1,j-1) A8*f(i,j-1) A7*f(i+1,j-1)
A2*f(i-1,j) -2*f(i,j) A6*f(i+1, j)
A3*f(i-1,j+1) A4*f(i,j+1) A5*f(i+1,j+1)
在程序设计中,依次用样板去检测图像,与被检测区域最为相似的样板给出最大值,用该最大值作为算子的输出值。
Kirsch算子是一个模板算子,由八个方向的边缘样板组成,能够在0度,45度,90度,135度,180度,225度角
六、图像增强和复原
图像增强的目的在于改善图像的显示质量,以利于信息的提取和识别。从方法上说,则是设法摒弃一些认为不必要或干扰的信息,而将所需要的信息得以突出出来,以利于分析判读或作进一步的处理。
常用的空域变换增强方法包括:对比度增强、直方图增强和图像算术运算等。
两幅或多幅单波段影像,完成空间配准后,通过一系列运算,可以实现图像增强,达到提取某些信息或去掉某些不必要信息的目的。
拉普拉斯算法的意义与梯度法不同,它不检测均匀的亮度变化,而是检测变化率的变化率,相当于二阶微分。计算出的图像更加突出亮度值突变的位置。
当有目的地检测某一方向的边、线或纹理特征时,可选择特定的模板卷积运算作定向检测。可以检测垂直边界、水平边界和对角线边界等,各使用的模板不同。
空域和频域滤波间的对应关系,卷积定理是空域和频域滤波的最基本联系纽带。二维卷积定理:
对某个(x,y),使h(-m,-n)移动相应的距离,得到h(x-m,y-n)
对积函数f(m,n)h(x-m,y-n)在(m,n)的取值范围内求和
位移是整数增量,对所有的(x,y)重复上面的过程,直到两个函数:f(m,n)和h(x-m,y-n)不再有重叠的部分。
傅立叶变换是空域和频域的桥梁,关于两个域滤波的傅立叶变换对:
1. 对具有同样大小的空域和频率滤波器:h(x,y), H(u,v),频域计算(由于FFT)往往更有效(尤其是图像尺寸比较大时)。但对在空域中用尺寸较小的模板就能解决的问题,则往往在空域中直接操作。
2. 频域滤波虽然更直接,但如果可以使用较小的滤波器,还是在空域计算为好。 因为省去了计算傅立叶变换及反变换等步骤。
3. 由于更多的直观性,频率滤波器设计往往作为空域滤波器设计的向导。
试图利用退化过程的先验知识,去恢复已被退化图像的本来面目。图像复原[wq9] 的基本思路:先建立退化的数学模型,然后根据该模型对退化图像进行拟合。
图像复原模型可以用连续数学和离散数学处理,处理项的实现可在空间域卷积,或在频域相乘。
七、图像压缩
A.将色彩空间化减到图像中常用的颜色。所选择的颜色定义在压缩图像头的调色板中,图像中的每个像素都用调色板中颜色索引表示。这种方法可以与 抖动(en:dithering)一起使用以模糊颜色边界。
B.色度抽样,这利用了人眼对于亮度变化的敏感性远大于颜色变化,这样就可以将图像中的颜色信息减少一半甚至更多。
C.变换编码,这是最常用的方法。首先使用如离散余弦变换(DCT)或者小波变换这样的傅立叶相关变换,然后进行量化和用熵编码法压缩。
D.分形压缩(en:Fractal compression)。
八、图像分割
通常图像分割的实现方法是,将图像分为“黑”、“白”两类,这两类分别代表了两个不同的对象。
1.求出图像的最大灰度值和最小灰度值,分别记为ZMAX和ZMIN,令初始阈值T0=(ZMAX+ZMIN)/2;
2.根据阈值TK将图象分割为前景和背景,分别求出两者的平均灰度值ZO和ZB;
大津法是属于最大类间方差法,它是自适应计算单阈值的简单高效方法,或者叫(Otsu)。大津法由大津于1979年提出,对图像Image,记t为前景与背景的分割阈值,前景点数占图像比例为w0,平均灰度为u0;背景点数占图像比例为w1,平均灰度为u1。图像的总平均灰度为:u=w0*u0+w1*u1。从最小灰度值到最大灰度值遍历t,当t使得值g=w0*(u0-u)2+w1*(u1-u)2最大时t即为分割的最佳阈值。对大津法可作如下理解:该式实际上就是类间方差值,阈值t分割出的前景和背景两部分构成了整幅图像,而前景取值u0,概率为 w0,背景取值u1,概率为w1,总均值为u,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。直接应用大津法计算量较大,因此一般采用了等价的公式g=w0*w1*(u0-u1)2。
(5)由灰度拉伸选择阈值
大津法是较通用的方法,但是它对两群物体在灰度不明显的情况下会丢失一些整体信息。因此为了解决这种现象采用灰度拉伸的增强大津法。在大津法的思想上增加灰度的级数来增强前两群物体的灰度差。对于原来的灰度级乘上同一个系数,从而扩大了图像灰度的级数。试验结果表明不同的拉伸系数,分割效果差别比较大。
B.区域的分割
区域生长、区域分离与合并
区域生长算法
C.基于形态学分水岭的分割
分水岭分割算法
九、图像特征提取与匹配
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。
模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法
特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题。
通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。
十、图像分类(识别)
模式识别--对表征事物或现象的各种形式的(数值的,文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
模式识别问题指的是对一系列过程或事件的分类与描述,具有某些相类似的性质的过程或事件就分为一类。模式识别问题一般可以应用以下4种方法进行分析处理。
统计模式识别的主要方法有:判别函数法,k近邻分类法,非线性映射法,特征分析法,主因子分析法等。
人工神经网络模式识别:人工神经网络的研究起源于对生物神经系统的研究。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。
在几种算法中,统计模式识别是最经典的分类识别方法,在图像模式识别中有着非常广泛的应用。
[wq1]
本文参考《数字图像处理》(第二版)
作者:冈萨雷斯
[wq2]
参考第二章,掌握概念?
[wq3]
线性变换:如果变换函数是线性的或是分段线性,这种变换就是线性变换。以线性函数加大图像的对比度的效果是使整幅图像的质量改善。以分段线性函数加大图像中某个(或某几个)亮度区间的对比度的效果是使局部亮度区间的质量得到改善。
非线性变换:当变换函数是非线性时,即为非线性变换。常用的有指数变换和对数变换。
[wq4]
参考《几种图像处理库的研究》:http://blog.csdn.net/byxdaz/article/details/3972293
[wq5]
以时间作为变量所进行的研究就是时域
以频率作为变量所进行的研究就是频域
以空间坐标作为变量进行的研究就是空间域
以波数作为变量所进行的研究称为波数域
[wq6]
一阶微分
[wq7]
二次导数,其离散实现类似于二阶Sobel导数
[wq8]
1) 仿射变换
2) 透视变换
[wq9]
参考
http://download.csdn.net/source/1513324
[wq10]
OTSU
[wq11]
SIFT特征怎么用?
数字图像处理知识体系小结相关推荐
- 数字图像处理知识体系小结(转)
在浏览博客是看到一篇文章,对图像处理领域的算法和理论总结的很到位,便转载了过来. 本文转自 http://blog.csdn.net/hitwengqi/article/details/8292675 ...
- 数字图像处理-知识体系概括
转载自:http://blog.csdn.net/hitwengqi/article/details/8292675 目录 一.数字图像基础... 3 二.数字图像存储与显示... 3 三.图像变换. ...
- 数字图像处理知识(2)
数字图像处理知识 一. 一个画笔修复的例子 import numpy as np import cv2 as cv import time #导入要使用的各类包#opencv Class for Mo ...
- DIP数字图像处理-知识提纲
修正补充说明: PPT上的傅里叶变换部分为主要修完善部分(我们补充了正确的答案).因为原来的PPT有较多的数字错误和解题错误. together with Liangxu Zhang 文章目录 综述 ...
- 数字图像处理知识总结
一:基本概念 数字图像:指由被称作像素的小块区域组成的二维矩阵.将物理图像行列划分后,每个小块区域称为像素(pixel).每个像素包括两个属性:位置和灰度. 图像数字化一般分为采样.量化与编码三个步骤 ...
- 计算机基础(二):嵌入式驱动、图像处理知识设备小结
一.LINUX内核驱动 C库:Gilbc.Bionic.静态链接库.动态链接库 Brom-boot()-uboot-kernal-init 功耗相关:standby.cpulide/thermal.d ...
- 数字图像处理知识(空间滤波)
文章目录 1 空间滤波 1.1 线性空间滤波 1.2 非线性空间滤波 1 空间滤波 1.1 线性空间滤波 主要的线性运算就是:掩膜中心置于(x,y)处,将(x,y)邻域内的每个像素与相应的掩膜系数相乘 ...
- (附源码)python数字图像处理课程平台 毕业设计 242339
Python数字图像处理课程平台的开发 摘 要 数字图像处理是一门新兴技术,随着计算机硬件的发展,数字图像的实时处理已经成为可能,由于数字图像处理的各种算法的出现,使得其处理速度越来越快,能更好的为人 ...
- (附源码)Python数字图像处理课程平台 毕业设计242339
Python数字图像处理课程平台的开发 摘 要 数字图像处理是一门新兴技术,随着计算机硬件的发展,数字图像的实时处理已经成为可能,由于数字图像处理的各种算法的出现,使得其处理速度越来越快,能更好的为人 ...
最新文章
- Python 应用领域以及版本之间的区别
- scrapy mysql 报错_scrapy爬数据存mysql报错
- idea如何设置自动换行
- 国内芯片60个细分领域重要代表企业【收藏】
- 网络TCp数据的传输设计(黏包处理)
- 对《构建之法——现代软件工程》13-17章的困惑与思考
- Ascii完整码表(256个)
- ajax 跨域 iis7,IIS中使用URL rewrite配置跨域调用
- sql家庭成员、收入支出数据库
- 压垮硬盘的最后一次备份
- 智能电话机器人--基于 UniMRCP 实现讯飞 TTS MRCP Server
- MyBatis—引入外部配置文件(properties)
- linux驱动篇-Led
- python搭建轻服务,实现上传下载文件
- 使用MISO进行可变剪切的分析
- 免费的Office办公套件LibreOffice for Mac
- 树莓派Zero 2W python3.7 安装tensorflow2.2
- 使用Docker如何搭建Web漏洞测试环境?
- html5游戏 很费流量嘛,2017TFC5玩游戏林勇坤 优化HTML5游戏流量数据转化
- 批量剪辑视频,添加图片水印