第一节简述人类视觉系统的一些重要方面,包括人眼中图像的生成及人眼适应和辨认灰度的一些能力,第二节讨论光、电磁波谱的其他分量及他们的成像特点,第三节讨论成像传感器及如何使用成像传感器来生成数字图像,第四节介绍均匀图像取样和灰度量化的概念,第五节介绍像素间的各种基本关系

视觉感知要素

目的:图像形成并被人类感知的基本原理

  • 光感受器:锥状体(对颜色高度敏感,明视觉或亮视觉),杆状体(对低光照度敏感,表现为白天色彩鲜艳的物体在月光下却没有颜色,因为此时只有杆状体受到刺激,暗视觉、微光视觉)
  • 人眼通过调节晶状体的形状来调节焦距,物体在视网膜上成像,光感受器的相对激励作用产生感知,把辐射能量转换为最终由大脑解码的电脉冲
  • 感知亮度不是实际灰度的简单函数,视觉系统往往会在不同灰度区域的边界处出现下冲和上冲的现象,马赫带效应;同时对比,在背景不同的时候,人眼会对实际灰度相同的物体感到不同的亮度;光觉错视表示一些视觉上面的错觉;

光和电磁波谱

  • 电磁波谱可用波长、频率或能量表示,波长λ\lambdaλ和频率vvv的关系为:
    λ=cv\lambda = \frac{c}{v} λ=vc​
    ccc是光速2.998×108m/s2.998 \times 10^8m/s2.998×108m/s
    电磁波谱各分量的能量为:
    E=hvE = hv E=hv
    hhh是普朗克常数,能量和频率成正比,和波长成反比
  • 可见光的范围为0.43μm0.43\mu m0.43μm紫色~0.79μm0.79\mu m0.79μm红色
  • 感知的物体颜色由物体反射的光的性质来决定
  • 没有颜色的光称为单色光或无色光,单色光的唯一属性是亮度,单色光的感知亮度是从黑色到灰色最后到白色变化,单色光从黑到白的数值范围通常称为灰度级,单色图像称为灰度图像
  • 辐射:从光源流出的总能量,用瓦特来度量
  • 光通量:观察者从光源感知的能量,用流明lmlmlm来度量,例如不可见光的流明几乎为0

图像感知与获取

  • 由“照射”源和形成图像的“场景”元素对光能的反射或吸收产生的,传感器对正被检测能量类型的响应,将入射能量转换为电压,输出电压波形是传感器的响应,将传感器响应数字化,得到一个数字量
  • 光二极管:输出是与光强成正比的电压
  • 一个简单的成像模型:以f(x,y)f(x,y)f(x,y)的二维函数来表示图像,i(x,y)i(x,y)i(x,y)表示入射分量,表示入射到被观察场景的光源照射量;r(x,y)r(x,y)r(x,y)表示反射分量,限制在0(全吸收)和1(全反射)之间:
    f(x,y)=i(x,y)r(x,y)0≤f(x,y)<∞0≤i(x,y)<∞0≤r(x,y)≤1f(x,y) = i(x,y)r(x,y) \\ 0 \leq f(x,y) \lt \infty \\ 0 \leq i(x,y) \lt \infty \\ 0 \leq r(x,y) \leq 1 f(x,y)=i(x,y)r(x,y)0≤f(x,y)<∞0≤i(x,y)<∞0≤r(x,y)≤1

图像取值和量化

目的:将连续观测的数据(例如电压)转换为数字形式,这种转换包括取样和量化

  • 对坐标值进行数字化称为取样或采样,对幅值进行数字化称为量化,也就是对一幅连续的图像划分为一个个小格子以对坐标值量化,后对每一个格子取值以对灰度值量化;
  • (x,y)(x,y)(x,y)是笛卡尔积Z2Z^2Z2中的整数,且fff是把灰度值(即实数集RRR中的一个实数)赋给每个特定坐标对(x,y)(x,y)(x,y)的一个函数,那么f(x,y)f(x,y)f(x,y)就是一幅数字图像;
  • 灰度级LLL出于对存储和量化硬件的考虑通常取222的整数次幂;
  • 灰度跨越的值域称为动态范围,定义为最大可度量灰度与最小可度量灰度之比;
  • 图像对比度定义为一幅图像中最高和最低灰度级间的灰度差
  • 一个像素的位置有坐标索引或下表索引(x,y)(x,y)(x,y),和线性索引,线性索引分为行扫描和列扫描,以列扫描为例,从最左边一列开始,从上到下从0开始标号,之后到第二列,接着第一列最后一个号标号,后面的列以此类推;
  • 空间分辨率:单位距离的线对数和单位距离的点数(像素数)单位(dpi,点数/英寸)
  • 灰度分辨率:量化灰度时的比特数,例如灰度被量化为256级的图像,其灰度分辨率为8比特
  • 图像内插:通常在图像放大、缩小、旋转和几何校正等任务中使用,主要是用已知数据估计未知位置的值的过程,包含最近邻内插、双线性内插,双三次内插

像素间的一些基本关系

  • 坐标(x,y)(x,y)(x,y)处的像素ppp有两个水平的相邻像素和2个垂直的相邻像素,坐标分别是(x+1,y),(x−1,y)(x,y+1),(x,y−1)(x + 1,y),(x - 1,y)(x,y+1),(x,y-1)(x+1,y),(x−1,y)(x,y+1),(x,y−1),这组像素称为ppp的4邻域,用N4(p)N_4(p)N4​(p);
  • ppp的4个对角邻域的坐标是(x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1)(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)(x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1),用ND(p)N_D(p)ND​(p)表示;
  • ppp的4个对角邻域和4邻域合起来合称ppp的888邻域,用N8(p)N_8(p)N8​(p)表示;
  • 如果一个邻域包含ppp,称为闭邻域,否则称为开邻域;
  • 对于坐标分别为(x,y),(s,t),(v,w)(x,y),(s,t),(v,w)(x,y),(s,t),(v,w)的像素p,q,zp,q,zp,q,z,如果:
    D(p,q)≥0(D(p,q)=0当且仅当p=q)D(p,q)=D(q,p)D(p,z)≤D(p,q)+D(q,z)\begin{aligned} D(p,q) &\geq 0(D(p,q) = 0 当且仅当p=q) \\ D(p,q) &= D(q,p) \\ D(p,z) &\leq D(p,q) + D(q,z) \end{aligned} D(p,q)D(p,q)D(p,z)​≥0(D(p,q)=0当且仅当p=q)=D(q,p)≤D(p,q)+D(q,z)​
    则称DDD是距离函数或度量
  • 欧氏距离:De(p,q)=[(x−s)2+(y−t)2]12D_e(p,q) = [(x - s)^2 + (y - t)^2]^{\frac{1}{2}}De​(p,q)=[(x−s)2+(y−t)2]21​
  • D4D_4D4​城市街区距离:D4(p,q)=∣x−s∣+∣y−t∣D_4(p,q) = |x - s| + |y - t|D4​(p,q)=∣x−s∣+∣y−t∣
  • D8D_8D8​棋盘距离:D8(p,q)=max(∣x−s∣,∣y−t∣)D_8(p,q) = max(|x - s|,|y - t|)D8​(p,q)=max(∣x−s∣,∣y−t∣)

涉及数学工具

  • 图像的阵列操作:逐像素操作
  • 考虑一般的算子HHH,该算子对于给定的输入图像f(x,y)f(x,y)f(x,y),产生一幅输出图像g(x,y)g(x,y)g(x,y):
    H[f(x,y)]=g(x,y)H[f(x,y)] = g(x,y) H[f(x,y)]=g(x,y)
    如果:
    H[aifi(x,y)+ajfj(x,y)]=aiH[fi(x,y)]+ajH[fj(x,y)]=aigi(x,y)+ajgj(x,y)H[a_if_i(x,y) + a_jf_j(x,y)] = a_iH[f_i(x,y)] + a_jH[f_j(x,y)] = a_ig_i(x,y) + a_jg_j(x,y) H[ai​fi​(x,y)+aj​fj​(x,y)]=ai​H[fi​(x,y)]+aj​H[fj​(x,y)]=ai​gi​(x,y)+aj​gj​(x,y)
    则称HHH是一个线性算子,符合加性和同质性或齐次性
  • 图像相加:去噪,现有照片是原图像加上加性噪声形成的,噪声的平均值为0,所以多张带噪声的图片相加平均可以起到去噪的效果
  • 图像相减:增强图像之间的差,可以看清血管,用使用造影剂前后的图像相减即可得到血管
  • 图像相乘:阴影校正,假设现有图像是由原图像乘上一个阴影函数,那么我们利用阴影函数的反函数就可以得到原图片,修正光线的影响;
  • 单像素操作:通过变换函数改变某像素点的灰度值
  • 领域操作:变换后的图像里面的某一点的像素值由以该点为中心的邻域内所有点计算而来;
  • 几何变换:包含坐标的空间变换和灰度内插两个过程
    坐标转换:仿射变换,假设(x,y)(x,y)(x,y)是变换后的坐标,(v,w)(v,w)(v,w)是变换前的坐标,下面的公式是前向映射,也就是将变换前的坐标转换到变换后的坐标
    [xy1]=[vw1]T=[vw1][t11t120t21t220t31t321][ \begin{matrix} x & y & 1 \end{matrix} ] = [ \begin{matrix} v & w & 1 \end{matrix} ]T = [ \begin{matrix} v & w & 1 \end{matrix} ]\left[ \begin{matrix} t_{11} & t_{12} & 0 \\ t_{21} & t_{22} & 0 \\ t_{31} & t_{32} & 1 \end{matrix} \right] [x​y​1​]=[v​w​1​]T=[v​w​1​]⎣⎡​t11​t21​t31​​t12​t22​t32​​001​⎦⎤​
    还可以做反向映射,也就是由转换后的图像的坐标计算出变换前所在的原图中的坐标,这种方法更加有效:
    [vw1]=T−1[xy1][ \begin{matrix} v & w & 1 \end{matrix} ] = T^{-1}[ \begin{matrix} x & y & 1 \end{matrix} ] [v​w​1​]=T−1[x​y​1​]

    灰度内插:最近邻、双线性、双三次内插
  • 图像变换:之前介绍的任务是直接在空间域工作,在一些情况下,可以变换图像,然后在变换域执行指定的任务,之后再反变化到空间域,二维线性变换T(v,u)T(v,u)T(v,u):
    T(u,v)=∑x=0M−1∑y=0N−1f(x,y)r(x,y,u,v)T(u,v) = \sum_{x = 0}^{M - 1}\sum_{y = 0}^{N - 1}f(x,y)r(x,y,u,v) T(u,v)=x=0∑M−1​y=0∑N−1​f(x,y)r(x,y,u,v)
    其中,f(x,y)f(x,y)f(x,y)是输入图像,r(x,y,u,v)r(x,y,u,v)r(x,y,u,v)是正变换核,上式对u=0,1,2,⋯,M−1,v=0,1,2,⋯,N−1u = 0,1,2,\cdots,M-1,v = 0,1,2,\cdots,N-1u=0,1,2,⋯,M−1,v=0,1,2,⋯,N−1计算,x,yx,yx,y是空间变量,M,NM,NM,N是fff的行和列,u,vu,vu,v是变换变量,T(u,v)T(u,v)T(u,v)称为f(x,y)f(x,y)f(x,y)的正变换,还可以用T(u,v)T(u,v)T(u,v)反变换f(x,y)f(x,y)f(x,y):
    f(x,y)=∑u=0M−1∑v=0N−1T(u,v)s(x,y,u,v)f(x,y) = \sum_{u = 0}^{M - 1}\sum_{v = 0}^{N - 1}T(u,v)s(x,y,u,v) f(x,y)=u=0∑M−1​v=0∑N−1​T(u,v)s(x,y,u,v)
    s(x,y,u,v)s(x,y,u,v)s(x,y,u,v)称为反变换核

图像处理学习笔记-02-数字图像基础相关推荐

  1. 数字图像处理学习笔记 二 数字图像基础

    目录 一 .人类视觉成像 二.数字图像处理的基本概念和操作 三.数学工具介绍 一 .人类视觉成像 1.眼睛上两类光感受器:锥状体和杆状体 锥状体: 数量在600-700万之间,主要位于视网膜的中间部分 ...

  2. JavaScript学习笔记02【基础——对象(Function、Array、Date、Math)】

    w3school 在线教程:https://www.w3school.com.cn JavaScript学习笔记01[基础--简介.基础语法.运算符.特殊语法.流程控制语句][day01] JavaS ...

  3. 【学习笔记】数字图像基础02

    数字图像基础 ---整理自老师课件 1. 视觉感知基础 彩色光波长范围: 400 ~ 700 nm: 描述 彩色光源质量的3个基本量: • 辐射率:从光源流出能量的总量:(单位:瓦) • 光强:给出观 ...

  4. JavaScript学习笔记01【基础——简介、基础语法、运算符、特殊语法、流程控制语句】

    w3school 在线教程:https://www.w3school.com.cn JavaScript学习笔记01[基础--简介.基础语法.运算符.特殊语法.流程控制语句][day01] JavaS ...

  5. JavaScript学习笔记03【基础——对象(RegExp、Global)】

    w3school 在线教程:https://www.w3school.com.cn JavaScript学习笔记01[基础--简介.基础语法.运算符.特殊语法.流程控制语句][day01] JavaS ...

  6. 数字图像处理学习笔记(四)——数字图像的内插、度量、表示与质量

    数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声.增强.复原.分割.提取特征等处理的方法和技术.本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结 ...

  7. 【计算机图形学基础】学习笔记 02 图形系统

    [计算机图形学基础]学习笔记 02 图形系统 一张图概括基本内容. 思维导图 References [1] 徐文鹏, 都伟冰, 等.计算机图形学基础:OpenGL版(第二版)[M].北京:清华大学出版 ...

  8. GDAL学习笔记02:GDAL基础知识

    你的习惯决定了你会成为什么样的人. GDAL学习笔记02:GDAL基础知识 前言 1. 版本 2. 摘要 3. 说明 4. 微信公众号GISRSGeography 一.GDAL简介 二.导入GDAL ...

  9. 数字图像处理学习笔记(十五)——图像复原与重建

    数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声.增强.复原.分割.提取特征等处理的方法和技术.本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结 ...

  10. Maven-学习笔记02【基础-Maven的安装和仓库种类】

    Java后端 学习路线 笔记汇总表[黑马程序员] 黑马程序员(腾讯微云)Maven基础讲义.pdf Maven-学习笔记01[基础-Maven基本概念] Maven-学习笔记02[基础-Maven的安 ...

最新文章

  1. Virtura box 构建一个简单局域网并联入外网
  2. redis 底层数据结构 压缩列表 ziplist
  3. VHDL数字秒表的设计
  4. node --- 游走在客户端和服务器间的http
  5. 一次通过Blender2Ogre将FBK转为Mesh的失败尝试
  6. 地推HTTP成长介绍
  7. grasshop 犀牛5.0下载_神契幻奇谭 v1.129版发布 快来下载神契幻奇谭2020最新官方版...
  8. Itil v3 process model
  9. 监控流媒体服务器的搭建和使用
  10. ERP原理:第二节 物料清单(BOM)
  11. html字幕文本,HTML字幕
  12. PROC PRINT过程
  13. GoPhish钓鱼邮件
  14. 创意休闲手游《急速感染》震撼来袭~
  15. 2021年茶艺师(中级)最新解析及茶艺师(中级)考试总结
  16. 雅虎2011热门词汇搜索排行榜
  17. Chromium源码—base基础库说明
  18. 23届考研寒假计划(1-3月)
  19. java jvisualvm linux,在CentOS上安装jvisualvm
  20. php中- gt 什么意思,php是什么意思啊_php代码中quot;-gt;quot;是什么意思

热门文章

  1. 字体画出阴影 android,android之字体阴影效果
  2. 江南天安基于国产密码构建ChinaDRM证书分发云服务
  3. 如何让你的 Win10 任务栏全透明?
  4. 基于5G云网融合的车联网应用技术探讨
  5. 无光驱照样装系统 教你用U盘安装XP/Vista
  6. 福建省2013高职单招计算机类试题,2013福建高职单招计算机类专业知识试题(卷).doc...
  7. 操作系统与网络实现 之二十一
  8. 移动硬盘占用率100%导致无法读取故障修复
  9. 面对高并发,大数据 数据库分区、分表、分库,读写分离
  10. OBS+RED5+FFPLAY构建流媒体点直播平台 —— 实现自己的游戏直播不再是梦想