资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第,2,讲 数字图像处理的基础,(Basics Knowledge of Digital Image Processing),2.1,人类的视觉感知系统,(Visual System of Human Beings),2.2,数字图像的基础知识,(Basics of Digital Image),1,2.1,人类的视觉感知系统,(Visual System of Human Beings),视觉是人类最高级的感知器官,所以,毫无疑问图像在人类感知中扮演着重要角色。,然而人类感知只限于电磁波谱的视觉波段,成像机器则可以覆盖几乎全部电磁波谱。,研究图像处理首先要了解人类的视觉感知系统。,2,2.1,人类的视觉,2,.,1,.1 人眼构造和视觉现象,右图中,前部为一圆球,,由3层薄膜包着,即,角膜和巩膜外壳、脉络膜,和,视网膜。,角膜是一种硬而透明的组织,盖着眼睛的前表面;巩膜与角膜连在一起,是一层包围着眼球剩余部分的不透明膜。,脉络膜位于巩膜的里边,这层膜包含有血管网,它是 眼睛的重要滋养源。,视网膜位于最里层,,它布满在整个眼球候补的内壁,当眼球出于适当聚焦时,从眼睛的外部物体来的光就在视网膜上成像。,其上布满锥状体和杆状体,造成,图案视觉。,人眼横截面的简单示意图,3,相对应的还有“色度对比”。,物体,背景,视觉,6,眼睛的对比灵敏度可以由实验测得。在均匀照度背景 I 上设有一照度为I+I的光斑,眼睛刚能分辨出的照度差I 是 I 的函数,当背景照度 I 增大时,能够分辨出光斑的 I 也需要增大,在相当宽的强度范围内,I/I,的数值为一常数,约等于0.02。,比值I/I称为,韦伯(Weber)比,。但是在亮度很强或很弱时,这个比值就不再保持为常数。,3.对比灵敏度,7,视觉分辨率,:人眼分辨景物细节的能力。这一特性与视 网膜上单位面积内分布的视细胞数有关。,空间,素数,单位:Pixels Per Inch,习惯上用采样后的像素点数:M N(行列)的像素数表示。,幅度分辨率,:由灰度级决定,采样点数相同时,灰度级越多,图像质量越高。,4.分辨率,8,人们在观察一条由均匀亮和暗的区域形成的边界时,会发现亮处更亮,暗处更暗,这就是所谓的Mach带。,5.Mach带,9,错觉现象,10,错觉现象,11,长度与透视,线AB和线CD长度完全相等,,虽然它们看起来相差很大。,12,曲线正方形,曲线正方形:这些是完全的正方形吗?,13,图中几张人脸,14,2.,2,.,1,图像的数字化(DIGITIZING),图像的数字化:,将代表图像的连续(模拟)信号转变为离散(数字)信号的变换过程。,要解决两个问题:,空间取样(空间坐标的离散化),幅度的量化(幅度的离散化,灰度值或亮度值变为若干级),数字图像,(DIDITAL IMAGE):,在空间坐标和亮度上都离散化了的图像。,15,2.,2,.,1,图像的数字化,1.抽样(采样,SAMPLING),空间上连续的图像变换成离散点(抽样点,即像素,PIXEL)的集合的一种操作。即图像,空间坐标(x,y)的数字化,被称为图像抽样。,N,M,确定水平和垂直方向上的像素个数M、N。,16,2.,2,.,1,图像的数字化,取样点的选取,假定一幅图像取M,N,个样点,1)M,N一般为2的整数次幂;,2)M,N,可以相等,也可以不等;,3)对于M,N数值大小的确定:,M,N大到满足采样定理,重建图像就不会产生失真。,17,2.,2,.,1,图像的数字化,采样定理,如果信号所含的最高频率成份为f,N,,则采样频率至少是f,N,的两倍时,可保证采样信号的不失真。,18,图像的,采样,与数字图像的质量,265,180,133,90,66,45,33,22,2.,2,.,1,图像的数字化,19,2.,2,.,1,图像的数字化,2.量化(QUANTIZATION),图像函数值(灰度值)的离散化(取值的数字化),被称为图像灰度级量化;,量化处理:,将f 映射到Z的处理;,Z的最大取值,确定像素的灰度级数Q=2,b,,如256。,20,Z,i+1,Z,Z,i-1,Q,i+1,Q,Q,i-1,连续的灰度值,量化值(整数值),量化,黑色 灰色 白色,从白到黑的,连续变化,黑色,灰色,白色,灰度标度,255,254,128,1,0,0,1,128,254,255,灰度级的分配,把从白到黑的灰度值(gray level)量化成8比特,2.,2,.,1,图像的数字化,21,2.,2,.,1,图像的数字化,若将样点量化为Q级,Q如何取值,:,1)Q,总是取2的整数次幂,如,Q=2,b,;,2)b,取值越大,重建图像失真越小,若要完全不失真重建图像,,b,必须取无穷大,否则一定存在失真。这就是所谓量化误差。,22,图像的,量化,与数字图像的质量,256灰度级,16灰度级,8灰度级,4灰度级,2.,2,.,1,图像的数字化,23,3.非均匀取样和量化,非均匀取样,在变化大细节多的区域较精(密)取样,平坦变化缓慢区域较粗(稀)取样,2.,2,.,1,图像的数字化,24,2.,2,.,1,图像的数字化,非均匀量化,在边界附近(灰度剧烈变化区)量化级少,灰度级变化比较平滑的区域量化级多,避免或减少由于量化的太粗糙,在灰度级变化比较平滑的区域出现假轮廓的现象,25,4.一个好的近似图像,需要多少采样分辨率和灰度级,胡昂1965实验:,实验方法,选取一组细节多少不同的、不同N、M、Q的图像,让观察者根据他们的主观质量感觉给这些图像排序,实验结论,随着采样分辨率和灰度级的提高,主观质量也提高,对有大量细节的图像,质量对灰度级需求相应降低,2.,2,.,1,图像的数字化,26,27,2.2,.,2,图像的表示,图像的亮度一般可以用多变量函数表示为,I=f(x,y,z,t),式中,x、y、z 表示空间某个点的坐标;为光的波长;t为时间轴坐标。,二维图像:I=f(x,y,t);,单色图像:I=f(x,y,z,t);,静态图像:I=f(x,y,z,)。,图像信号的表示,28,数字图像的表示,一幅 mn 的数字图像可用矩阵表示为,数字图像中的每个像素(pixel)都对应于矩阵中相应的元素。把数字图像表示成矩阵的优点在于能应用矩阵理论对图像进行分析处理。,29,灰度图像是指每个像素由一个量化灰度来描述的图像,没有彩色信息,如下图所示。,若图像像素灰度只有两级,通常取,0,(黑色)或,1,(白色),这样的图像称为二值图像。,30,数字图像的表示,彩色图像是指每个像素由红、绿、蓝(R、G、B)3原色构成的图像,其中R、G、B是由不同的灰度级描述的。,注意:灰度级和灰度值两个概念,31,2.,2,.,3,像素间的一些基本关系,1.邻域,4-邻域定义,像素p(x,y)的4-邻域是:(x+1,y);(x-1,y);(x,y+1);(x,y-1)。用N,4,(p)表示p的4-邻域。,32,8-邻域定义,像素p(x,y)的8-邻域是:4-邻域的点加上对角上的点(x+1,y+1);(x+1,y-1);(x-1,y+1);(x-1,y-1)。用N8(p)表示p的8-邻域。,2.,2,.,3,像素间的一些基本关系,33,2.,2,.,3,像素间的一些基本关系,2.像素的连通性,连通性是描述区域和边界的重要概念,两个像素连通的两个必要条件是:,两个,像素的位置,在某种情况下是否相邻,两个,像素的值,是否满足某种相似性,34,2.,2,.,3,像素间的一些基本关系,4-连通的定义,对于具有值V的像素p和q 如果q在集合N,4,(p)中,则称这两个像素是4-连通的。,35,2.,2,.,3,像素间的一些基本关系,8-连通的定义,对于具有值V的像素p和q 如果q在集合N,8,(p)中则称这两个像素是8-连通的。,36,m-连通的定义,对于具有值V的像素p和q,如果:,(i)q在集合N,4,(p)中,或,(ii)q在集合N,D,(p)中,并且N,4,(p)与N,4,(q)的交集没有V值的像素。,则称这两个像素是m-连通的,即4-连通和D-连通的混合连通。,37,2.,2,.,3,像素间的一些基本关系,像素邻接的定义,如果像素p和q是连通的,则称p邻接于q。,我们可以用定义连通的方法,定义4-邻接、8-邻接和m-邻接。,38,2.,2,.,3,像素间的一些基本关系,图像子图邻接的定义,如果两个图像子集S1和S2中的某些像素是邻接的,则称S1和S2是邻接的。,39,2.,2,.,3,像素间的一些基本关系,路径(通路)的定义,一条从具有坐标(x,y)的像素p,到具有坐标(s,t)的像素q的,路径,,是具有坐标,(x,0,y,0,),(x,1,y,1,),.,(x,n,y,n,)的不同像素的序列。其中,(x,0,y,0,)=(x,y),(x,n,y,n,)=(s,t),(x,i,y,i,)邻接于(x,i-1,y,i-1,),1,i,n,n是路径的长度。,我们可以用定义邻接的方法定义4-路径8-路径和m-路径。,40,2.,2,.,3,像素间的一些基本关系,41,2.,2,.,3,像素间的一些基本关系,像素在图像子集中连通的定义,如果像素p和q是图像子集S中的元素,如果存在一条完全由S中的像素组成的从p到q的路径,则称p和q在S中是连通的。,图像子集连通元素的定义,对于S中的任意像素p,S中连通到p的所有像素的集合,被称为S的连通元素。,42,2.,2,.,3,像素间的一些基本关系,43,2.,2,.,3,像素间的一些基本关系,3.距离,像素之间距离函数的定义,:,对于像素p、q和z,分别具有坐标(x,y)、(s,t)、(u,v),D是距离函数或称度量,当:,(a),D(p,q),0(D(p,q)=0,当且仅当 p=q),两点之间距离大于等于0,(b),D(p,q)=D(q,p),距离与方向无关,(c),D(p,z),D(p,q)+D(q,z),两点之间直线距离最短,44,2.,2,.,3,像素间的一些基本关系,欧几里德距离,(Euclidean distsnce),p和q之间的欧基里德距离定义为:,De(p,q)=(x-s),2,+(y-t),2,1/2,对于这个距离计算法,具有与(x,y)距离小于等于某个值r的那些像素是包含在以(x,y)为圆心,以r为半径的圆环中的那些点。,45,2.,2,.,3,像素间的一些基本关系,D4距离,(4-neighbor distance),别名为城市距离,(city-block distance),p和q之间的D4距离定义为:,D4(p,q)=|x-s|+|y-t|,46,2.,2,.,3,像素间的一些基本关系,具有与(x,y)距离小于等于某个值r 的那些像素形成一个菱形。例如,与点(x,y)(中心点)D4距离小于等于2的像素,形成下列常数距离的轮廓。,具有D4=1的像素是(x,y)的4-邻域。,47,2.,2,.,3,像素间的一些基本关系,D8距离,(8-neighbor distance),别名为棋盘距离,(chess-board distance),p和q之间的D8距离定义为:,D8(p,q)=max(|x-s|,|y-t|),48,2.,2,.,3,像素间的一些基本关系,具有D8=1的像素是(x,y)的8-邻域。,小于r的像素围成一个正方形。,49,2.2.4,图像的分类,图像的分类,图像有许多种分类方法,按照图像的动态特性,可以分为静止图像和运动图像;按照图像的色彩,可以分为灰度图像和彩色图像;按照图像的维数,可分为二维图像,三维图像和多维图像。,50,位图,位图是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。,位图分成如下四种:二值图像,(binary images),、亮度图像,(intensity images),、索引图像,(indexed images),和,RGB,图像,(RGB images),。,51,1.,二值图像,(binary images),二值图像只有黑白两种颜色,一个像素仅占,1,,,0,表示黑,,1,表示白,或相反。,2.,亮度图像,(intensity images),在亮度图像中,像素灰度级用,8,表示,所以每个像素都是介于黑色和白色之间的,256,(,=256,)种灰度中的一种。,52,3.,索引图像,(indexed images),颜色是预先定义的(索引颜色)。索引颜色的图像最多只能显示,256,种颜色。,4.RGB,图像,(RGB images),。,“真彩色”是,RGB,颜色的另一种叫法。在真彩色图像中,每一个像素由红、绿和蓝三个字节组成,每个字节为,8,,表示,0,到,255,之间的不同的亮度值,这三个字节组合可以产生,1670,万种不同的颜色。,53,物体的颜色,电磁波谱,54,光的颜色决定于光的波长;,透明物体的颜色是由它能透过的色光决定;,不透明物体的颜色是由它反射的色光决定;,黑色物体吸收各种颜色的光;,白色物体反射各种颜色的光。,55,RGB 颜色模型,红,品红,蓝,青,绿,黄,56,在RGB彩色空间的原点上,任一基色均没有亮度,即原点为黑色。三基色都达到最高亮度时则表现为白色。亮度较低的等量的三种基色产生灰色的影调,。所有这些点均落在彩色立方体的对角线上,该对角线被称为灰色线。彩色立方体中有三个角对应于三基色红、绿和蓝色。剩下的三个角对应于黄色,青色和洋红(品红)。,57,彩色图像,R分量图像,G分量图像,B分量图像,58,色彩具有三个基本属性:,色度,、,饱和度,、,亮度,。,Hue(色度),表示颜色,与波长有关,取值,0-360,;,颜色的种类,如红、绿等。,Saturation(饱合度),表示色纯度,即单色光中渗入白光的程度,取值,0-1或0-100,;,颜色的深浅、浓淡,如深红、浅红等。,Intensity or Brightness(亮度),表示人眼感知颜色的强弱程度,它和能量大小及人眼对不同波长的感知能力有关,,取值,0-1或0-100。,光的明暗程度。,H,SI,颜色模型,59,H分量图像,S分量图像,I分量图像,彩色图像,60,HSI,(色调、饱和度、亮度),两个特点:,I分量与图像的彩色信息无关,H和S分量与人感受颜色的方式是紧密相连的,将亮度(I)与色调(H)和饱和度(S)分开,避免颜色受到光照明暗(I)等条件的干扰,仅仅分析反映色彩本质的色调和饱和度,广泛用于计算机视觉、图像检索和视频检索,61,用一个彩色圆柱体表示,,白,红,绿,蓝,S,0,I,黑,240,120,H,柱形彩色空间,色调H由角度表示,它反映了颜色最接近什么样的光谱波长,即光的不同颜色。饱和度S表征颜色的深浅程度,饱和度越高,颜色越深。饱和度参数是色环的原点(圆心)到彩色点的半径的长度。亮度I是指光波作用于感受器所发生的效应,其大小由物体反射系数来决定,反射系数越大,物体的亮度愈大,反之愈小。如果把亮度作为色环的垂线,那么H、S、I构成一个柱形彩色空间。灰度阴影沿着轴线自下而上亮度逐渐增大,由底部的黑渐变成顶部的白。圆柱顶部的圆周上的颜色具有最高亮度和最大饱和度。,62,3)彩色空间转换,63,彩色空间转换,注意:有关RGB与HIS之间的转换公式的推导请参见,数字图像处理(K.R.Castleman著,朱志刚等翻译,电子工业出版社),,第21章。,64,2,.,2.4,图像质量的评价方法,图像的主观评价就是通过人来观察图像,对图像的优劣作主观评定,然后对评分进行统计平均,得出评价的结果。,评价出的图像质量与,观察者的特性,及,观察条件,等因素有关。,为保证主观评价在统计上有意义,选择观察者时既要考虑有未受过训练的“,外行,”观察者,他们的评价能代表平均观察者感受的图像质量;又要考虑有对图像技术有一定经验的“,内行,”观察者,他们能指出图像的少量退化,对观察人数和条件有限制。,1.图像的主观评价,65,a),质量测试,:评定图像的质量等级,非常好,好,一般,差,非常差,b),损伤测试,:评定图像的损伤程度,无觉察,刚觉察,觉察但不讨厌,讨厌,难以观看,c),比较测试,:对给定图像与标准图像做出质量比较,好的多,好,相同,坏,坏的多,66,对于数字图像,设 f(j,k)为原参考图像,为其降质图像,逼真度可定义为,归一化的均方误差值,(,NMSE,Normalized Mean Square Error)N为,2.图像的客观评价,67,另外一种常用的为,峰值均方误差,(PMSE,Peak Mean Square Error)P为,式中,A为 Qf(j,k)的最大值,一般取Qf=f,M、N为图像尺寸。,68,2,.,2,.,5,数字图像文件的存储格式,数字图像在计算机中是以文件的形式存储的。常见的图像数据格式包括,BMP,格式、,JPEG,格式、,GIF,格式。,1.BMP格式的图像文件,BMP是Bitmap的缩写,意为“,位图,”。BMP格式的图像,文件是微软公司特意为Windows环境应用图像设计的。,69,(1)Windows中最简单的标准格式,以,.bmp,作为文件 扩展名。,(2)图像信息丰富,一般采取,不压缩,的形式。,(3)可以保存多种图像,;,单色、16色、256色、24bit真彩色等。,(4)从图像,左下角为起点,存储图像。,(5)调色板数据结构中,RGB3基色数据的排列顺序恰好与其他格式文件的顺序相反。,70,图像,数据,54B,调色板数据,71,(1)JPEG格式图像文件的扩展名是,.jpg,或是,.,jpeg,,压 缩率很大,但是却不易觉察。,(2)适用性广泛,大多数图像类型都可以进行JPEG编 码,现已广泛应用于Internet技术,节省了宝贵的网络资源。,(3),JPEG只支持有损压缩,,JPEG 2000是JPEG的升级 版本,同时支持有损压缩和无损压缩。,(4)JPEG2000的一个极其重要的特征在于它能实现,渐进传输,。,2.JPEG 格式的图像文件,72,(1)GIF格式图像文件的扩展名是,.gif,,主要用于网络传输。,(2)最多存储,256色,,体积小,清晰度高,对灰度图像表现最佳。,(3)具有,GIF87a,和,GIF89a,2个版本。GIF87a版本是1987年推出的,1个文件存储1个图像;GIF89a版,本是1989年推出的很有特色的版本,该版本允许1,个文件存储多个图像,可实现动画功能。,(4)与JEPG2000图像一样,也实现,渐进传输,。,3.GIF格式的图像文件,73,Bmp 图片,Jpeg图片,Gif 图片,74,视频文件格式,AVI(Audio video Interleaved)格式,DV-AVI(Digital Video AVI)格式,MOV格式,RM格式,MPEG格式,。,75,Thank You!,76,
展开阅读全文