1、数字数字图像像处理理邓廷廷权哈哈尔滨工程大学理学院工程大学理学院图像处理的基本方法4图像像处理(理(image processing)对图像加工的各种技术方法的统称,它已被广泛地应用于许多领域。4基本方法模拟图像处理数字图像处理一、模拟图像处理4包括光学图像处理和电子图像处理(电子光学处理)4光学方法是图像处理发展的起源,1946年法国的Duffienx提出傅立叶光学,1964年美国密执安大学的A.Vanderlugt制成空间滤频器4光学处理具有处理速度快(可实时和并行处理,如电视模拟图像处理可达25帧/秒或30帧/秒)、信息量大、分辨率高、经济等优点4模拟图像处理的缺点是精度差、灵活性差,器
2、件具有专用性,并且缺乏判断分析能力,不具备非线性处理能力4趋势:将光学处理和计算机相结合的方法,如利用光学方法对图像进行傅立叶变换,再用计算机对频谱分析二、数字图像处理4将图像转换成一个数据矩阵存放在图像存储器中,然后再利用数字计算机,或其它的大规模集成数字器件(如DSP),对图像信息进行数字运算或处理,以提高图像的质量或达到人们所预期的其它效果4优点:精度高、处理内容丰富、可以进行复杂的非线性处理,处理方式灵活,同样的图像硬件系统,在改变软件之后可以用于其它完全不同的任务4缺点:由于目前计算机性能的限制,数字图像处理的速度有限,对于一些有实时性要求的任务,必须利用DSP加速或构建专用系统4广
3、义的数字图像处理是指从图像获取到图像信息输出的全过程,即图像处理系统与计算机应用相关的设备图像处理相关的方法有效软件的实现图像处理软件的应用图像信息在计算机中的表示图像数据库及检索图像信息应用等4狭义的数字图像处理仅指其中对图像信息进行处理 广义图像处理4图像信息获取,即获取研究对象的图像,并转换成数字信号,以便于计算机或其它数字设备处理研究重点:图像成像设备和数字化设备4图像信息的存储图像存储设备,以及图像存储的格式、图像压缩标准以及图像数据库技术等4图像信息的传送,包括内部传送与远距离传送内部传送多采用DMA(Direct Memory Access);远距离传送图像压缩技术,减少占用带宽
4、4图像信息处理,即狭义的图像处理利用计算机可以实现的算法4图像的输出与显示,即为人或计算机提供便于理解以及识别的图像软拷贝与硬拷贝两种形式狭义的计算机图像处理(一)4几何处理坐标变换:图像的放大与缩小、旋转、移动图像畸变校正几何特征计算等4算术与逻辑运算图像的加减乘除,与或非等运算此类运算既简单有效,又是其它处理的基础4图像增强根据任务目标突出图像中感兴趣的信息,消除干扰,改善图像的视觉效果或增强便于机器识别的信息4此三项是图像预处理中常涉及的内容狭义的计算机图像处理(二)4图像复原根据图像退化模型,消除退化因素,恢复原始的图像。如散焦是造成图像模糊的一个重要的因素,而散焦模型可以通过实验数据
5、和理论分析获得,利用逆滤波就可以消除散焦4图像编码研究压缩图像数据的方法,需要研究并利用图像的冗余特征,如统计冗余、生理视觉冗余、知识冗余等4图像分割根据图像的某些特征将图像划分为不同的区域,以便于对图像中的物体或目标进行分析与识别。如“机动车视觉系统”中根据图像中的灰度信息分割白色导引线和路面狭义的计算机图像处理(三)4图像重建前面六个研究方面输入的是图像,而图像重建输入的是非图像信息,如数据、公式等,输出为图像。主要有卷积反投影法等。常用于医学设备,CT等4图像模式识别在图像分割的基础上提取特征,对图像中的内容进行判决分类4图像分析与理解在图像模式识别的基础上进一步发展,根据图像局部内容之
6、间的关系,利用有关知识进行推理与联想,对图像中所表现的内容进行理解课程介绍4教材图像处理和分析基础,高等教育出版社,2004课程介绍4参考资料李叔梁译冈萨雷斯数字图像处理1981Kenneth R.CastlemanDigital Image Processing1998陈彩廷译罗森菲尔德数字图像分析1987吴健康数字图像分析1989R.CGonzalez,R.EWoodsDigital Image Processing,Addison-Wesley,Reading MA,1992课程介绍4主要参考资料Computer Vision Graphics and Image ProcessingI
7、EEE TransPattern Analysis&Machine IntelligencePattern RecognitionPattern Recognition LetterImage and Vision Computing模式识别与人工智能、中国图像图形学报计算机学报、自动化学报第一章图像技术基础41.1图像和像素41.2图像技术及分类41.3图像表示41.4图像显示41.5图像存储与格式41.6*视觉基础41.7*颜色视觉和色度学1.1图像4图像(image)在一般的意义下,可以认为一幅图像就是一个东西的一个表示,它包含了所表示物体的相关描述信息,出现形式多种多样可视的和不可视的
8、;抽象的和实际的;适于和不适于计算机处理的一、按照图像的存在形式分4(1)物理图像(physical images)物质或能量的实际分布可见的图像(visible image):人眼可以看到并接受的图像图片(picture),包括照片(photograph)、图(drawings指用线条画成的)和画(paintings),图片等价于图像,也就是说picture经常和image一词混用光图像(optical images),即用透镜、光栅和全息术产生的图像,如荧幕、屏幕上出现的影像。光(学)图像是光强度的空间分布不可见的图像:如温度、压力、高度以及人口密度等的分布图 4(2)抽象图像即数学图像,
9、包括连续函数和离散函数离散函数图像就是计算机可以处理的形式物理图像必须要变成离散函数才能被计算机处理二、按照图像的色彩特性分4彩色图像,又称为多光谱图像图像上的每个点有多于一个的局部特征彩色电视中重现的三基色图像,每个像素点就需要有红、绿、蓝三个基色的三个亮度值表示。遥感图像可以提供多达7个不同通道的信息4黑白图像,又称灰度图像、亮度图像、单色图像等每个像素点只有一个亮度值黑白照片黑白电视画面三、按照图像的光谱特性分4可见光图像4红外光图像4雷达图像4声呐图像四、按照图像的时间特性分4静止图像不随时间变化的图像,如各类图片4动态图像随时间变化的图像,如电视和电影画面物体物体objects图像像
10、images不可不可见的物理的物理图像像Non-visiblephysical image数学函数数学函数Mathematical function连续函数函数continuous离散函数离散函数Discrete(digital image)可可见的的图像像Visible image光光图像像Opticalimage图片片pictures照片照片photograph图drawing画画paintings Types of images图像的类型图像信息的分类4三类符号信息景物信息情绪信息图像信息(1)符号信息4一般是用文字、符号、图形等表示的具体的或抽象的事物电路图、机械图、打印的文件等,它们
11、中包含有规则、含义明确的符号,这些图像一般用二值图像表示就足够了,因为符号的颜色不提供新的有效信息,对图像的理解没有帮助地图中也包含大量符号,但需要关注颜色信息,因为它们都有确定的物理含义,如蓝色一般表示湿地,绿色的深浅也表明了海拔高度图像信息(2)景物信息4是一种能够使人产生主观感觉,但不取决于人本身的客观场景中包含的信息。景物信息内容丰富,较难以表达,只有在明确目标的前提下,才能得到正确处理如卫星云图中蕴含着气旋信息,气旋的位置与强度是一种客观存在图像信息(3)情绪信息4依赖于观察者,如艺术图片的效果就与观看者本身的生理、心理、修养有很大的关系,此类信息无法刻画1.2图像技术及分类图像工程
12、图像处理图像分析图像理解采集获取存储重建变换滤波增强恢复编码压缩数字水印信息隐藏边缘检测图像分割目标表达描述测量图像匹配融合3D表示重构场景恢复解释推理图像视频检索颜色形状纹理空间运动分析目标检测提取跟踪识别几个学科之间的关系4图像像处理(低理(低级,像素),像素):图像图像4图像分析(中像分析(中级,目,目标):图像数据4图像理解(高像理解(高级,符号),符号):数据、符号场景4模式模式识别:图像符号4计算机算机图形学(形学(Computer Graphics):数据图像,用计算机将由概念或数学模型表示的物体(不是实物)进行处理,并显示成图像4计算机算机视觉(Computer Vision)
13、:图像场景,研究模拟人眼功能的理解自然景物的系统4数字成像数字成像(Digital Imaging):更广义的一个概念,涵盖任何用计算机来操作(manipulate)与图像有关数据的技术,包括计算机图形学、计算机视觉、数字图像处理与分析不断拓展的应用领域4遥感遥感(Remote Sensing)4生物医学生物医学(Physic)4文件文件处理理(File Manipulation)4科学研究科学研究(Science Research)4工工业检测(Industry Check)4机器人机器人视觉(Robot Vision)4军事事(Military Affairs)4公安公安(Public S
14、ecurity)4其他其他公安公安(Public Security)4身份辨识4监控4不开箱检查4鉴定身份的生物识别技术4眼睛虹膜、视网膜4手掌4指纹4语音4面孔、脸部血管4签名4基因4气味眼睛:最可靠的身份证4虹膜:纤维组织,有250 以上的特征点每个虹膜的可识别特征可以得到512字节的资料,称为虹膜代码不同人眼的虹膜的60%左右的纹路是相同的,40%是不同的两人同一只眼虹膜特征相同的概率是十万分之一,两眼相同的概率是一千亿万分之一 4视网膜:血管构造也具有唯一性和稳定性的特点,可能还更为有效(可获得400个特征点人眼虹膜识别系统手掌识别4一种最为快捷方便的方法4识别手掌的几何特征手掌放在录
15、入头表面后,由红外相机获取图像。然后对手掌的整体形状、手指和关节的形状和长度进行测量,从而得到手掌的特征点4准确度不是很高,不能对手掌的其它特征,比如掌纹、伤疤进行分析4可利用的特征点约2050个指纹:最成熟的识别技术4从可靠性从可靠性说,人与人之,人与人之间,拥有相同指有相同指纹的概率的概率为十十亿分之一分之一4每个指每个指纹的特征点很多,的特征点很多,“节点点”,也就是指,也就是指纹纹路路的分叉、的分叉、终止或打圈止或打圈处的坐的坐标位置。通常,手指上有位置。通常,手指上有70个个节点,他点,他们同同时具有具有7种以上的唯一的特征。根据种以上的唯一的特征。根据美国美国联邦邦调查局的研究,在
16、可以用局的研究,在可以用软件件识别的的节点中,点中,最多有最多有7个或个或8个相同点个相同点4进行指行指纹识别时,首先用指,首先用指纹读取取设备获得指得指纹的的图像,然后像,然后对原始原始图像像进行初步行初步处理,使得更清晰。指理,使得更清晰。指纹识别软件在指件在指纹上找到上找到节点,并点,并转换成特定的数据。成特定的数据。最后,通最后,通过模糊比模糊比较的方法,把的方法,把这些数据与数据些数据与数据库中中的指的指纹数据数据进行比行比较,得到匹配,得到匹配结果果4最新最新进展,与指展,与指纹的深度信息融合,的深度信息融合,进一步提高了一步提高了识别的可靠性和数据的独特性的可靠性和数据的独特性人
17、脸识别:最友好、直接的系统4人脸检测(Face Detection)4人脸表征(Face Representation)4人脸鉴别(Face Identification):即人脸识别 4表情分析(Facial Expression Analysis)4物理分类(Physical Classification)人脸检测与定位特征提取人脸识别输入图像输出结果人脸自动识别系统构成笔迹识别:友善的生物识别技术4专用签名输入板,用户在板上留下自己的签名,识别过程几乎瞬间完成4签名力学辨识,建立在其签名时的力度上的。关键在于区分出不同的签名部分,那些是习惯性的,那些是每次签名是都不同的。这个系统主要对每
18、个人签名时笔的移动进行动态分析,如速度的变化、运笔的压力、方向和笔划的长度等,而不是签名的图像本身4签名识别的可靠性不是很高1.3图像表示一、图像的连续模型1、基本的连续模型4图像可以用灰度级G在x,y二维空间的连续变换来描述,即g(x,y)。时间序列图像的描述为:g1(x,y),g2(x,y),gt(x,y)或 g(x,y,t)4图像处理 f(x,y)=Sg(x,y)(1)式(1)中S可以是有意施加的某种处理方法,也可以是图像系统中导致图像退化的原因。4 G(x,y)=S-1f(x,y)(2)式(2)是图像复原的基本模型Sg(x,y)f(x,y)图像处理的基本框图2、照明反射模型f(x,y)
19、=i(x,y)r(x,y)4其中 0 i(x,y)Bm,0 r(x,y)14i(x,y)照射分量,r(x,y)反射分量,Bm最大光照强度4gmin g gmax,gmin=imin rmin,gmax=imax rmax4 gmin,gmax是图像灰度范围4该模型常用于同态滤波,计算机图形:真实感模型噪声的模型4噪声的特征4噪声的来源4噪声模型(1)噪声的特征4图像信号f(x,y)4噪声n(x,y),随机性的,可以用随机过程来描述。一般常用统计特征来描述,如均值、方差、相关函数等4均值En(x,y)反映噪声的直流分量4均方值En2(x,y)反映噪声的总功率4均方差E(n(x,y)-En(x,y
20、)2描述噪声的交流功率4均值的平方En(x,y)2,表示噪声的直流功率(2)噪声的来源4外部噪声从处理系统外来的影响,如电磁波干扰4内部噪声(1)由光和电的基本性质引起的噪声(2)机械运动产生的噪声(3)元器件材料本身的缺陷带来的噪声(4)系统内部电路噪声噪声分类4从统计观点看平稳噪声凡是统计特征不随时间变化的;非平稳噪声统计特征随时间变化的。4从噪声幅度分布的统计来看其密度函数有高斯型、瑞利型等,分别称为高斯噪声和瑞利噪声。4按噪声频谱形状命名的,如频谱均匀分布的噪声称为白噪声,频谱与频率成反比的称为1/f噪声,频谱与频率平方成正比的称为三角噪声(3)噪声的模型4加法性噪声g(x,y)=f(
21、x,y)+n(x,y)4乘法噪声g(x,y)=f(x,y)1+n(x,y)=f(x,y)+f(x,y)n(x,y)二、离散模型数字图像处理的几个基本术语4数字化数字化(digitizing)将一幅图像从其原来的形式转换为数字形式的处理过程,包括“扫描”、“采样”与“量化”三个步骤通常将“扫描”合并到“采样”阶段,合并为两个过程扫描(scanning)4将一个数学虚拟网格覆盖在一幅图像上,图像的平面空间被离散化成一个个的有序的格子(格子的形式可以有多种形式,通常易于物理实现的是矩形,且每个格子完全相同),然后按照格子的排列顺序依次读取图像的信息,此读取过程称为“扫描”。在扫描过程中被读取的小块图
22、像称为图像元素(picture element),简称像素(pixel),它的描述包括空间坐标以及图像信息两个部分。不太严格的情况下,扫描也可以用作数字化的等价词。矩形扫描网格常称为光栅(raster)图像数字化像数字化采样列采样行图片像素行间隔采样列间隔灰阶黑灰白0128255物理图像19643灰度像素数字图像物理物理图像及其像及其对应的数字的数字图像像采样(sampling)4在一幅图像的每个像素位置上测量灰度值。4采样通常是由一个图像传感元件完成,它将每个像素处的亮度转换成与其成正比的电压值。采样完成图像空间的数字化,在CCD摄像机中,是由一个个感光单元实现的。4图像数字化时必须遵守“采
23、样定理”,才能保证图像可恢复 4奈奎斯准则:采样频率必须需大于等于被采样信号的最大频率的2倍量化(quantization)4将采样时测量的灰度值转化成整数表示4由于数字计算机只能处理数字,因此必须将连续的测量值转化为离散的整数。因此在图像传感器后面,经常跟随一个电子线路的模数转换器(ADC),将电压值转化成一个整数4经过数字化得到一幅图像的数字表示,即数字图像f(x,y),f(x,y)以及x、y都是整数几个重要概念41、处理理:让某个事物受到一个过程的作用42、过程程(process):指能导致某个所期望目标的一系列的动作或操作43、数字数字图像像处理理:对一个物体的数字表示施加一系列的操作
24、,以得到所期望的结果44、数字图像的限制性定义:一个被采样和量化后的二维函数(该二维函数由光学方法产生),采用等距离矩形网格采样,对幅度进行等间隔量化一幅数字图像是一个被量化的采样数值的二维矩阵46、显示示(display):由一幅数字图像生成一可见的、直观的图像“回放”、“图像重建”、“硬拷贝”、“图像记录”显示设备有暂时的、永久的两类410、对比度比度(contrast):一幅图像中灰度反差的大小411、噪声噪声(noise):加性的或乘法性的污染412、采采样密度密度(sampling density):图像上单位长度包含的采样点数 像素间距(pixel spacing)=1/采样密度4
25、13、放大率放大率(magnification):图像中物体与其所对应的景物中物体的比例关系414、运算运算(operation):注意运算前后图像之间的对应关系(1)全局运算全局运算:对整幅图像同时处理(2)点运算点运算:由对应点决定(3)局部运算局部运算:由中心像素周围的有关像素决定数字图像,数字化4(1)连续画面空间坐标离散化采样 方形、三角形、正六角形点阵等4(2)采样点(像素)幅值(实数)取整量化 均匀、非均匀/矢量、标量采样点阵1、图像的均匀采样y|x|xy二维采样定理Nyquist采样定理4对于二维有限带宽信号fc(x,y),如果其二维傅立叶变换只在|u|Uc,|v|Vc的范围内
26、不为零,那么采样间隔必须满足x 1/2Uc,y 1/2Vc4这样才能保证信号可以重构2、图像的量化4量化的准则是:若 fi f fi+14则g=gig1 g0 g2 gN-1 0 f0 f1 f2 fN-1 fN fg量化过程量化误差4量化误差4量化失真由量化误差产生的图像失真4最优量化器量化均方误差最小4非线性非均匀采样和量化4非均匀采样灰度级变化大区域精确采样,平滑区域粗采样4非均匀量化灰度级变化剧烈处,人眼分辨力差,边界附近较少灰度级;平缓区域较多灰度级,避免假轮廓3、数字图像的表示4数字图像,矩阵元素:像元 图像元素:像素4电视图像:512512 1284一般图像:256256 64数
27、字图像举例yxg(x,y)矩阵4上图中g(x,y)既可以表示整幅图像,也可以表示x行y列交点处的图像的像素值,g(x,y)的值都是整数4图像的数据量(bit)b=MNk4图像清晰度(可分辨的细节的程度)取决于N和 k。N小,检测板效应;k小,假轮廓只改变灰度级:8、16、32、64、128、256只改变空间分辨率512、256、128、64、32、16邻域4 四邻域4对角邻域4八邻域四邻域与八邻域从数字图像中抽取对称邻域半径=x=y点+的四邻域(a)半径=x=y点+的八邻域(b)连通性44-连通48-连通4m-连通4近邻与通路4连通域4-连通域8-连通域 4像素间距离欧氏距离(DE):(x-s
28、)2+(y-t)21/2城区距离(D4):|x-s|+|y-t|棋盘距离(D8):max(|x-s|,|y-t|)1.4图像显示4图像显示4图像显示设备:显示器,打印设备等4半调输出4半调输出示例4抖动技术1.5图像存储与格式4图像存储4存储量单位:比特(bit)字节B(8bit)千字节KB(103B)兆MB(106B)吉GB(109B)太TB(1012B)4存储器示例快速存储器 联机存储器 数据库存储器4图像数据存储格式矢量形式光栅形式4图像文件格式BMP格式GIF格式TIFF格式JPEG格式常见图像存储格式英文名称 类型说明Bit-Mapped format*.BMPMicrosoft W
29、indows标准格式Graphical interchange format*.GIFCompuSever图形格式Tagged image file format*.TIFDOS,UNIX 及Macintosh图像Joint photographic experts group*.JPG国际压缩标准,JPEG,JPEG2000Encapsulated PostScript*.EPS出版业使用格式1.6*视觉基础4视觉生理/视觉特性/视觉模型4视觉基础/视觉应用4它们与图像研究的关系见下图视觉研究与图像的关系视觉研究基础研究视觉心理现象法则(心理学)视觉信息加工机理(生理学)应用研究视环境的改善
30、和视机能应用(照明工程学、人类工程学)图像改善和评价(图像工程)模拟视觉机能的信息处理(信息工程、人工智能心理测定模拟技术1、图像质量评价与视觉心理4对图像质量的最终评价是由人的感觉器官和心理状态来决定的。与图像内容以及观察者的心理因素有关4从图像信息传输角度出发,图像系统评价的真正尺度应该是发出信息者的意图为接收信息者所理解的程度,而不是对发出信息者发出的图像象素信息集合的简单接收2、画面组成和视觉心理4视野指眼球不动时所能见到的范围如果把注视点作为中心,可见的范围上方约65,下方约75,左右视角约为104(现在的电视画面约占78),但视力好的部位仅限于中央23左右4为了适应大的画面和立体景
31、象的机理,眼球必须转动使视线移动中心视力分辨率强,可以进行图像细节的认识周边视力分辨率差,可以将视目标特征部分检出,利用检出的目标图像特征去控制眼球运动另外周边视可以认识图像的全貌,而中心视只能认识图像的一小部分要产生充分的临场感,画面尺寸应该产生30以上视野,如宽银幕电影3、视觉的时空频率分析4影响图像锐度的主要因素。视觉神经具有的Mach效应和RocaSulzer微分效应,中枢神经的Craik-Obrien积分效应等是视觉信息处理的基础,因此可以将视觉特性和图像处理结合起来研究4空间分辨力人眼对空间景物细节的分辨能力有限,对黑白图像约为一度4时间分辨力对亮度的响应有时延和残留,因而对景物亮
32、度的变化也有分辨力,过快的变化无法分辨视觉惰性。当离散画面的重复频率不低于24Hz时,可形成连续画面的感觉,即人眼不能分辨相邻两幅画面间的差别,而低于24Hz时,有闪烁感4、视觉的时空频率分析4人眼对画面静止部分的分辨率高于活动部分对静止部分减少时间分辨率,而对活动部分减少空间分辨率,可以达到数据压缩的效果。4幅度分辨力人眼对景物亮度层次的分辨力也有限,过小的亮度差别无法分辨。4对彩色图像的色调和饱和度的分辨力人的视觉对彩色细节的分辨力要比亮度细节差,在国际无线电咨询委员会(ITU-R,原CCIR)601标准中,就利用了这种特性,将色差信号的空间分辨率减半,仍可以得到非常好的图像质量。4对立体
33、图像的景深分辨力等5、视觉生理和模型的研究4视觉生理指视觉信息的产生部分视细胞(图像信息感受器)和其它神经细胞以及大脑高级中枢的神经系统的信息产生、传输和处理的机理插入单个细胞的微小电极侧抑制现象、马赫效应等对大脑高级神经中枢的“思考过程”才刚起步人类视觉机制今后的研究方向4从基础研究逐步转到和图像相关的视觉综合化、体系化的研究搞清决定图像质量的主观因素,做出其总的结构模型找出人脑真正接收信息的容量,大脑有效接收图像的显示方式弄清图像信源和信宿的结构,建立起包括人的因素在内的信息论研究视觉和其它感觉的相乘作用,即视觉和其它感觉的互相影响开发自组织作用的综合研究,进一步建立发展“思考过程”研究视
34、觉和行为的关系人类视觉感知过程4人眼结构4眼睛中图像的形成4视觉特性人眼的结构视觉生理特点对图像处理方法的影响很大4锥状(状(cone)视觉:白昼视觉,色彩4杆状(杆状(rod)视觉:夜视觉,低照度敏感 视锥细胞和视杆细胞在视网膜上的分布眼睛中图像的形成4成像的几何原理4视觉信息的产生4视觉信息的传递4视觉信息的加工处理(1)成像的几何原理4当晶状体的折射能力由最小变到最大时,晶状体的聚焦中心与视网膜之间的距离由17mm缩小到14mm。当眼睛聚焦到远于3m的物体时,晶状体的折射能力最弱,当聚焦到非常近的物体时,其折射能力最强用眼睛观察树的光学表示法,C点为晶状体的光学中心成像尺寸计算4观测者看
35、一个距离100m,高15m的树:设x表示视网膜上形成的图像的大小,单位mm,则有15/100=x/17,x=2.55mm(2)视觉信息的产生4光化电过程4色觉理论主要有两种三色学三种视色素,对光的影响峰值分别在红、绿、蓝区,综合后形成色觉信息四色学说三对视色素(白-黑,红-绿,黄-蓝),它们的组合响应产生色觉信息人类感光细胞的敏感曲线4三种不同频率响应的锥,各对红、绿、蓝具有最强的响应,彩色的识别功能400 450 500 550 600 650 700100806040200蓝绿红波长(nm)光吸收特性%(3)视觉信息的传递4眼球内4眼球外(4)视觉信息的加工处理4简单型细胞检测图像的明暗边
36、界和线条的位置和方向,4复杂型细胞对直线和边界的运动方向敏感,低级超复杂型细胞检测直线和边界的长度、宽度,而高级超复杂型细胞可以检测曲线和边缘曲度等视觉特性4亮度适应与鉴别4分辨力4对比灵敏度4同时对比效应4阈值效应和掩盖效应4视觉运动特性4视觉空间频率特性4视觉时间频率特性主观亮度感受特性 分辨力4 在不同的亮度适应级,人眼的分辨力不同,如图所示,I是背景光强,I是光强的变化,称log(I/I)为韦伯比,表示光强分辨力 光强分辨力的典型韦伯比对比灵敏度II+II/I强度I2%具有恒定背景的对比灵敏度同时对比效应4心理学实验表明,人眼感受到的亮度不是光强的简单函数,如马赫带效应和同时对比效应强
37、度II/II0I+II2%具有可变背景的对比灵敏度马赫带效应同时对比效应视觉阈值效应和掩盖效应4视觉阈值正好可以被看到的刺激(干扰或失真)值,它是一个统计值,在图像质量的主观评价中有广泛的应用4掩盖效应4视觉阈值随图像内容的变化而变化,在平坦区阈值低,对失真也敏感;在边缘和纹理区,视觉存在掩盖效应,对失真不敏感视觉运动特性4周边视力对图像中运动变化部分很灵敏,有特征抽取作用,从而控制眼肌转动视轴,使视力集中对准这些部位,以便看清其细节4电视眼球标记摄像机(television eye-marker camera)试验视觉空间频率特性4亮暗在空间上作正弦变化的条纹图案,物理对比度和感觉对比度之比
38、随空间频率变化而变化的曲线,称为调制传递函数MTF(Modulation Transfer Function)对比灵敏度1000100101 10 100典型MTF曲线空间频率/cdeg-1闪烁对MTF的影响闪烁频率为1HZ闪烁频率为6HZ闪烁频率为16HZ闪烁频率为20HZ对比灵敏度300100 301030.3 1 3 10 30空间频率/cdeg-1视觉时间频率特性1 2 5 10 20 50 Hz视觉阈值0.01 0.1时间频率特性时间频率/Hz视觉的简单数学模型4亮度视觉模型4彩色视觉模型1、亮度视觉模型4输入图像Ii(x,y)光学系统H(x,y)输出图像Io(x,y)线性光学系统光
39、学系统的调制传递函数MTF 神经信号光接受器对数线性系统黑白视觉对数模型简单的黑白视觉对数模型号数-2-4侧抑制结构LOGa1LOGanLOGa2网膜信号感受器加权因子LOGa1LOGa0LOGan视觉信息的融合inout|H2(Wx,Wy)|H1(Wx,Wy)|H1(Wx,Wy)H2(Wx,Wy)H3(Wx,Wy)光感受器线性系统线性系统线性系统非线性网络|H3(Wx,Wy)|黑白视觉扩展模型ThomasYoung三色假说 g3g1g2d3d2d1e3e1e2线性系统-黄绿色视锥感受器蓝色视锥感受器绿色视锥感受器LOGLOGLOG+-+H2(Wx,Wy)H1(Wx,Wy)H3(Wx,Wy)神
40、经信号彩色视觉模型2、彩色视觉模型彩色响应4在上图模型中,e1、e2、e3代表视网膜三个具有S1()、S2()、S3()谱灵敏度的感受器,其输出分别为4C()为入射光谱的能量分布函数彩色信息融合4e1、e2、e3经对数传递后合并为d1、d2、d3并输出:波长(nm)S1()S2()S3()相对灵敏度1.00.50450 500 550 600 650根据Konig数据得到的视网膜锥状细胞的色谱灵敏度曲线色谱灵敏度曲线彩色视觉扩展型模型线性系统-+-黄绿色视锥感受器蓝色视锥感受器绿色视锥感受器HE2(Wx,Wy)HE1(Wx,Wy)HE3(Wx,Wy)非线性网络非线性网络非线性网络HL2(Wx,
41、Wy)HL1(Wx,Wy)HL3(Wx,Wy)神经信号1.7*颜色视觉和色度学43个基本颜色红(R,red)、绿(G,green)和蓝(B,blue)4国际照明委员会(CIE),1931年规定3种基本色的波长为R:700nm,G:546.1nm,B:435.8nm三色系统4利用3基色叠加可产生光的3补色:品红(M,magenta,即红加蓝)、蓝绿(C,cyan,即绿加蓝)、黄(Y,yellow,即红加绿)。按一定的比例混合3基色或将1个补色与相对的基色混合就可以产生白色。光的混合满足加色定理彩色加法系统(左)与减法系统(右)颜色特征4区分颜色通常用3种基本特性:辉度(又常用亮度、明度)色调饱和
42、度4色调和饱和度合起来称为色度。颜色可以用辉度和色度共同表示坐标系4颜色还可以用色品值r、g、b(相对色系数)表示,定义如下,为组成某种颜色所需的红、绿、蓝的量称为3个刺激量,分别用R、G、B表示:C=rR+gG+bB 其中彩色匹配规则4任何彩色可以用不多于三个基色配成4混合色的光亮度等于各分量亮度之和4人眼不能分解混合彩色的各个分量4在某一亮度等级上的彩色匹配可适用于较宽的亮度范围4彩色相加定律:若一彩色C1与彩色C2相匹配(同样彩色感觉),而彩色C1与彩色C2相混合的彩色匹配,可以如下表示C1=C2,即C1彩色与C2彩色相匹配1C1+2 C2,即一混合色包含1份的C1和2份的C2彩色相加定
43、律表示为 若 C1=C2,C1=C2 则1C1+2 C2=1C1+2 C2彩色匹配4彩色相减:当C1、C2混合色与C1、C2混合色相匹配时,若C2与C2相匹配,则C1和C1也匹配,即已知 C1+C2=C1+C2,若 C2=C2,则 C1=C14转移定律:若C1与C2 匹配,C2 又与C3匹配,则C1与C3匹配,即已知C2=C1,C2=C3,则 C1=C34匹配定律(Grassman定理):在亮度既不太高,也不太低的条件下,有三种配色方案 C=1C1+2 C2+3C3 C+1C1=2 C2+3C3 C+1C1+2 C2=3C3 色度图色品坐标系4xyz相对三色系数(色品坐标)4x+y+z=1,(
44、x,y)CIE色度图4对应于 x=y=0.33的 E点,称等能量点,为CIE标准白光0.800.20.8xy520nm700-770nm红蓝绿NTSCPAL紫 色度图通用的彩色模型4RGB模型4HSI模型RGB模型(1)RGB模型4视觉生理模型4色调(H,Hue)、色饱和度(S,Saturation)以及明度(I,Intensity)(Museum,孟塞尔颜色系统)4在特定应用环境中,用于图像分析有特殊的优势在只有光照亮度发生变化的应用中,不考虑明度,只使用色度进行区域分割(2)HSI模型RGB到HSIHSI到RGB 颜色特征丰富了图像处理的方法4色彩的识别,色彩分解,提取特征。4滤色镜,遥感
45、、着色后细胞红绿蓝红黄绿蓝紫4、其他颜色空间(模型)4(1)YUV模型:适用于PAL和SECAM彩色电视制式,Y:亮度,U,V表示色差4()YCbCr:以演播室质量标准为目标的CCIR601编码方案采用的颜色模型,Y:亮度,Cb和Cr表示色度4(3)YIQ:适用于NTSC彩色电视制式,Y:亮度,I和Q表示色度4(4)L*u*v*:CIE1976发布,L*:米制明度,u*和v*表示米制色度(色度和饱和度)4X,Y,Z是所考察颜色对应的三基色的三个刺激量,X0,Y0,Z0是该颜色在完全漫反色时的三个刺激值4 两种颜色的色差为4(5)L*a*b*:也是CIE1976发布,L*:米制明度,a*和b*表示米制色度(色度和饱和度),分别表示该颜色中红色和黄色所占的比重4两种颜色的色差为a*和b*表示该颜色中红色和黄色的补色所占的比重本章要点41.1有关图像和像素的基本概念41.2图像技术的三个层次:图像处理、图像分析和图像理解41.3图像表示方法和邻域的概念41.4图像显示设备和技术41.5图像存储器和图像文件格式41.6视觉基础和亮度知觉41.7颜色视觉和色度学
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100