资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数字图像处理,*,内容简介,几何变换,图像分割,图像平滑与锐化,形态学处理,图像压缩与编码,图像特征提取,颜色,形状,纹理,高级数字图像处理,光流分析,兴趣点提取,基于内容的图像检索,1,数字图像处理,内容简介,数字图像处理的基础知识,概念、特点,编程语言、应用,图像的统计特性,图像文件格式,图像质量的评价标准,2,数字图像处理,数字图像处理绪论,数字图像处理目的,数字图像处理内容,数字图像处理应用,3,数字图像处理,数字图像处理目的,对于数字图像处理的理解可以分为两种,一是借助于专业的图像工具进行处理,二是使用某种计算机语言进行编程,面向终端用户,面向专业编程,Windows,自带的画图程序,Adobe,公司的,Photoshop,软件,C+,Java,数字图像处理目的,6,数字图像处理,Windows,自带的画图工具(,Paint,),7,数字图像处理,Windows,自带的画图工具(,Paint,),Paint,工具最大的特点就是,简单,,并且不失一般通用的数字图像处理功能,绘制直线,使用指定颜色进行区域填充,将指定图像设置为,Windows,桌面主题背景,显示栅格以进行像素信息的精细调整,处理从数码相机或扫描仪得来的图像,将图像作为电子邮件附件进行发送,关于,Lena,图像,,其来源一般不为人所知,相应的出处可以在互联网上查询到,这也是比较有趣的现象,在学术界曾引起不小的争执,8,数字图像处理,Adobe,公司的,Photoshop,软件,9,数字图像处理,Adobe,公司的,Photoshop,软件,Photoshop,主要处理以,像素,所构成的数字影像,利用其广泛的编辑与绘图工具,可以更有效的进行图片编辑工作。,独特的历史记录浮动视窗和可编辑的,图层,效果功能使用户可以方便的测试效果。,对各种,滤镜,的支持更令其用户能够轻松创造出各种奇幻的效果。,Photoshop,被人们认为是,最好,的图像处理软件,也正在被更多的用于处理网络图片。,10,数字图像处理,面向专业编程,目前编程语言很,多,,在选择上并不存在倾向性很强的指导性原则。,有的时候往往基于程序员的,个人喜好,和,编程习惯,,其原因就是运用任意一种语言几乎都能实现所要的目标功能。,设想使用,汇编语言,去开发一个信息管理系统,肯定不会有人说一定不会成功,但也肯定不会有人实际去尝试。,对于数字图像处理来说,一般使用下述三种语言进行编程实现,包括,Matlab,、,Java,和,C+,。,11,数字图像处理,MATLAB,MATLAB,是一种由美国,MathWorks,公司出品的商业数学软件,是一种数值计算环境和编程语言,主要包括,MATLAB,和,Simulink,两大部分,。,MATLAB,基于矩阵(英语:,Matrix,)运算,其全称,MAT,rix,LAB,oratory,,即得名于此。,在,MATLAB,中,有两个,工具箱,,包括,数字图像处理,和,数字信号处理,,提供了非常强大的处理功能。,12,数字图像处理,MATLAB,往往一个数字图像处理算法,如果用,C+,编写,可能需要上千行代码,而在,MATLAB,中只需要一个函数就可以实现,这都要归功于,MATLAB,所提供的强大的,工具箱,。,MATLAB,特别适合数字图像处理相关的,算法设计,,但是其执行效能很低,在实际应用中往往需要将,MATLAB,代码转换为,C+,代码。,鉴于,MATLAB,工具包的强大,本书提供了与,MATLAB,的,接口实现,。,13,数字图像处理,Java,Java,是一种可以撰写跨平台应用软件的面向对象的程序设计语言,由,Sun,公司的,James Gosling,等人于,1990,年代初,开发,。,Sun,公司对,Java,编程语言的解释是:,Java,编程语言是个简单、面向对象、分布式、解释性、健壮、安全、与系统无关、可移植、高性能、多线程和动态的语言,。,在应付数字图像处理问题方面,,Java,和,C#,应该说没有太大的特色和优势,既没有,MATLAB,功能强大的工具箱,也没有,C+,语言所带来的编程灵活和运行效率高的优点。,14,数字图像处理,C+,C+,是一种使用非常广泛的电脑程序设计语言,是一种静态类型检查的,支持多范型的,通用,程序设计语言,。,有一部分,Unix/C,程序员对,C+,语言深恶痛绝,他们,批评,的理由如下:,1,),标准模板库,STL,以非常丑陋的方式封装了各种数据结构和算法,写出来的代码难以理解、不美观;,2,),C+,编译器,复杂和不可靠,不适合构建人命关天型的程序;,3,)一部分认为,面向对象技术,徒增学习成本,不如面向过程的,C,语言简单容易使用。,15,数字图像处理,C+,数字图像处理的一个,显著特征,就是数据量大,要求计算机语言具有运算速度快、可以灵活编程等特点,这恰恰就是,C+,语言的特点。,众所周知,在高级编程语言中,C+,所编译的程序是最快的,,但是,这种快的优点是基于,C+,语言特性(指针)之上,在编程中往往会表现为一种双刃剑的作用,快但不安全,。,Microsoft Visual C+,OpenCV,16,数字图像处理,Microsoft Visual C+,本书所使用,的,版本是,Microsoft Visual C+,2008,Microsoft Visual C+,(简称,Visual C+,、,MSVC,、,VC+,或,VC,),是,微软公司,的,C+,开发工具,具有集成开发环境,可提供编辑,C,语言、,C+,以及,C+/CLI,等编程语言,。,Visual C+2008,Express,Visual C+2008,Standard,Visual C+2008,Professional,Visual C+2008 Team System,OpenCV,的全称是,Open Source Computer Vision Library,,是一个跨平台的计算机视觉库,。,基于,OpenCV,的强大功能和易用性,本书,在提供,了与,OpenCV,的,接口,。,17,数字图像处理,数字图像处理内容,底层图像处理技术,中层图像处理技术,高层图像处理技术,纹理,RGB,YIQ,HSV,傅立叶描述子,矩不变量,形状因子,结构方法,统计方法,面积,圆度,偏心度,主轴方向,共生矩阵,模型,频谱分析,句法分析,颜色,形状,18,数字图像处理,数字图像处理内容,底层图像处理技术,中层图像处理技术,高层图像处理技术,人脸识别,人脸识别的算法,人脸识别的应用,人脸特征点,整幅人脸,模板,匹配,神经网络,网络应用,门禁系统,视频监控,数码相机,19,数字图像处理,数字图像处理内容,底层图像处理技术,中层图像处理技术,高层图像处理技术,视频事件,的提出是针对底层特征和视频对象的,但是视频事件的分析又建立在底层特征和视频对象分析之上的,“不正常”的事件定义,“用户感兴趣”的事件定义,事件挖掘,事件检索,足球视频分析,事件,是用户感兴趣的具有一定上下文线索并符合特定领域知识模型的高层语义时空实体,20,数字图像处理,数字图像处理应用,图像增强与恢复,基于图像的生物特征识别,基于内容的图像检索,图像序列分析,计算机视觉,21,数字图像处理,图像增强与恢复,图像增强,,就是将原来不清晰的图像变得清晰或强调某些感兴趣的特征,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果的图像处理方法。,图像恢复,,就是指对受到损坏的图像进行修复重建或者去除图像中的多余物体。,图像恢复常用方法包括,偏微分方程方法,、,整体变分方法,、,基于曲率的扩散模型,、高,斯卷积滤波,和,纹理合成方法,。,22,数字图像处理,基于图像的生物特征识别,生物特征识别技术所研究的生物特征包括,脸,、,指纹,、,手掌纹,、,虹膜,、,视网膜,、,声音(语音),、,体形,、,个人习惯,(例如敲击键盘的力度和频率、签字)等,识别技术就有,人脸识别,、,指纹识别,、,掌纹识别,、,虹膜识别,、,视网膜识别,、,语音识别,(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、,体形识别,、,键盘敲击识别,、,签字识别,等,23,数字图像处理,具有表情不变性的人脸识别,24,数字图像处理,指纹识别,25,数字图像处理,基于内容的图像检索,基于内容的图像检索的提出,主要是针对,基于关键字的搜索模式,,后者典型的应用包括互联网上传统的搜索引擎,如,Google,、百度等。,基于内容的图像检索,目的是在给定查询图像的前提下,依据内容信息或指定查询标准,在图像数据库中搜索并查找出符合查询条件的相应图片。,最早成功应用基于内容的图像检索技术的是,IBM,的,QBIC,系统,。,26,数字图像处理,网络图像检索,27,数字图像处理,图像序列分析,图像序列分析,有的时候也称为,视频分析,,就是根据图像本身的内容和图像帧之间的相关性进行目标识别和场景分析,其是静态图像分析在三维空间上的拓展。,动作检测与识别,,也是图像序列分析的一个例子,其在智能监控和多媒体交互等领域有着广泛的应用前景。,有一部分行为检测和识别的研究,是,基于真实的场景视频,,例如好莱坞电影或者是机场监控录像等。,28,数字图像处理,基于图像序列的动作识别,29,数字图像处理,计算机视觉,计算机视觉,目前已经形成一个,独立的学科,,主要指用摄像头和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做数字图像处理,用电脑处理成为更合适人眼观察或传送给仪器检测的图像。,在计算机视觉和数字图像处理领域,有三大国际会议值得关注,几乎所有最新的相关技术都会首先出现在上面,其包括,CVPR,、,ICCV,和,ECCV,。,30,数字图像处理,人眼视线导引摄像头,31,数字图像处理,人眼视线导引摄像头,32,数字图像处理,1.2,基本概念,连续图像,连续图像,也称为模拟图像。连续图像在水平与垂直方向上,像点位置的变化以及每个像点的灰度变化都是连续的。可以认为它是由无数个像点组成的,而且每个点上的灰度值都有无限多个可能的取值。它反映了客观景物的亮度和颜色随空间位置和方向上的变化而发生的连续变化。,数字图像,上述图像进行的两个离散化操作也称为图像数字化处理。通过数字化处理,就可以获得数字图像。在这些小区域上获取图像的亮度作为“样本”的过程就是通常所说的采样。采样过程中获取的亮度样本。值仍然是连续的值。我们还需要将这些值“量化”为整数值。一般地将亮度值均匀地量化成,256,个等级。有两种方法表示从白到黑的量化:一种是,0255,对应由白到黑,另一种是,0255,对应由黑到白。在图像处理时,应该注意,相应系统是采用那一种表示法。,由,(1.1.6),可知,离散图像的宽度,M,是图像矩阵的列数,而高度,N,是行数。今后本书进行处理的所有图像,除特别说明外均指数字图像。,根据图像的不同,可以分为以下三类。,1,灰度图像,当一幅图像具有 灰度级时,常称该图像是,k,比特图像。比如,一幅有,2,8,=256,个灰度级,就称其为,8,比特图像。灰度图像矩阵元素 的取值范围通常为,0,255,,所以,也常称为,256,级灰度图像。,一般地,“,0”,级表示纯黑色,“,255”,级表示纯白色,中间的灰度级从小到大表示由黑到白的过渡。,2.,二值图像,一幅二值图像的二维矩阵仅由为,0,、,1,两个值组成,“,0”,代表白色,“,1”,代表黑色。二值图像通常用于文字、线条图的扫描识别和掩模图像的存储。二值图像可以看成是灰度图像的一个特例。请注意,在图像存储时,即使二值图像其灰度值仍然在,0,255,内,但它仅有两个值:,0,和,255,。所以二值图像在存储时,必须将,0-1,图像序列转化成,255-0,图像序列。,3.RGB,彩色图像,RGB,图像分别用红,(R),、绿,(G),、蓝,(B),三原色的组合来表示每个像素的颜色。图像中的每个像素的颜色值,用,RGB,三原色表示直接存放在图像矩阵中。由于每一像素的颜色需要,R,、,G,、,B,三个分量来表示,所以,RGB,图像的图像矩阵与其它类型的图像矩阵不同,是一个三维矩阵可用,MN3,表示。比如,若表示彩色图像,则在矩阵,(1.1.6),中,是一个三维向量,由表示,R,、,G,、,B,值的,3,个分量组成。,1.2.3,颜色模型,RGB,模型,这个模型基于笛卡尔坐标系,,3,个轴分别为,R,、,G,、,B,,参见图,1-1-2,。我们感兴趣的部分形成一个立方体。原点对应黑色,离原点最远的立方体的顶点对应白色。在这个模型中,从黑到白的灰度值分布在从原点到离原点最远的顶点的连线上。在立方体内其余各点对应不同的颜色,可用从原点到该点的矢量表示。,根据这个模型,每幅彩色图像包括,3,个独立的基色平面,或者说可以分解到,3,个基色平面上。反过来用,3,个独立的基色平面可表示,1,幅彩色图像。一幅“真”彩色,RGB,图像用,24 bit,,即,R,、,G,、,B,三个分量各用,8 bit,表示。这样,一幅“真”彩色,RGB,图像的颜色总数有,16 777 216,种。,HSI,模型,RGB,模型是从物理和光学的角度描述颜色的,而,HSI,则根据人类视觉主观感觉对颜色进行描述。研究与实践均表明,人眼不能直接感觉,R,、,G,、,B,三种颜色的比例,只能通过感知颜色的色度、饱和度和亮度来区分物体。在,HSI,彩色空间中,,H,表示色度,(hue),,,S,表示饱和度,(saturation),,,I,表示强度,(intensity),,即亮度。其中色度和饱和度表示颜色的彩色信息,而,I,决定了像素的整体亮度,与彩色信息无关。,这个模型有两个特点,其一是,分量,I,与图像的彩色信息无关,其二是,分量,H,和,S,与人感受的方式紧密相连。这两个特点使得,HSI,模型非常适合于借助人的视觉系统来感知彩色特性的图像处理算法,由,RGB,到,HSI,的转换公式如下:,也可作相反的转换。,YIQ,色彩系统,YIQ,色彩系统为欧洲的电视系统所采用,其中,Y,是指颜色的明视度,(luminance),,即亮度,(brightness),。其实,就是图像的灰度值,而,I,和,Q,是属于色调,(chrominance),,即描述图像色彩及饱和度的属性。,RGB,与,YIQ,系统之间可以转换,对应关系如下:,1.3,图像的统计特性,1.3.1,基本统计分析量,1.,图像的信息量,一幅图像如果有,k,种灰度值,且各灰度值出现的概率分别为。根据香农,(Shannon),定理,图像的信息量可用如下公式计算:,称,H,为图像的熵。当图像中各灰度值出现的概率彼此相等时,则图像的熵最大。信息量表示一幅图像所包含信息的多少,常用于对不同图像处理方法进行比较。,2.,图像灰度平均值,称图像一块区域中所有像素灰度值的算术平均值为这块区域的灰度平均值。根据算术平均的定义,,MN,图像区域的灰度平均值计算公式如下:,在图像处理中,常常要计算小块区域,比如计算,33,或,55,小块区域的灰度平均值。,3.,图像灰度中值,图像中一块区域的灰度中值,简 称中值是指区域内全部像素的灰度值经过大小排序后处于中间的灰度值。在应用中,计算整幅图像的灰度中值的机会很少。常用的是计算小块区域,比如计算,33,小块或,55,小块的中值。例如下面的,9,个灰度值是某个,33,小块的灰度值排序后的结果:,198,,,156,,,156,,,99,,,98,,,77,,,68,,,45,,,45,处于中间的,98,就是这个,33,小块的中值。,4.,图像灰度方差,一块,MN,图像区域的灰度方差反映了该区域内各像素灰度值与灰度平均值的离散程度。其计算公式如下:,与熵一样,图像灰度方差是衡量图像信息量大小的主要度量指标,也是图像统计特性中最重要的统计量之一。一幅图像的灰度方差越大,图像的信息量也越大。,1.3.2,直方图,概念:,一幅图像的灰度分布图就是它的直方图,(histogram),。直方图中的横坐标是灰度值,纵坐标是该灰度值出现的频率,(,像素的个数,),。所以直方图,H,可用下式:,计算,其中,w,和,h,分别是图像的宽度和高度。下图,1-2-1,是图像,Lena,的直方图,它表示,Lena,图中各灰度值出现的频率,其中频率最高的灰度值是,19,,共,635,次。,1.,直方图的另一种定义,假设一幅连续图像平滑地从中心的高灰度级变化到边缘的低灰度级。我们可以选择某一灰度值,r,,然后定义一条轮廓线。该轮廓线连接了图像上所有具有灰度值等于,r,的点。这种灰度值相等的轮廓线类似于地理中的“等高线”。所得的轮廓线形成了包围灰度值大于等于,r,的封闭曲线。记灰度值为,r,的轮廓线包围区域的面积为,A(r),则当灰度值为,r,时直方图的值,H(r),定义为:,上式的负号是因为面积函数,A(r),是一个递减函数,参见图,1-2-2,。,对于数字图像,的最小值为,1,,所以用差分代替上面的导数,得到:,由上式可知,直方图,H(r),正是灰度值等于,r,的像素个数。所以,这种对连续图像定义的直方图是前面对离散的数字图像直方图定义的推广。,2.,直方图的性质,(1),直方图是一幅图像中各像素灰度值次数或频数统计的结果,它只反映该图像中不同灰度值出现的概率,而不能反映某一灰度值像素所在的位置信息。所以直方图丢失了灰度值的位置信息。,(2),一幅图像唯一地确定一幅直方图。但不同的图像可能有相同的直方图。即图像与直方图之间是一种多对一的映射关系。参见图,1-2-3,,其左图与右图的直方图相等。显然还可以构造出许多直方图相等的图像。,(3),根据直方图的定义可知,当一幅图像看成若干幅子图像拼接而成时,则各子图像直方图之和等于原图像的直方图。,3.,直方图的作用,(1),数字化参数,直方图给出了一个简单且直观的可视化数据。可用于判断一幅图像是否合理地利用了全部允许的灰度级范围。一般一幅数字图像应该利用全部或几乎全部可能的灰度级,否则等于增加了量化间隔。一旦数字化图像的灰度级数少于,256,,丢失的信息将不能恢复。在图像取样量化过程中对超出数字化器处理范围的亮度值将被简单地置为,0,或,255,。由此将在直方图的一端或两端产生尖峰。数字化时对直方图进行检查是一个好办法。可以及早发现问题,以便纠正。,(2),选择边界阈值,假定一幅图像背景是浅色的,前景是一个深色的物体,这类图像的直方图如图,1-2-4,。物体中深色像素产生直方图的左峰,而浅色背景形成直方图的右峰。物体的边界处产生两峰之间的“谷”。选择谷底作为灰度阈值将能分割背景与前景。,1.4,图像文件格式,1.4.1 BMP,图像文件格式,1.BMP,文件结构,位图,(BitMap Picture,,,BMP),文件格式是,Windows,系统交换图形、图像数据的一种标准格式。,BMP,图像的数据由四部分组成,如表,1-3-1,所示。第一部分为位图文件头,BITMAPFILEHEADER,。它是一个结构体,其定义如下:,其中,,WORD,为无符号,16,位二进制整数,,DWORD,为无符号,32,位二进制整数。这个结构的长度是固定的,为,14,个字节。第二部分为位图信息头,BITMAPINFOHEADER,,也是一个结构,其定义如下:,其中,,LONG,为,32,位二进制整数。这个结构的长度是固定的,为,40,个字节。,biCompression,的有效值为,BI_RGB,、,BI_RLE8,、,BI_RLE4,、,BI_BITFIELDS,。这些都是,Windows,定义好的常量。由于,RLE4,和,RLE8,的压缩格式用的不多,今后仅讨论,biCompression,的有效值为,RI_RGB,,即不压缩的情况。,第三部分为调色板,(Palette),,当然,这里是对那些需要调色板的位图文件而言的。真彩色图像是不需要调色板的,,BITMAPINFOHEADER,后直接是位图数据。调色板实际上是一个数组,共有,biClrUsed,个元素,(,如果该值为零,则有,2,的,bi Bitcount,次方个元素,),。数组中每个元素的类型是一个,RGBQUAD,结构,占,4,个字节,其定义如下:,第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值。对于真彩色图像,图像数据就是实际的,R,、,G,、,B,值。下面就,2,色、,16,色、,256,色和真彩色位图分别介绍。,对于,2,色位图,用,1,位就可以表示该像素的颜色,一般,0,表示黑,,1,表示白,所以一个字节可以表示,8,个像素。,对于,16,色位图,用,4,位可以表示一个像素的颜色,所以一个字节可以表示,2,个像素。,对于,256,色位图,一个字节刚好可以表示,1,个像素。,下面两点请读者注意:,(1)BMP,文件每一行的字节数必须是,4,的整数倍。如果不是,则需要补齐。,(2)BMP,文件的数据存放是从下到上,从左到右的。也就是说,从文件中最先读到的是图像最下面一行的左边第一个像素,然后是左边第二个像素,接下来是倒数第二行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面一行的最右边的一个像素。,1.4.2 JPG,图像文件格式,静态图像压缩标准,(Joint Photographic Experts Group,JPG,JPEG),是最为广泛使用的标准。,JPEG,图像具有,24,位彩色处理能力,可以处理照片中微小色彩细节,具有较高的图像质量。和相同图象质量的其它常用文件格式,如,GIF,,,TIFF,,,PCX,相比,,JPEG,是目前静态图像中压缩比最高的。正是由于,JPEG,的高压缩比,使得它广泛地应用于多媒体和网络中。因为网络的带宽非常宝贵,选用一种高压缩比的文件格式是十分必要的。,1.4.3 GIF,图像文件格式,图形交换格式,(Graphics Interchange Format,GIF),这个格式支持,8,位调色板图像,即这种图像只能使用,256,种颜色。因此,通常,GIF,图像只用于色彩比较简单的插图。,GIF,是,Web,及其联机服务上常用的一种文件格式,用于超文本标记语言,(HTML),文档中的索引颜色图像,但图像最大不能超过,64MB,,颜色最多为,256,色。,GIF,图像文件采取,LZW,压缩算法,存储效率高,支持多幅图像定序或覆盖,交错多屏幕绘图以及文本覆盖。,GIF,主要是为数据流而设计的一种传输格式,而不是作为文件的存储格式。换句话说,它具有顺序的组织形式。,GIF,有,5,个主要部分以固定顺序出现,所有部分均由一个或多个块,(block),组成。每个块的第一个字节中存放标识码或特征码标识。这些部分的顺序为:文件标志块、逻辑屏幕描述块、可选的“全局”色彩表块,(,调色板,),、各图像数据块,(,或专用的块,),以及尾块,(,结束码,),。,1.4.4 PNG,图像文件格式,便携式网络图形,(Portable Network Graphics,PNG),集,JPEG,和,GIF,两种图像文件的优点,是未来,Web,图像格式的公认标准。,PNG,图像在性能上比,GIF,图像优越得多,能显示上百万种颜色。这是一种可扩展的文件格式。采用无损压缩,并且支持全彩,(,真彩,),图像。,PNG,支持索引彩色、灰度和真彩色,并提供可选的通道。用来存储灰度图像时,灰度图像的深度可多达,16,位;存储彩色图像时,彩色图像的深度可多达,48,位,并且还可存储多达,16,位的通道数据。,1.5,图像质量的评价标准,图像经过处理后,原图像 与经过处理后的图像 之间存在差异。这个差异如何度量或者说如何评价图像的质量是图像处理中必然遇到的问题。由于人类视觉模型至今尚未完全确立,所以产生两种判别标准:客观评价标准和主观评价标准。客观评价标准建立在图像 与图像 之间的误差计算模型上,而主观评价标准则由一组人群用肉眼对图像的质量打分得到。,1.5.1,客观评价标准,1.,图像间的距离,两幅图像之间的距离就是它们之间的误差。根据应用对象的不同,有各种各样的定义。某些定义之间是等价的,即两者距离相差一个常数倍。但某些定义之间不存在等价关系。,上确界距离主要用于理论计算,很少有实际的应用。均方根距离是最常用的距离。它表示两幅图像之间的平方平均误差。许多其它的距离定义大都与它有关。,2.,客观评价标准,所谓图像客观评价标准,实际就是一种误差估计。下面列举常用的误差估计。,均方误差,MSE,,其计算公式如下:,1.5.2,主观评价标准,主观评价采用平均判分,MOS(mean opinion score),或多维计分方法进行测试。即组织一群足够多的实验人员,通过观察来评定图像的质量。观察者给评定的图像打一定的质量等级,以及与原图像比较等方法,根据不同的质量分为,5,级、,6,级或,7,级的评分制等。最后用平均的方法得到图像的分数。这样的评分虽然很费时间,但比较符合实际。目前,国际标准都采用主观评价。,主观评价与客观评价之间有一定的联系,但不能完全等同。由于客观评价比较方便,有说服力,所以在论文中常被采用。但主观评价很直观,符合人眼的视觉效果。所以,两者均不能偏废。,
展开阅读全文