资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数字图像处理学,第,5,章 图像编码,(第一讲),模拟图像信号在传输过程中极易受到各种噪声的干扰,而且模拟图像信号一旦受到污染则很难完全得到恢复。另外,在模拟领域中,要进行人与机器(计算机或智能机),机器与机器之间的信息交换以及对图像进行诸如压缩、增强、恢复、特征提取和识别等一系列处理都是比较困难的。,所以无论从完成图像通信与数据通信网的结合方面来看,还是从对图像信号进行各种处理的角度来看,图像信号数字化都是首当其冲的重要问题。图像数字化的关键是编码。本章将对图像编码进行较为详细的讨论。,5.1,信源编码,图像编码属于信源编码范畴。其特点是利用图像信号的统计特性及人眼睛的生理和心理特性对图像进行高效编码。,在信息论中将数字通信过程概括为图,51,的形式。,信源,信源编码,信道编码,调制,传输信道,噪声,解调,信道解码,信源解码,信宿,图,51,数字通信系统模型,图,5,1,所示的模型是一个数字通信系统模型。在这样一个模型中有二次编、译码,,信源编码、信源译码,信道编码、信道译码。,信源编码的主要任务是解决有效性问题,,也就是对信源实现压缩处理,使处理后的信号更适宜数字通信系统。解决有效性问题就是在编码过程中尽量提高编码效率,也就是力求用最少的数码传递最大的信息量。,信道编码的任务是解决可靠性问题,。也就是尽量使处理过的信号在传输过程中不出错或少出错,既使出了错也要有能力尽量纠正错误。,因此,在信道编码中往往引进用作误差控制的数码,以实现自动检错和纠错。,图像编码主要是要研究压缩数码率,即高效编码问题,。,编码是信息处理科学中的经典研究课题,就图像编码而言,已有近五十年的历史。近年来,,M.Kunt,提出第一代、第二代编码的概念。,M.Kunt,把,1948,年至,1988,年这四十年中研究的以去除冗余为基础的编码方法称为第一代编码,如:,PCM,、,DPCM,、,M,、亚取样编码法,变换域的,DFT,、,DCT,、,Walsh-,Hadamard,变换编码等方法以及以此为基础的混合编码法均属于经典的第一代编码法。,第二代编码,方法多是八十年代以后提出的新的编码方法,如金字塔编码法、,Fractal,编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。现代编码法的特点是:,充分考虑人的视觉特性;,恰当地考虑对图像信号的分解与表述;,采用图像的合成与识别方案压缩数据率。,这种分法尽管并没得到图像编码界全体同仁的广泛认可,但笔者认为对了解图像编码发展进程是有益的。,图像编码这一经典的研究课题,经五十多年的研究已有多种成熟的方法得到应用,特别是所谓的第一代编码更是如此。,随着多媒体技术的发展已有若干编码标准由,ITU-T,制定出来,如,JPEG,、,H.261,、,H.263,、,MPEG1,、,MPEG2,、,MPEG4,、,MPEG7,、,JBIG(,二值图像压缩,)(Joint Bo-level Image Coding Expert Group),等。相信经广大科技工作者的不懈努力,在未来会有更多、更有效的编码方法问世,以满足多媒体信息处理及通信的需要。,信源编码的目的是提高编码效率。,是否能提高编码效率?,回答是肯定的。,从信息论的角度看,各种信源都存在大量的冗余成分。如果去掉这些冗余成分,就能提高编码效率。所以,,所谓第一代编码就是围绕着去除冗余度这一中心思想实现数据压缩的。,冗余度在那里?,冗余度主要存在于两个主要方面:,1)、存在于信源的相关性之中;,2)、存在于图像信源各个元素出现概率的不均等之中。,因此,无论是记忆性信源还是无记忆性信源都由压缩的可能。,去掉了冗余成分的信源固然精练了,但是,也变得脆弱了。抗干扰性能也变差了。因此,在传书过程中,还要加入一些冗余成分以增加抗干扰能力。这就是信道编码的任务了。,图像编码的分类,图像编码大致可分三类:,1)、,匹配编码;,2)、变换编码;,3)、识别编码:,(1)、匹配编码,这种编码方法是使代码长度与图像信源的概率分布相匹配。如:出现概率大的编短码,概率小的编长码,总的码率就会下降。,这种编码的长短不一,使得传输、译码、存储均不方便,另一个缺点是编码的先决条件是要知道图像信源的概率分布。,解决办法:,1)、寻找一个大体上能代表图像信源的数学模型,如正态分布,指数分布等;,2)、实际统计图像信源的概率分布,这种方法更切合实际,但是,往往找不到合适的数学模型,给分析带来不便。,(2)、变换编码,首先把图像信源从一个空间变换到另外一个空间,然后对变换系数进行编码。变换方式大体上可分为两类;,预测变换,函数变换,(3)、识别编码,这种方法的关键是识别。基本原理是用另外一套符号代替原来的信源中的消息,如:电报、速记等均可认为是识别编码的例子。,主要方法:,a),关联识别,需要一定数量的样本。信息与样本比较,判别相似程度。,b)、,逻辑识别,没有样本,是用逻辑表达式判别被识别对象。,这种编码方法与实际应用还有距离。,从压缩的角度也可以分为;,1)、熵压缩法:不可逆的编码法,压缩中有信息损失,但在视觉角度看失去的信息是无关紧要的信息。,2)、无失真编码:是可逆的编码方法。没有信息损失。,另外,如果从目前已有的实用方案的角度来分类,可以分为三大类,即预测编码,变换编码及统计编码。而这些方法既适用于静止图像编码,也适用于电视信号编码。就具体编码方法而言可简略地概括在表,51,中。,表,51,图 象 高 效 编 码 法,PCM,预测法 正交变换法 统计编码 其他方法,常规编码法,亚奈氏取样编码法,标准法,自适应法,标准法,自适应法,标准法,自适应法,行程编码,轮廓编码,DPCM,M,K-L,HT,DWT,DFT,ST,DCT,霍夫曼,仙农,费诺,最后需要着重提及的是,上述各种具体方案并不是孤立的、单一的使用,往往是各种方法重迭、交叉使用,以达到更高的编码效率,在,ITU-T,的建议标准中这一点尤为突出。,5.2,图像编码中的保真度准则,图像信号在编码和传输过程中会产生误差,尤其是在熵压缩编码中,产生的误差应在允许的范围之内。在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。通常,这种衡量的尺度可分为客观保真度准则和主观保真度准则。,5.2,.1,客观保真度准则,5.2,.2,主观保真度准则,5.2,.1,客观保真度准则,通常使用的客观保真度准则有输入图像和输出图像的均方根误差;输入图像和输出图像的均方根信噪比两种。输入图像和输出图像的均方根误差是这样定义的。设输入图像是由,N,N,个像素组成,,令其为,f,(,x,y,),,其中,x,y,=0,1,2,3N-1 。,这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像。这里令重建图像为,g,(,x,y,)。,它同样包含,N,N,个像素,并且,x,y,=0,1,2,N,-1,在 0,1,2,3.,N-1,范围内(,x,y,),处,的任意值,输入像素和对应的输出图像之间的误差可用下式表示,而包含,N,N,象素的图像之均方误差为,(52),(51),由式,(52),可得到均方根误差为,(53),如果把输入、输出图像间的误差看作是噪声,那么,重建图像,g,(,x,,,y,)可由下式表示,(54),在这种情况下,另一个客观保真度准则,重建图像的均方信噪比如下式表示,(55),均方根信噪比为,(56),5.2.2,主观保真度准则,图像处理的结果,绝大多数场合是给人观看,由研究人员来解释的,因此,图像质量的好坏与否,既与图像本身的客观质量有关,也与人的视觉系统的特性有关。,有时候客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则。这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。,一种方法是规定一种绝对尺度,例如:,()优秀的:具有极高质量的图像;,()好的:是可供观赏的高质量的图像,,干扰并不明显;,()可通过的:图像质量可以接受,干扰,不讨厌;,()边缘的:图像质量较低,希望能加以改,善,干扰有些讨厌;,()劣等的:图像质量很差,尚能观看,干,扰显著地令人讨厌;,()不能用:图像质量非常之差,无法观看。,另外常用的还有两种准则,即妨害准则和品质准则。,妨害准则如下五级:,()没有妨害感觉;,()有妨害,但不讨厌;,()能感到妨害,但没有干扰;,()妨害严重,并有明显干扰;,()不能接收信息。,品质准则如下七级:,()非常好;,()好;,()稍好;,()普通;,()稍坏;,()恶劣;,()非常恶劣。,除此之外,还可以采用成对比较法,也就是同时出示两幅图像,让观察者表示更喜欢哪一幅图像,借此排出图像质量的等级。也有采用随机抽取法来评定图像质量的。这种方法是把数量相等的原始图像和经编译码后的图像混杂在一起,然后让观察者挑出他认为质量差的图像。,质量较差的图像可定义为处理过的图像,然后统计错挑的概率,显然错挑概率越大说明图像经处理后的劣化越小。总之,主观保真度评价方法的准则可不同,但其基本原理都一样,当然,对观察者的视觉条件应有一定的要求。,5.3,编码,5.3,.1,PCM,编码的基本原理,5.3,.2,PCM,编码的量化噪声,5.3,.3,编码器、译码器,5.3,.1,PCM,编码的基本原理,脉冲编码调制(,Pulse coding ModulationPCM,)是将模拟图像信号变为数字信号的基本手段。图像信号的,PCM,编码与语音信号,PCM,编码相比并没有原则上的区别。但是,图像信号,特别是电视信号占的频带宽,要求响应速度快,因此,电路设计与实现上有较大的难度。,图像信号,PCM,编、译码原理方框图如图,52,所示。图像信号,PCM,编码由前置低通滤波器、取样保持电路、量化器、编码器组成。,图像,低通滤波,取样保持,编码,传输信道,解码,低通滤波,解码图像,量化,图,53,PCM,编、译码原理方框图,限制频带,防止折叠误差,时间离散化,幅度离散化,多值变多比特,多比特变多值,内插及平滑,前置低通滤波器的作用:,1)、为满足取样定理的带限要求,以减少折,迭误差;,2)、对杂散噪声也有一定的抑制作用,。,取样保持电路:,将完成把时间上连续的模拟信号进行时间离散化的任务。取样周期由奈奎斯特(,Nyquist,)定理限定。,量化器:,把模拟信号的幅值离散化,经取样与量化处理后就可产生多值数字信号。,编码:,把多值的数字信号变成二进制的数字的多比特信号,以便传输或进行后续处理。,译码器的原理比较简单,它包括一个译码电路和一个低通滤波器。,译码器:,把数字信号恢复为模拟信号,这个模拟信号就是在接收端的解码图像信号。,滤波器:,内插和平滑作用。,5.3,.2,PCM,编码的量化噪声,量化是对时间离散的模拟信号进行幅度离散化的过程,这个过程是去零取整的过程。量化后的样值与原信号相比大部分是近似关系。这样,把连续的数值限制在固定的台阶式的变化之下必然会带来畸变。这种畸变在接收端是无法克服的,只能使其尽量减小。,图,54,量化噪声与过载噪声的形成,由量化带来的噪声可分为量化噪声和过载噪声。以正弦波输入为例,输入幅度较大和输入幅度较小时的量化噪声如图,53,所示。,(,a),是输入信号超过编码范围时的量化噪声和过载噪声的形成;,(,b),是信号未超过编码范围,只有量化噪声的情况。,在,PCM,编码中,量化噪声主要取决于码的位数,码位数越多(即量化阶数多)量化噪声的功率越小。一个量化阶的电压可由下式表示:,(57),式中:,V,为输入信号电压;,n,为样值用二进制数表示的比特数。,如果在整个输入幅度内量化阶是一个常数,就称这个量化为均匀量化,否则就是非均匀量化。线性,PCM,编码中均采用均匀量化法。在均匀量化中,设量化阶为,,量化噪声在 内可看成是均匀分布的,因此,其功率可由下式表示:,(58),对于过载噪声,当量化特性输入过载点为,V,时,由下式表示,(59),式中,N,s,为过载噪声,,x,是输入信号值,,p,(,x,),为输入幅度的概率密度。如果用信噪比作为客观保真度准则的话,可推得,PCM,编码在均匀量化下的量化信噪比如下:,因为,所以,(510),由信噪比的概念,则:,(,511,),由式,(511),可见,,每增加一位码可得到,6,dB,的信噪比得益。,值得注意的是量化噪声不同于其他噪声,它的显著特点是仅在有信号输入时才出现,所以它是数字化中特有的噪声。一般情况下,直接测量比较困难。,5.4,.3,编码器、译码器,编码器的任务是把一个多值的数字量用多比特的二进制量来表示。如果量化器输出,M,个值,那么,对应于,个值中的任何一个值编码器将给定一个二进制码字。这个码字将由,m,个二进制数组成。通常情况下,M,=2,m,。编码器的输入与输出关系是一一对应的,其过程是可逆的,因此,不会引入任何误差。,线性,PCM,编码一般采用等长码,也就是说每一个码字都有相同的比特数。其中用得最为普遍的是自然二进码,也有用格雷码的。以,M,=8,为例的自然二进码和格雷码列入表,(52),。,表,5.2 M=8,的自然二进码和格雷码,输入,自然二进码,格雷码,0 0 0,0 0 0,0 0 1,0 0 1,0 1 0,0 1 1,0 1 1,0 1 0,1 0 0,1 1 0,1 0 1,1 1 1,1 1 0,1 0 1,1 1 1,1 0 0,(a)(b),(c)(d),(e)(f),图,54,编码位数对画面质量的影响,534 非线性,PCM,编码,在线性,PCM,编码中,量化阶是均匀的。这样,在小信号输入的情况下信噪比较低,在大信号输入的情况下信噪比较高。为了改善小信号在量化过程中的信噪比,采用一种瞬时压缩扩张技术。,。,这种技术实际上是降低大信号时的信噪比提高小信号时的信噪比,其结果是在不增加数码率的情况下,使信号在整个动态范围内有较均衡的信噪比,瞬时压扩技术基本有两种方案。一种是如图,57,所示的方案。在这种方案中,首先将取样后的,PAM,信号进行非线性压缩,然后对压缩后的,PAM,信号进行线性编码。在接收端,首先进行线性译码,然后再送入瞬时扩张器进行非线性扩张,恢复原来的,PAM,信号。,量化,压缩,取样,编码,扩张,译码,输出,该方案一般采用二极管电压、电流的非线性特性来实现。通常采用图,58,所示的修正的对数特性。在图,58,中,对于压缩器来说,,X,表示输入,,Y,表示输出。对于扩张器来说,,Y,表示输入,,表示输出。参变量是表示压缩或扩张程度的量。显然,当,=0,时就是线性编码了。,另外一种方案是数字化非线性压扩技术,,这种方案是把编码与压缩,译码与扩张都分别在编码和译码中一次完成。,量化,采样,低通,编码及压缩,低通,译码及扩张,输出,数字式非线性编码的压扩特性有,特性、,A,特性等等。,根据,CCITT1970,年的建议,通常采用,13,折线,(,A,=87.6),的压扩特性。,13,折线压扩特性如图,510,所示。由图中可见,各段折线的斜率是不一样的;,4,至,8,段的小信号区的信噪比都得到了改善。图中的,x,表示压缩器的输入,,y,表示压缩器的输出,,V,为过载点电压。,1,7/8,5/8,4/8,3/8,2/8,2/8,(,1,),(,2,),(,3),(,4,),(,5,),(,6,),(,7,),(,8,),图,510 13,折线压扩特性,(,信号为正时的八段,),6/8,各折线的斜率列于表,53,中。,表,53,各种线段斜率表,折线段,1 2 3 4 5 6 7 8,斜 率,图,510,只画出了信号在正半周时的情况,负半周时也一样。由于正半周的,7,、,8,两段和负半周的,7,、,8,两段斜率都一样,所以在整个特性中这四段连成一条直线。因此,总共有,13,条直线段,简称,13,折线。,如果令 ,上述,13,折线可用下式近似表示,(514),(515),式中,A,是一常数,不同的,A,值可决定一条不同的曲线。在原点处的斜率由下式表示,(516),当原点处的斜率为,16,时,则,可求得,A,=87.6,。图,510,所示的折线就是,A,=87.6,的,13,折线压缩特性。,总的来说,如果采用第一种方案,当,=100,时,在输入信号最小情况下信噪比可提高,26dB,,当采用第二种方案时,在,A,=87.6,的情况,最小信号输入时的信噪比改善大约,24dB,。可见,两种方案的效果基本相似,在小信号输入情况下,信噪比的改善是很显著的。,
展开阅读全文