资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数字图像处理,一、序言,1.,为什么要进行图像压缩?,图像的数据量巨大,对计算机的处理速度、存储容量要求高。,必须减少,/,压缩数据量,传输信道带宽、通信链路容量一定,需要减少传输数据量,提高通信速度,采用编码压缩技术,PAL Colour Video,:,768,576,24,25,=,265.4Mbit/s,1.5 Hour Colour Video Image,:,265.4Mbit,6,0,9,0=,1433Gbit,高清晰度电视,HDTV,:,1280,720,24,60=,1327Mbit/s,电话通道:,28.8Kbit/s,ISDN,通道,:10Mbit/s,1.5Mbit/s,64Kbit/s,2.,实现图像压缩的依据,数据冗余,数,据冗余的概念,数据是信息的载体,同量的数据可表达不同量的信息,同量的信息可用不同量的数据表达,冗余,数据表达了无用的信息,数据表达了已表达的信息,相对数据冗余,(数据冗余可定量描述),相对冗余:,压缩率:,C,R,在开区间,(0,),中取值,n,1,和,n,2,代表,2,个数据集合中的信息载体单位的个数,(2),像素间冗余,图像像素间的相关性造成信息冗余。,空间冗余,:邻近,像,素灰度分布的相关性很强,时间冗余:,序列图,像,帧间画面对应,像,素灰度的相关性很强,频间冗余:,多谱段图,像,中各谱段图,像,对应,像,素之间灰度相关性很强,规则,冗余大,不规则,冗余小,(3),心理视觉冗余及其他,应用环境允许图像有一定程度失真,因人而异,因应用要求而异,心理视觉冗余,眼睛对某些视觉信息更敏感,人对某些视觉信息更关心,心理视觉冗余与实在的视觉信息有联系,发生损失不可逆转。,接收端图像设备分辨率较低,则可降低图像分辨率。,应用方关心图,像,区域有限,可对其余部分图,像,可采用空间和灰级上的粗化。,3.,如何实现图像压缩?,编码,是用符号数码元素表示信号、消息或事件的过程。,图像编码,采用对图,像,的新的表达方法以减小所需的数据量,数据和信息,:数据是信息的载体,对给定量的信息可用不同的数据量来表示,对给定量的信息,设法减少表达这些信息的数据量称为,数据压缩,图像压缩过程,就是,编码过程,,,解压缩过程,就是,解码过程,。,4.,图像压缩(编码)的分类,压缩技术分为无损压缩和有损压缩。,无损压缩,:在解码时可以精确地恢复原图像,没有任何损失。压缩比小。,有损压缩,:在解码时只能近似原图像,不能无失真地恢复原图像。压缩比大。,失真:,编码输入图像与解码输出图像之间的随机误差。,压缩比:,指原图像比特数与压缩后图像比特数之比。,举例:,张三先生现在北京出差,住在友谊宾馆,计划明天坐飞机回广州,收到信息:“,你的妻子王女士将于明天晚上,7,点,05,分在广州新白云机场接你。,”,简化,1,:,你的妻子明晚,7,点,05,分在新白云机场接你,。,(,信息无损,),简化,2,:,王女士明晚,7,点机场接你,。,(,信息有损,),二、图像压缩的评价,1.,图像压缩的质量评价标准,在图像压缩编码中,解码图像与原始图像可能会有差异,需要评价压缩后图像的质量。,保真度,(,逼真度,),准则:,描述解码图像相对原始图像的偏离程度,对信息损失的测度,常用的准则可分为两大类:,客观保真度准则,和,主观保真度准则,。,(1),客观保真度准则,最常用的客观保真度准则是原图像,f,(,x,y,),和解码图像,之间的均方根误差和均方根信噪比两种。,点,误差,图,误差,均方根误差:,均方信噪比:,实际常使用,归一化信噪比,(单位:分贝,,dB,),其中,,峰值信噪比,不能很好反映图像的实际视觉失真,。,因为客观保真度是,种统计平均意义下的度量准则,对于图像中的细节无法反映出来。,(2),主观保真度准则,常用的方法:对一组,(,不少于,20,人,),观察者显示图像,并将他们对该图像的评分取平均,用来评价一幅图像的主观质量。,主观评价具有一定的不确定性。,2.,图像压缩算法的编码效率,编码效率的测量,往往需要定义一些所谓,“,标准图像,”,。,压缩比,:,bpp:bits per pixel,传输比,:,bps:bits per second,3.,图像编码模型,信源编码器的作用是减少或消除图像中的编码冗余、像素间冗余及心理视觉冗余。,信道编码器,通过把可控制的冗余加入信源编码后的码字以减少信道噪声的影响。,信道编码器的作用在信道有噪声或易产生误差时,对整个编解码过程非常重要。,图像编码主要是研究信源编码。,信源编码器,信道编码器,信道解码器,信源解码器,信道,输入图,输出图,三、信息论简介,1.,信息量,假设:信息的产生是一个概率过程,一个发生概率为,P,(,E,),的随机事件,E,包含的,信息,是,I,(,E,),称为,E,的自信息(随概率增加而减少),特例:如果,P,(,E,)=1,(即事件总发生),则,I,(,E,)=0,。,信息的单位:,比特,(,log,以,2,为底),1,个比特:即,2,个相等可能性的事件之一发生,2.,信息系统,信源:指能够产生信息的事物。,信源通过信道与信宿(即信息用户)连通以传递自信息,数学表达:,信源是一概率场,信源符号集,A,=,a,1,a,2,a,J,信源产生事件,a,j,的概率为,P,(,a,j,),概率矢量:,u,=,P,(,a,1,),P,(,a,2,),P,(,a,J,),T,用,(,A,u,),可以完全描述信源,信源,信宿,信道,平均信息,产生单个信源符号的自信息:,I,(,a,j,)=log,P,(,a,j,)(7-1),产生,k,个信源符号,符号,a,j,平均来说将产生,kP,(,a,j,),次,信源的平均信息(熵或不确定性),:,(7-2),定义了观察到单个信源符号输出时所获得的平均信息量,一幅,8,比特,灰度图像,的平均信息:,其中,p,(,a,i,),表示像素,u,取,a,i,值的概率,,a,i,的取值范围为,02,8,-1,。,信道信息,信源的输出是一个离散随机变量,信道的输出也是一个离散随机变量,信道符号集:,B,=,b,1,b,2,b,K,概率矢量:,v,=,P,(,b,1,),P,(,b,2,),P,(,b,K,),T,用,(,B,v,),可以完全描述信道输出和用户接受到的信息,信道输出概率,P,(,b,k,),和信源,u,的概率分布,信道传递矩阵,输出符号集的概率分布,条件熵,平均条件熵,互信息,信道容量,3.,互信息,四、基本编码定理,定义编码效率,式中分子是信息熵,而分母则表示代码的平均熵。,冗余度为,编码目的:,编码后输出的平均码长尽量最小,编码效率,尽量趋近,1,冗余度,R,d,趋于零。,1.,无失真编码定理(香农第一定理),确定每信源符号,(,每像素值,),可达到的最小平均码字长度。,如果信道和传输系统都没有误差,传输系统的主要功能就是尽可能紧凑地表达信源(,数据压缩,),零记忆信源:具有有限集合,且信源符号统计独立的信源,。,可用,(,A,u,),描述。,其,n,阶扩展信源的,的熵为,产生块随机变量的(零记忆)信源的熵是对应单符号信源的,n,倍,n,阶扩展信源的平均码字长度为,零记忆信源的香农第一定理:,熵是在不造成信息失真的条件下,编码的平均码长可能的最短值(编码的下限),。,编码效率,2.,噪声编码定理(信道编码定理,/,香农第二定理,),如何编码以保证可靠的传输?,一种简单方法,多次重复传输每个符号,利用多次投票原则减少解码错误概率。,零记忆信源的信息产生率(信息单位,/,符号)等于信源的熵,H,(,u,),;其,n,阶扩展信息源的信息产生率等于,H,(,u,)/,n,。对,K,个信源符号,每符号传输,r,次,仅用其中,s,个码字作为有效码字。当这,s,个码字具有相同概率时,可达到最大信息率(最大速率):,香农第二定理:对任意的,R,0,3.,信源编码定理(率失真定理),一个理想的图像压缩器应具备:重构图像失真率低、压缩比高以及设计编码器和解码器的计算复杂度低等。,实际互相冲突,香农的信源编码理论是建立在平均比特率和平均失真率这一相互冲突的矛盾之上。,在比特率和失真率两者之间取得平衡可以用几种等价的方式定义:,给定比特率,R,的约束下,使失真,D,最小;,或给定失真值,D,的约束下,使所需传输的比特率,R,最小;,或最小化拉格朗日函数,D,+,R,,不同的拉格朗日算子,可以在比特率和失真率之间起着权衡作用。,如果从信源发出信息,u,k,,经过编、译码的组合,接受端得到信息为,v,l,(由信道的噪声造成),定义信源编码经过编、译码的平均互信息量为,:,率失真函数,:在一定允许的失真,D,条件下最低的平均互信息量,R,(,D,),是在平均失真小于允许失真,D,以内能够得到的编码的码率下界。,香农的信源编码定理,一个具有率失真函数,R,(,D,),的信源,若有平均失真,D,,并有两个任意小的正数,与,,则必存在一种信源编码、译码方法使信息率和平均失真率满足,香农信源编码定理只说明了码率在一个界限以上编码的可能性,并没有给出具体的编码方案,。,图像也是一种信息,香农的信源编码理论对图像编码起着重要的指导作用。,4.,举例,编码器是用符号集中的符号构成输出代码,并建立输入信号单元与输出代码的对应关系。如下图所示:,编码器,消息集合 输出代码,符号集 符号,(,码元,),分别表示要传递的四种可能,消息,如果我们选择一符号集合,A,=1,2,3,4,,,每一个符号分别代表一种消息,,n,=4(,符号个数,),则可以求出平均码长,则,从上例可以看出,这两种代码长度相同的编码方法没有得到最高的编码效率,即没作到用最少的码字传递信源的消息。如何使平均码长短到极限?,若,A,=0,1,,,n,=2,,选择编码方式:,0,、,10,、,110,、,111,,则平均码长,则,这种方式得到最高的编码效率,是因为每个消息码字长度不同。由此可见至少有两种编码方式,即等长码和变长码。,五、无损压缩编码方法,无损压缩可以精确无误地从压缩数据中恢复出原始数据。,应用:医疗、商业、卫星图像等不可允许或不希望有数据损失的场合。,常见的无损压缩技术包括:,基于统计概率的方法,依据信息论中的变长编码定理和信息熵有关知识,用较短代码代表出现概率大的符号,用较长代码代表出现概率小的符号,从而实现数据压缩。,霍夫曼,(Huffman),编码、算术编码,基于字典技术的数据压缩技术,游程编码,(Running Length Coding,,简称为,RLC),LZW,编码,1.,哈夫曼,(Huffman),编码,消除编码冗余最常用的技术。,原理,:,利用信息符号概率分布特性的变字长的编码方法。,对于出现,概率大,的信息符号编以,短字长,的码,对于出现,概率小,的信息符号编以,长字长,的码。,优点,:,一旦哈夫曼码获得,编码或解码都可用简单的查找表实现。,根据无失真编码定理,哈夫曼编码对固定的,n,值最优。,步骤,:,符号概率排序,并将出现概率最小的两个符号的概率相加,合成一个概率;,第二步把这个合成概率看成是一个新组合符号的概率;,重复上述做法,直到最后只剩下两个符号的概率为止。,完成以上概率相加顺序排列后,再反过来逐步向前进行编码;,每一步有二个分支,各赋予一个二进制码,可以对概率大的编码赋为,0,,概率小的编码赋为,1,。,符号 概率,x,1,0.4,x,2,0.3,x,3,0.1,x,4,0.1,x,5,0.06,x,6,0.04,1,0.4,0.3,0.1,0.1,0.1,2,0.4,0.3,0.2,0.1,3,0.4,0.3,0.3,4,0.6,0.4,例,1,:设有编码输入 。其频率分布分别为,现求其最佳霍夫曼编码,。,解,:,Huffman,编码过程下图所示:,图,7.1,哈夫曼编码中的信源化简,表,7.1,哈夫曼编码分配过程,x,1,x,2,x,3,x,4,x,5,x,6,符号 概率 编码,对,0.6,赋,0,,对,0.4,赋,1,;,0.4,传递到,x,1,,所以,x,1,的编码是,1,。,0.6,传递到前一级是两个,0.3,相加,大值是单独一个元素,x,2,的概率,小值是两个元素概率之和,每个概率都小于,0.3,,所以,x2,赋予,0,,,0.2,和,0.1,求和的,0.3,赋予,1,。,所以,x2,的编码是,00,;剩余元素编码的前两个码应为,01,。,0.1,赋予,1,,,0.2,赋予,0,。,以此类推,最后得到诸元素的编码如下:,经霍夫曼编码后,平均码长为:,=,=0.4,1+0.30,2+0.1,3+0.1,4,+0.06,5+0.04,5,=2.20(bit),该信源的熵为,H,2.14 bit,,编码后计算的平均码长为,2.2 bit,,非常接近于熵。可见,Huffman,编码是,种较好的编码。,优点,:,已被证明具有最优变长码性质,平均码长最短,接近熵值。,缺点,:,码长参差不齐,存在输入、输出速率匹配问题。,在存储或传输过程中,如果出现误码,可能会引起误码的连续传播。,对不同信源其编码效率不尽相同。,应用,:,需要与其他编码结合起来使用,才能进一步提高数据压缩比。,Huffman,编码特点,2.,香农费诺编码,霍夫曼编码法需要多次排序,当很多时十分不便。,费诺,(Fano),和香农,(Shannon),分别单独提出类似的方法,使编码更简单。具体编码方法如下:,(,1,)把 按概率由大到小、从上到下排成一列,然后把 分成两组 和 ,并使得,(,2,)把两组分别按,0,,,1,赋值。,(,3,)然后分组、赋值,不断反复,直到每组只有一种输入为止。将每个所赋的值依次排列起来就是费诺,香农编码。,以前面哈夫曼编码的例子进行香农费诺编码:,输入,概率,x,1,0.4,0,0,x,2,0.3,1,0,10,x,3,0.1,1,0,0,1100,x,4,0.1,1,1101,x,5,0.06,1,0,1110,x,6,0.04,1,1111,3.,算术编码,算术编码是从整个符号序列出发,采用递推形式连续编码的方法,信源符号和码字之间不存在一一对应关系。,算术编码没有对各输入符号的信息量为整数的限制。,算术编码的基本思想:,将要压缩的数据,X,映射到,0,,,1),实数区间中的某一区段上的实数,Y,,该实数的二进制展开式即为原符号串的压缩编码结果。,算术编码通过对当前的概率区间作迭代分割来确定实数。,算术编码是具体构造出的用小数表示信息的方法,因为小数随位数的增加,它的精度也随之提高,从信息的角度来说,它所含有的信息量也随之增加。,例,2,:设输入两种符号,A,和,B,,它们出现的概率分别是,3/4,和,1/4,,需要编码的信息为,AABA,。算术编码过程如下:,从,0,,,1),开始,一个符号一个符号地迭代分解区间。,第一字符,A,,取,0,1),区间的前,3/4,,即区间,0,3/4);,第二字符,A,,取,0,3/4),区间的前,3/4,,即区间,0,9/16);,第三字符,B,,取,0,9/16),区间的后,1/4,,即区间,27/64,9/16);,第四字符,A,,取,27/64,9/16),区间的前,3/4,,即区间,27/64,135/64),,其二进制表示为,0.011011,0.10000111),图,7.2,算术编码过程图解,表,7.2,算术编码示例,例,2,:四符号信源信息,a,1,a,2,a,3,a,3,a,4,的算术编码过程见图,7.2,和表,7.2,。,优点:,不同的输入符号一定落入不同的区间,编码结果唯一。,信息中所用符号出现的概率愈大,对应的区间愈大,愈有机会选择较短的码字表示。,编码的符号数目足够多时,编码效率趋于熵值。,相比哈夫曼编码,压缩率较高。,编码算法与符号概率统计是相互独立的,更易于实现自适应。,缺点:,不是即时码,必须等到所有信息收到后才能解码。,需要几乎无限精度的实数运算,实际的程序只能是用有限精度的整数运算实现。,算术编码特点,4.1-D,游程编码,(run length coding,RLC),利用空间冗余度压缩图像,属于统计编码类。,原理,:,用一系列描述黑色或白色像素的连续行程的长度表示二值图像或位平面的每一行。,对于图像编码,可以定义沿特定方向上具有相同灰度值的相邻像元为一轮,其延续长度称之为延续的行程,简称为“游程”。,游程终点位置由前一游程终点的相对距离确定,这样就可以由,(,灰度游程,),串来表示图像数据。,X S,C,RL,串字符,串位置,串长,游程编码分为定长游程编码和变长游程编码两种。,定长游程编码是指编码的游程所使用的二进制位数固定。,变长游程变码是指对不同范围的游程使用不同位数的二进制位数进行编码。,应用:,游程编码一般不直接应用于多灰度图像,比较适合于二值图像的编码,传真编码的标准压缩方法,为了达到较好的压缩效果,有时和其它编码方法混合使用。,四、预测编码,统计冗余数据压缩理论的三个重要分支之一。,基本思想:,减少数据在时间和空间上的相关性,。,预测:,图像的相邻像素之间有着较强的相关性,(,统计特性,),某像素的值可根据以前已知的几个像素来估计。,编码原理:通过提取每个像素中的新增信息并进行编码,以消除像素间的冗余。,设图像预测估计为:,新增信息(即,预测误差值):,图像预测估计准则:,最小均方优化准则,。,(a),预测误差图像,(b),原图直方图,(c)(a),的直方图,图,7.3,图像的预测编码,1.,无损预测编码,对差值信号不进行量化而直接编码就称之为无损预测编码。,预测器,源图像,熵编码器,编码表,压缩源图像,图,7.4,无损预测编码编码器工作原理,由先前三点预测可以定义为:,其中,a,1,、,a,2,、,a,3,称预测系数,都是待定参数。,如果预测器中预测系数是固定不变的常数,称之为,线性预测,。,预测误差:,2.,有损预测编码,在预测编码中,对差值信号进行,量化,后再进行编码就称之为有损预测编码。,消除心理视觉冗余数据。,量化:,量化器将预测误差映射进有限个输出 中。,确定了有损编码中的压缩量和失真量。,预测器输入:,有损预测方法:,差分脉冲编码调制,(Differential Pulse Code Modulation,,简称,DPCM),最典型,DM,(德尔塔调制)方法,最简单,(1)DM,(德尔塔调制),一种简单的有损预测编码方法,预测器和量化器分别定义为:,预测误差图像,解码后图像,,erms=25.5558,图,7.5 DM,编码的图例(失真较为严重),图,7.6 DM,编码中的失真示例,DM,有损预测编码:,主要的图像损伤,斜率过载:,图像扫描行越过黑白边界,预测误差可能比最大的量化输出大得多,复原图像的水平,/,垂直方向分辨能力降低,黑白边缘变得模糊。,颗粒噪声:,如果最小量化输出(绝对值)不够小,在图像亮度值缓慢变化的区域(平坦区域),可能在正负两个最小量化输出之间来回振荡,出现颗粒细斑,视觉对此噪声敏感度高。,伪轮廓图像:,对于较小(绝对值)的预测误差的量化区间太大,即量化特性曲线太粗糙,则在图像亮度值缓慢增大或下降的区域,将产生伪轮廓图像,类似等高线构成的图。,(2),差分脉冲编码调制,(,DPCM),预测器,预测器:,最优准则:最小化均方预测误差,最优滤波器设计:选择,m,个预测系数,使下式最小。,预测系数,为保证预测器的输出落入允许的灰度值范围,并减少传输噪声的影响(水平条纹)。,DPCM,系统由编码器和解码器组成,它们各有一个相同的预测器。,量化器,编码器,预测器,信道传输,解码器,输入,输出,预测器,图,7.7 DPCM,有损编码系统,DPCM,系统的工作原理图,预测模型特点,预测模型的复杂程度取决于线性预测中使用以前样本的数目,样本点越多,预测器就越复杂。,预测器的好坏取决于预测系数。,4,阶线性预测器:,(7-1),(7-1),式中的系数赋值不同,可得到不同的预测器:,一阶:,二阶:,三阶:,一阶自适应:,图,7.8 DPCM,编码中不同预测器的效果比较,上排:不同预测器(一阶、二阶、三阶、一阶自适应)编码后,得到的解码图,(,均采用,2,级德尔塔量化器,),下排:对应误差图(原图和编码解码图的差),采用自适应系数预测编码后的重构图像,a,1,=0.340,a,2,=0.664,a,3,=-0.005,根据输入图像来确定预测系数,另外一种采用的是固定的预测系数,采用固定系数预测编码后的结果,a,1,=0.5,a,2,=0.5,a,3,=-0.5,直接采用均匀标量量化后的结果,在实验中采用几种不同的预测系数,图,7.9 DPCM,编码中不同预测系数的效果比较,预测编码的效果图,预测误差图,预测编码的误差图,图,7.10 DPCM,编码中不同量化器量化的效果比较,(一阶线性预测器,,Lloyd-Max,量化器),第一列:,2,级量化,均方根误差,erms=21.5608;,第二列:,4,级量化,均方根误差,erms=10.6673;,第三列:,8,级量化,均方根误差,erms=5.8239,。,预测编码压缩数据的基础:,如果模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始信号,预测误差分布更加集中,即熵值比原来图像小。,由于量化和传送的仅是误差信号,可用较少的单位像素比特率进行编码,使得图像数据得以压缩。,应用:,对于视频信号,预测编码充分利用了连续帧之间的统计冗余性,是当今主流技术并且还会流行于未来。,对于静止图像,预测编码将被图像变换编码所取代,。,五、变换编码,1.,变换编码的基本原理,图像变换会使图像信号能量在空间重新分布,总能量不变。,(,例,),像素之间的相关性下降;,能量集中在变换域中少数的变换系数上,根据统计编码的原理,能量分布集中,熵值最小,可实现平均码长最短。,在正交空间中用变换系数来表示原始图像,并对变换系数进行编码。,在接收端进行反变换就可以得到重构图像。,例:,给定,Lena,图像的一个平坦区域(,88,子块)如下:,69,71,75,79,84,89,91,69,70,73,76,83,90,95,77,74,76,74,85,89,95,71,73,76,79,86,91,93,74,77,77,82,88,91,93,78,76,80,84,88,92,95,76,78,80,85,93,94,95,74,79,81,85,86,94,94,给出,DCT,变换系数量化过程。,解:,如下是它的,DCT,变换系数,可以看到能量集中在少数低频系数:,660.1250 47.0496 25.9980 10.3993 7.8750 8.4866 5.6025 1.3176,17.3267 2.6749 5.2236 1.3234 0.5222 0.2914 0.2800 2.281,0.0280 0.6463 0.9545 0.9620 2.4730 1.9783 0.316 2.1741,2.3003 0.4542 2.2403 3.5559 1.2907 1.0024 0.1580 0.9747,2.3750 0.1038 3.2220 0.9653 1.3750 2.2258 0.3875 3.5236,0.9294 1.3282 2.4256 0.9828 1.9317 0.6972 0.1253 1.856,0.3943 2.6640 0.5669 3.4168 0.8891 1.6182 2.545 1.732,2.1666 1.7238 0.3335 0.4808 2.6253 0.9699 1.4854 1.183,用,JPEG,的亮度量化矩阵式对每个系数进行均匀量化,量化器输出为:,41 4 3 1 0 0 0 0,1 0 0 0 0 0 0 0,0 0 0 0 0 0 0 0,0 0 0 0 0 0 0 0,0 0 0 0 0 0 0 0,0 0 0 0 0 0 0 0,0 0 0 0 0 0 0 0,0 0 0 0 0 0 0 0,反量化后,进行,DCT,反变换,得到的解码图像为:,80 75 71 72 78 85 89 90,80 75 71 72 78 85 89 90,80 76 72 73 79 86 90 91,81 77 72 74 80 87 91 92,82 77 73 74 81 87 91 93,83 78 74 75 81 88 92 93,83 79 75 76 82 89 93 94,84 79 75 76 82 89 93 94,2.,变换编码系统,图,7.11,一个典型的变换编码系统,(a),编码器;,(b),解码器,编码部分:子图像分解、变换、量化和编码,自适应变换编码:任一步骤都可以根据图像局部内容调整,非自适应变换编码:所有步骤对所有子图像都固定,3.,变换选择,各种二维离散(正交)变换都可用于变换编码。,不同变换的信息集中能力、重建误差和计算复杂度不同。,信息集中能力:,KLT,(卡胡南,-,列夫变换),DCT DFT WHT,所需计算量:,KLT DCT DFT WHT,DCT,是较好的(综合)选择,,块效应最小,应用多。,主要算法:基于,块,的,DCT,变换,+,量化,+,熵编码,数据压缩不是在变换步骤取的,而是在量化变换的系数时取得的。,图,7.12,使用,(a)DFT,(c)Hadamard,变换,(e)DCT,对右上图的近似,以及对应的标定后的误差图像,4.,子图像尺寸选择,图像分块:,在,DCT,为主要方法的变换编码中,将,MN,的一幅图像分成不重叠的,M/K,N/K,个块(每块大小,KK,),分别进行变换。,主要好处:,第一,降低运算量,如对一幅,512512,图像,分块变换仅需约,1,3,的运算量;,其次,后续的量化和扫描处理可以得到明显的简化;,第三,容易将传输误差引起的错误控制在一个块内,而不是整个图像扩散。,子图像尺寸影响变换编码误差和计算复杂度。,多数情况将图像分割成尺寸满足以下两个条件的子图像:,相邻子图像之间的相关(冗余)减少到某个可接受的水平;,子图像的长和宽都是,2,的整数次幂(减少子图像变换的计算量),最常用尺寸是,8,8,和,16,16,。,图,7.13,重构误差与子图像尺寸的关系,图,7.14,使用,25%,的,DCT,系数对标准图的近似。,(a),和,(b),为,88,大小的子图像结果,,(c),放大的原图像,(d)22,大小的结果,(e)44,大小的结果,(f)88,大小的结果,5.,比特分配,截断误差和,2,个因素有关:,截除的变换系数的数量和相对重要性;,用来表示所保留系数的精度。,多数变换编码系统中保留的系数根据下列,2,个准则之一选择确定:,最大方差准则,区域编码,最大幅度准则,阈值编码,整个对变换子图像的系数截断、量化和编码的全过程称为比特分配。,数据压缩的关键,图,7.15,使用,88 DCT,系数的,12.5%,对标准图的近似。,(a),(c),和,(e),为阈值编码结果,,(b),(d),和,(f),是区域编码结果,六、图像压缩标准,图像编码标准制定主要由国际标准化组织,ISO,(,international stadardization organization,和国际电信联盟(,international telecommunication union,)进行。,ITU,的前身是国际电话电报咨询委员会,CCITT,(,consultative committee of the international telephone and telegrah,)。,有关图像编码的国际标准处理图像类型包括:,二值图像,静止灰度(和彩色)图像,序列(连续帧)灰度(和彩色)图像(视频图像),1.,二值图像压缩标准,G3,和,G4,:最初是,CCITT,为传真应用设计的。,G3,采用了非自适应、,1-D,游程编码技术,对标准试验图的压缩率约为,15,:,1,。,G4,是,G3,的一种简化版本,比,G3,压缩率高,1,倍。,JBIG,:由,ISO,、,ITU,的二值图联合组(,joint belevel imaging group,,,JBIG,)于,1991,年制定。采用自适应技术,压缩比相对,G3,、,G4,可提高,1.11.5,倍。,2.,静止图像压缩标准,JPEG,JPEG,(,Joint Photographic Expert Group,,简称,JPEG,)是联合图像专家小组的英文缩写。其中“联合”的含意是指,国际电报电话咨询委员会(,CCITT,)和国际标淮化协会(,ISO,)联合组成的一个图像专家小组。,国际上彩色、灰度、静止图像的第一个国际标准。,电视图像序列的帧内图像的压缩编码也常采用,JPEG,压缩标准(,M-JPEG,)。,实际定义了三种编码系统:,基于,DCT,的有损编码基本系统,可用于绝大多数压缩应用场合;,用于高压缩比、高精确度或渐进重建应用的扩展编码系统;,用于无失真应用场合无损系统。,JPEG,的工作模式,JPEG,对每一个图像分量单独编码。,JPEG,对每个不同的图像分量可以采用不同的量化参数和熵编码的码表,对于一个图像分量,,JPEG,提供,4,种工作模式。,顺序编码,:每一个图像分量按从左到右,从上到下扫描,一次扫描完成编码。(,JPEG2000,),累进编码,:图像编码在多次扫描中完成。(,JPEG2000,),无失真编码,:解码后能精确地恢复源图像采样值,其压缩比低于有失真压缩编码方法。,分层编码,:图像在多个空间分辨率进行编码。,JPEG,标准算法的基本步骤,图像分块,(88),,用,DCT,变换去除图像相关信息冗余度;,对变换系数按一定准则,(,如人眼最佳效果,),进行量化;,对数据进行熵编码(变长码)。,编码器的输入端:,把原始图像顺序地分割成一系列,88,的子块,,设原始图像的采样精度为,P,位,是无符号整数,输入时把,0,,,2,P,范围的无符号整数变成,-2,P-1,,,2,P-1,-1,范围的有符号整数,以此作为离散余弦正变换的输入。,解码器的输出端:,经离散余弦逆变换,(IDCT),后,得到一系列,8 8,的图像数据块,需将其数值范围由,-2,P-1,,,2,P-1,-1,再变回到,0,,,2,P,范围内的无符号整数,来获得重构图像。,为了达到压缩数据的目的,对,DCT,系数需作量化处理,即在一定的主观保真度图像质量前提下,丢掉那些对视觉效果影响不大的信息。,在,JPEG,中采用线性均匀量化器,量化定义为对,64,个,DCT,系数除以量化步长,四舍五入取整,。,量化处理是一个多到一的映射,它是造成,DCT,编解码信息损失的根源。,解码器,逆变换,(IDCT),反量化器,熵解码器,量化表,熵编码器,恢复的图像,数据,图,7.17 JPEG,解,编过程框图,88,块,编码器,DCT,正变换,量化器,熵编码器,量化表,熵编码器,源图像数据,压缩的图像数据,图,7.16 JPEG,基本系统编码器框图,图,7.1,8,JPEG,编码效果示例,(a),标准测试图(,256x256,256,灰度级),(b)(h),选择压缩比为,48,、,32,、,22,、,15,、,11,、,8,和,2.2,进行,编码又解码得到的结果图,(i)(l),分别对应压缩比为,48,、,22,、,11,和,2.2,的误差图,JPEG2000,提高了图像压缩质量,尤其是低码率时的压缩质量。,增加许多功能。,编码变换采用小波变换。,小波变换编解码系统中没有图像分块的模块。,小波变换的计算效率很高,且本质上具有局部性,不会产生使用,DCT,变换在高压缩比时的块效应。,图,7.19,小波编码解,编过程框图,3.,序列图像(视频)压缩标准,视频信号的压缩包括两个主要方面:,帧内(,Intra frame,)压缩:,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息。也称空间压缩(,Spatial compression,)。,帧间(,Inter frame,)压缩:,通过比较时间轴上不同帧之间的数据进行压缩。也称为时间压缩(,Temporal compression,)。,视频图像在时域上呈现出的相关性比空域相关性要深得多。,物体的运动是构成帧差别的主要原因。,运动补偿和运动估计,技术,各种视,频压缩编码中的关键技术,。,视频灰度,/,彩色图像压缩的国际标准主要有:,H.261,、,H.263,、,H.264,MPEG-1,、,MPEG-2,、,MPEG-4,、,MPEG-7,图,7.20,序列灰度图像压缩国际标准编码器基本框图,(1)H.261H.264,ITU-T,视频编码标准系列主要应用于实时视频通信领域,如会议电视。,H.261,:序列灰度图像压缩标准,,1990,年制定。,为在综合业务数字网,(ISDN),上开展双向声像业务,(,可视电话、视频会议,),而制定的,速率为,64kb/s,的整数倍,只对,CIF,和,QCIF,两种图像格式进行处理,每帧图像分成图像层、宏块组,(GOB),层、宏块,(MB),层、块,(Block),层来处理。,扩展了基于,DCT,的压缩方法,包含了减少帧间冗余的方法。,序列中的第,1,帧(或某参考帧,,I-frame,)图用类似,JPEG,的,DCT,压缩,以减少帧内冗余度;,估计目标运动,减少帧间冗余度(预测帧,,P-frame,)。,H.263,为低于,64kb/s,的窄带通信信道制定的视频编码标准,标准输入图像格式可以是,S-QCIF,、,QCIF,、,CIF,、,4CIF,或者,16CIF,的彩色,420,亚取样图像,H.263,与,H.261,相比采用了半像素的运动补偿,并增加了,4,种有效的压缩编码模式。,无限制的运动矢量模式允许运动矢量指向图像以外的区域。,基于句法的算术编码模式使用算术编码代替霍夫曼编码,可在信噪比和重建图像质量相同的情况下降低码率。,先进的预测模式允许一个宏块中,4,个,88,亮度块各对应一个运动矢量,从而提高了预测精度;两个色度块的运动矢量则取这,4,个亮度块运动矢量的平均值。,PB-,帧模式规定一个,PB-,帧包含作为一个单元进行编码的两帧图像。,PB-,帧模式可在码率增加不多的情况下,使帧率加倍。,第二版,(H.263+),及,H.263+,增加了许多选项,使其具有更广泛的适用性。,H.264,ISO/IEC,与,ITU-T,组成的联合视频组,(JVT),制定的新一代视频压缩编码标准。,在,ISO/IEC,中该标准命名为,AVC(Advanced Video Coding),,作为,MPEG-4,标准的第,10,个选项。,优点:,在相同的重建图像质量下,,H.264,比,H.263+,和,MPEG-4(SP),减小,50%,码率。,对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合,如视频存储等。,提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错恢复能力。,在编,/,解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用。,相对于先期的视频压缩标准,,H.264,引入了很多先进的技术,包括,44,整数变换、空域内的帧内预测、,1/4,像素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。,(2)MPEG,运动图像压缩编码,国际标准化组织,ISO/IEC,制定。,MPEG(Moving Picture Expert Group),是运动图像专家组的简称。,该小组于,1991,年底提出了用于数字存储媒介的、速率约,1.5MB,s,的运动图像及其伴音的压缩编码,并于,1992,年正式通过,通常被称为,MPEG,标准,此标准后来被定名为,MPEG-1,。,娱乐质量的视频压缩标准,,1992,年制定。,MPEG-1,视频压缩策略:,为了提高压缩比,帧内,/,帧间图像数据压缩技术必须同时使用。,帧内压缩算法与,JPEG,压缩算
展开阅读全文