视频编码技术.ppt_咨信网zixin.com.cn

资源描述

,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,3,章视频编码技术,1.,视频信号的数字化,2.,视频文件格式,3.,视频压缩编码原理,4.,视频压缩标准,学习目标,掌握视频数字化方法,了解视频文件格式,掌握视频压缩编码原理,（预测编码、变换编码、统计编码原理）,理解视频压缩标准,（,MPEG,标准,）,3.1,视频信号的数字化,所谓视频（,video frequency,），,连续的图像变化每秒超过,24,帧（,frame,）画面以上时，根据,视觉暂留,原理，人眼无法辨别单幅的静态画面，看上去是平滑连续的视觉效果，这样连续的画面叫做视频。,即视频是由一系列单独的静止图像组成，其单位用帧或格来表示；,人眼在观察景物时，光信号传入大脑神经，需经过一段短暂的时间，光的作用结束后，视觉形象并不立即消失，而能继续保留其影像,0.1-0.4,秒左右，这种现象被称为视觉暂留现象。,1.,视频相关的基本概念,帧：一帧是扫描获得的一幅完整图像的信号，是视,频图像的最小单位；“帧”在动画创作当中又称,“格”。,帧率：就是每秒钟扫描多少帧。对于,PAL,制式电视,系统，帧率为,25,帧；而,NTSC,制式电视系,统，帧率为,30,帧。,场：视频的一个扫描过程。有逐行扫描和隔行扫,描，对于逐行扫描，一帧即是一个垂直扫描,场；对于隔行扫描，一帧由两场构成：奇数场,和偶数场，是用两个隔行扫描场表示一帧。,1.,视频相关的基本概念,（,1,）逐行扫描,图逐行扫描方式,实线为行扫描的正程，左,右；,虚线逆程，右,左。,1.,视频相关的基本概念,（,2,）隔行扫描,图隔行扫描方式,1.,视频相关的基本概念,视频信号有模拟视频信号与数字视频信号之分。,模拟视频即指由连续的模拟信号组成视频图像，它的存储介质是磁带或录像带；在编辑或转录过程中画面质量会降低。,数字视频是把模拟信号变为数字信号，它描绘的是图像中的单个像素，可以直接存储在电脑硬盘中，因此在编辑过程中可以最大限度地保证画面质量几乎没有损失。,1.,视频相关的基本概念,但数字视频的数据量是非常惊人的，按照,ITU-R601,标准,422,格式的,PAL,制数字化视频信号，每帧数据量为,720576826.64Mbit,，每秒数据量为,6.6425165Mbit,。,ITU-R601,数字演播室标准,4:2:2,格式中色差信号的取样为亮度信号的一半。,600Mbit,的存储空间只能存储,90,帧的视频图像信号，或者说可以存储大约,3.6 s,的数字电视节目。,如果存储更高分辨率的高清数字电视信号，那存储时间就更短了，大约只有几秒钟。因此对视频的处理、传输、存储和显示提出了更高的要求。,1.,视频相关的基本概念,视频信息和信号特点：,(1),直观性：,给人印象更深刻、生动、具体。,(2),确定性：,“百闻不如一见”。,(3),高效性：,人眼是一个高度复杂的并行信息处理系,统，能并行快速地观察一幅图像的细节，因此它获取视,频信息的效率要比语音信息高得多。,(4),广泛性：,人类接受的信息，,80%,来自视觉。,1.,视频相关的基本概念,数字视频的获取方法：,2.,视频的采集及数字化,从现成的数字视频库中截取。,利用计算机软件制作视频。利用计算机生成的动画，如把,flc,或,gif,动画格式转换成,avi,等视频格式。,把静态图像或图形文件序列组合成视频文件序列。,通过视频采集设备获取数字视频。通过视频采集卡把模拟视频转换成数字视频，并按数字视频文件的格式保存下来。,数字视频的采集系统,视频源设备：录像机、电视机、影碟机等；,视频采集卡：对模拟视频信号进行采样、量化和编码的设备；,高性能计算机：接收和记录编码后的数字视频数据。,大容量存储设备：存储经过编辑修改的数字视频文件。,2.,视频的采集及数字化,视频采集卡的接口,复合端口,色差分量接口,S-Video,信号端子,IEEE1394,接口,2.,视频的采集及数字化,视频采集卡的接口,复合端口,也称,AV,接口，通常都是成对的白色音频接口和黄色的视频接口，常用接头有,BNC,接头和莲花,(RCA),接头。传输的是亮度,/,色度,(Y/C),混合在一起的视频信号。易导致亮、色串扰、清晰度降低等问题，是最差的视频信号。,2.,视频的采集及数字化,分量视频信号,(Component Video Signal),是指每个基色分量作为独立的视频信号。一般用亮度,-,色差表示，如,Y,和,Cr,、,Cb,，,Y,和,I,、,Q,，,Y,和,U,、,V,。使用分量视频信号是表示颜色的最好方法。,分量信号接入口,视频采集卡的接口,色差分量接口,2.,视频的采集及数字化,视频采集卡的接口,S-Video,信号端子,S-Video,四芯插头（座）,地,(,亮度,),地,(,色度,),亮度,(,含同步信号,),色度,S,端子信号，它同时传送两路信号：亮度信号,Y,和色度信号,C,。由于将亮度和色度分离，色度对亮度的串扰现象也消失。其图象质量优于复合视频信号，但低于分量视频信号。,S,端子用四芯插头，一些计算机显卡或非线性编辑卡也有用七芯插头，其外形与,S,端子一样，只是又包含了复合视频信号。,2.,视频的采集及数字化,视频采集卡的接口,2.,视频的采集及数字化,莲花接头,视频采集卡的接口,IEEE1394,接口,IEEE1394,是一种外部串行总线标准，,800Mbps,的高速。,1394,接口具有把一个输入信息源传来的数据向多个输出机器广播的功能，特别适用于家庭视听的连接。由于该接口具有等时间的传送功能，确保视听,AV,设备重播声音和图像数据质量，具有好的重播效果。,2.,视频的采集及数字化,视频图像的数字化,2.,视频的采集及数字化,数字化方法,（,1,）先从复合彩色图像中分离出彩色分量，然后数字化。,（,2,）首先用一个高速,A/D,转换器对彩色全信号进行数字化,然后在数字域中进行分离，以获得所希望的,YC,b,C,r,，,YUV,，,YIQ,或,RGB,分量数据。,数字化标准,ITU-R BT.601,标准,彩色电视图像数字化标准，称为,CCIR 601,标准，现改为,ITU-R BT.601,标准。该标准规定了彩色电视图像转换成数,字图像时使用的采样频率，彩色空间之间的转换关系等。,视频图像的数字化,2.,视频的采集及数字化,（,1,）色彩空间转换,视频图像的数字化,2.,视频的采集及数字化,（,2,）采样频率,亮度信号采样频率,fs,=13.5 MHZ,；,色度信号采样频率,fc,6.75MHZ,或,13.5MHZ,；,每个扫描行的有效样本数均为,720,；,如图,2.15(,数字视频技术及应用,P23),数字信号取值范围：亮度信号,220,级，色度信号,225,级。,对,PAL,制、,SECAM,制，采样频率,fs,为：,fs,=625(,行数,/,帧,),25(,帧数,/,秒,),N=15625,N=13.5 MHz,N=864,其中，,N,为每一扫描行上的采样数目。,对,NTSC,制，采样频率,fs,为：,fs,=525,29.97,N=15734,N=13.5 MHz,N=858,其中，,N,为每一扫描行上的采样数目。,视频图像的数字化,（,3,）亮度和色度信号的采样,Y:Cb:Cr,4:1:1,这种方式是在每,4,个连续的采样点上，取,4,个亮度,Y,的样本值，而色差,Cb,、,Cr,分别取其第一点的样本值，共,6,个样本。,Y:Cb:Cr,4:2:2,这种方式是在每,4,个连续的采样点上，取,4,个亮度,Y,的样本值，而色差,Cb,、,Cr,分别取其第一点和第三点的样本值，共,8,个样本。这种方式能给信号的转换留有一定余量，效果更好一些。这是通常所用的方式。,2.,视频的采集及数字化,Y:Cb:Cr,4:4:4,在这种方式中，对每个采样点，亮度,Y,、,色差,Cb,、,Cr,各取一个样本。这种方式对于原本就具有较高质,量的信号源，可以保证其色彩质量，但信息量大。,Y:U:V,4:2:0,分两种情况：,MPEG-1/H.261/H.263,等标准使用的：,水平方向的,2,个,Y,样本和垂直方向上的,2,个,Y,样本共,用,1,个,Cb,样本和,1,个,Cr,样本。,MPEG-2,标准使用的：,MPEG-2,相对于,MPEG-1,的,Cr,，,Cb,子采样在水平方向,有半个像素的偏移。,图,ITU-T BT.601,建议的取样点结构,图,ITU-T BT.601,建议的取样点结构（续）,MPEG-2,图,ITU-T BT.601,建议的取样点结构（续）,MPEG-1/H.261/H.263,e,MPEG-1,相对于,MPEG-2,的,Cr,，,Cb,子采样在水平方向有半个像素的偏移。,参量,NTSC,制（,525,行，,60,场）,PAL,制（,625,行，,50,场）,编码信号,Y/R-Y/B-Y,全行采样点数,亮度,y,858,864,色度,R-Y/B-Y,429,432,采样结构,正交，按行,/,场,/,帧重复，每行中的,R-Y/B-Y,取样与奇数（,1,，,3,，,5,，,）点,Y,取样同位,采样频率,/MHz,亮度,Y,13.5,色度,R-Y/B-Y,6.75,编码方式,亮度信号和色差信号均为,8 bit PCM,每行有效采样点数,亮度,Y,720,色度,R-Y/B-Y,360,有效图像尺寸,亮度,Y,720,480,720,576,色度,R-Y/B-Y,360,480,360,576,表,ITU-T BT.601,建议的,422,标准,（,4,）分辨率,CCITT,规定了称为公用中分辨率格式,CIF(Common,Intermediate Format),和,1/4,公用中分辨率格式,(Quarter-,CIF,，,QCIF),格式。,QCIF,：,176x144,CIF:352x288,SD(,标清,):720 x480;640 x480,704x480,720 x576,HD(,高清,):1280 x720,1920 x1080,视频图像的数字化,2.,视频的采集及数字化,CCITT:,International Telephone and Telegraph Consultative Committee,，国际电报电话咨询委员会,（,1,）本地影像视频格式,AVI,格式，,英文全称为,Audio Video Interleaved,，即音频视频交错格式。所谓,“,音频视频交错,”,，就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用，现在几乎所有的非线性编辑系统都支持,AVI,格式。其缺点是体积过于庞大。压缩标准不统一是其主要问题。,DV-AVI,格式，,DV,的英文全称是,Digital Video Format,，是由索尼、松下等多家厂商联合提出的一种家用数字视频格式。它可以通过电脑的,IEEE 1394,端口传输视频数据到电脑，也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是,.avi,，所以也叫,DV-AVI,格式。,3.2,数字视频文件格式,MPEG,格式，,英文全称为,Moving Picture Expert Group,，即运动图像专家组格式。,MPEG,文件格式是运动图像压缩算法的国际标准，,MPEG,不是一种简单的文件格式，而是编码方案。,它采用了有损压缩方法减少运动图像中的冗余信息，其最大压缩比可达到,200:1,。目前,MPEG,视频格式常见的压缩标准是,MPEG-1,、,MPEG-2,、,MPEG-4,。,家里常看的,VCD,、,SVCD,、,DVD,就是这种格式。,DivX,格式，,是由,MPEG-4,衍生出的另一种视频编码,(,压缩,),标准，也即,DVDrip,格式，它采用了,DivX,压缩技术对,DVD,盘片的视频图像进行高质量压缩，同时用,MP3,或,AC3,对音频进行压缩，然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼,DVD,并且体积只有,DVD,的数分之一。,3.2,数字视频文件格式,（,1,）本地影像视频格式,MOV,格式，美国,Apple,公司开发的一种视频格式，默认的播放器是苹果的,QuickTime Player,。具有较高的压缩比率和较完美的视频清晰度等特点，但是其最大的特点还是跨平台性，即不仅能支持,Mac OS,，同样也能支持,Windows,系列。,Avid Media composer,非线性编辑软件支持该格式。,（,1,）本地影像视频格式,（）网络影像视频格式,广泛应用于视频点播、网络演示、远程教育、网络视频广告等等互联网信息服务领域。,ASF,格式，英文全称为,Advanced Streaming Format,，是,微软推出的可以直接使用,Windows,自带的,Windows Media Player,对其进行播放。它使用了,MPEG-4,的压缩算法，所以压缩率和图,像的质量都很不错。,WMV,格式，英文全称为,Windows Media Video,，也是微软,推出的一种采用独立编码方式并且可以直接在网上实时观看视,频节目的文件压缩格式。,WMV,格式的主要优点包括：本地或网络,回放、可扩充的媒体类型、多语言支持、环境独立性、丰富的流间关系以及,扩展性等。,3.2,数字视频文件格式,RM,格式，,Real Networks,公司所制定的音频视频压缩规,范称为,Real Media,，用户可以使用,Real Player,或,Real One,Player,进行实况转播，可以根据不同的网络传输速率制定出,不同的压缩比率，从而实现在低速率的网络上进行影像数据,实时传送和播放，实现在线播放。另外，,RM,作为目前主流网,络视频格式，可以通过其,Real Server,服务器将其它格式的视,频转换成,RM,视频并由,Real Server,服务器负责对外发布和播放。,3.2,数字视频文件格式,（）网络影像视频格式,RMVB,格式，是一种由,RM,视频格式升级延伸出的新视频格式。,RMVB,视频格式打破了原先,RM,格式那种平均压缩采样的方式，对静止和动作场面少的画面场景采用较低的编码速率，这样可以留出更多的带宽空间，而这些带宽会在出现快速运动的画面场景时被利用，保证了静止画面质量的前提下，大幅地提高了运动图像的画面质量，从而图像质量和文件大小之间就达到了微妙的平衡。,（）网络影像视频格式,3.2,数字视频文件格式,名称,功能,转换格式,操作系统,WinMPG,Video Convert,多功能视频格式转换,可以将,AVI,格式转换成,MPEG-1/MPEG-2/DVD/VCD/SVCD/DivX,等视频格式，而且还可以将,ASF,和,WMV,等视频格式转换成,AVI,及,MPEG-4,格式,WindowsXP/NT/2000/9X,Zealot AII Video Converter,多功能视频格式转换,将,AVI,转换成,nAVI/MPEG-1/MPEG-2/DVD/VCD/SVCD/WMV/ASF,视频文件和将,MPEG,转换成,AVI/DivX,/WMV/ASF,格式,WindowsXP/NT/2000/9X,AVS Video Converter,多功能视频格式转换,将需要转换的,AVI/MPG/MPEG-1/MPEG-2/VOB,（,DVD,）,/DAT,（,VCD,）,/WMV/ASF,等格式转换成,AVI,、,MPEG,、,WMV,、,RM,和,VCD,格式,WindowsXP/NT/2000/9X,网络多媒体梦工场,2004,RM,格式转换,将,VCD,（,.dat,）、,DVD,（,.vob,）、,.MPG,和,.WAV,等视频格式转换成,.RM,格式,WindowsXP/NT/2000/9X,表常用的视频格式转换软件,3.2,数字视频文件格式,未完，见续表,名称,功能,转换格式,操作系统,RM Converter,RM,格式转换,将,AVI,与,MPEG,格式视频文件直接转换成,RM,格式,WindowsXP/NT/2000/9X,AVIto,DivX,DivX,格式转换,将,AVI/MPEG/MPG/MOV/QT,等格式的视频文件转换成,DivX,格式,WindowsXP/NT/2000/9X,豪杰视频通,DVD,格式转换,可以将,DVD,向,VCD,进行视频转换，将,DVD,视频转换成,MPEG-4/AVI/RM,等视频格式。将,DVD,视频转换成,GIF,动画文件及进行其他的视频格式（如,.MPG,、,.MPEG,、,.DAT,和,.AVI,等）向,RM,视频格式及,GIF,动画格式的转换,表常用的视频格式转换软件（续表）,3.2,数字视频文件格式,3.3,视频压缩编码,1.,视频压缩原理,视频数据之所以能被压缩，是因为在视频数据中存在着大量的冗余信息。,视频数据主要存在下列冗余：,（,1,）空间冗余,，同一帧图像中相邻的像素具有很强的相关性。,（,2,）时间冗余,，图像序列中相邻帧的对应像素具有很强的相关性。,（,3,）结构冗余,，在视频图像的纹理区，像素的亮、色度信息存在着明显的分布模式，如果知道了分布模式，就可以通过某种算法来生成图像，即存在结构冗余。,空间冗余,时间冗余,1.,视频压缩原理,（,4,）视觉冗余,，研究发现人眼的视觉特性是,非均匀和非线性,的。例如，人眼对视频图像色度的敏感性远低于对亮度的敏感性，对低频信息的敏感度高于对高频信息的敏感度等等。在很多场合，人眼是视频信息的最终接收者，因此，可以对人眼不敏感的信息少编码甚至不编码以压缩数据量。,（,5,）知识冗余,，指视频图像中所包含的某些信息与人们的一些先验知识有关。例如在头肩图像中，,头、眼、鼻和嘴的相对位置等信息就,是人类的共性知识。,3.3,视频压缩编码,视频压缩编码的类型：,预测编码：差分脉冲,PCM,等,变换编码：正交变换、离散余弦变换,统计编码：霍夫曼编码、游程编码、算术编码,子带编码,小波变换编码,分形编码,知识（模型）基编码,3.3,视频压缩编码,2.,视频压缩编码,3.3.1,预测编码,1.,预测编码的基本内容,预测编码是基于图像数据的时间和空间冗余特性，用相邻的已知像素（或图像块）来预测当前像素（或图像块）的取值，然后再对预测误差进行量化和编码。,这些相邻像素（或图像块）可以是同行扫描的，也可以是前几行或前几帧的，相应的预测编码分别称为一维、二维和三维预测，其中一维和二维预测是帧内预测，三维预测是帧间预测，即在时间轴上用前一帧的像素（或图像块）对后一帧的像素（或图像块）进行预测。,帧间预测编码主要利用活动图像序列相邻帧间的相关性，即图像数据的时间冗余来达到压缩的目的，它可以获得比帧内预测编码高得多的压缩比。,2.,预测编码的类型,预测编码分线性预测和非线性预测两类，线性预测编码又称为差分脉冲编码调制，即,DPCM,（,Differential Pulse Code Modulation,）。,DPCM,系统又称预测量化系统。,差分脉冲调制预测,原理图,量化器,预测器,译码器,预测器,编码器,发送端,接收端,X,n,d,n,X,n,X,n,d,n,d,n,X,n,X,n,差分脉冲调制预测,发送端预测器带有存储器，把,t,n,时刻以前的采样值,x,1,x,2,x,3,x,n-1,存储起来并据此对,x,n,进行预测，得到预测值,d,n,为,x,n,与的差值，,d,n,为,d,n,经量化器量化的值,x,n,是接收端的输出信号,误差,q,n,为,q,n,=x,n,-x,n,=x,n,-(+d,n,)=(x,n,-)-d,n,=d,n,-d,n,实际上就是发送端的量化器对误差量化的误差,对,d,n,的量化越粗糙，压缩比越高，失真越大,X,n,X,n,X,n,X,n,差分脉冲调制预测,应用示例,例如，取一序列为,10,，,12,，,14,，,16,，,18,，,20,。（例如亮度变化缓慢的图像的亮度值）由于其中所有数字都不相同，但是是一个等差的数列，所以行程编码和哈夫曼对其不产生压缩效果。,先用,DPCM,方法，其预测器的预测参数为,=X,n-1,，则其误差值得到一个新的序列,10,，,2,，,2,，,2,，,2,，,2,。然后再使用行程编码方法对这个新序列进行压缩，压缩结果为,10(5,2),。,X,n,差分脉冲调制预测,适用于输入数据为平稳的随机过程,预测器设计是预测编码系统的核心，预测器的复杂程度与线性预测中使用以前的样本数有关，样本数越多，预测器越复杂,对预测误差的量化是造成图像质量下降的主要原因，表现为：,斜率过载：图像轮廓变模糊,颗粒噪声：图像在平坦区出现颗粒状的细斑,边缘忙乱：在变化不快的边缘出现闪烁不定现象,伪轮廓：在图像亮度值缓慢变化区域出现伪轮廓,3.,双向预测,前向预测：就是用,K-,1,帧来预测,K,帧图像。,后向预测：用,K,帧预测前面的,K,-1,帧图像。,双向预测：用前、后两帧来预测中间帧图像。,图双向预测示意图,图,I,、,P,和,B,图像的依赖关系,I,帧：帧内图,(Intra Picture),只做帧内编码,P,帧：预测图,(Predicted Picture),前向预测帧,B,帧：双向图,(Bidirectional Picture),双向预测帧,（,1,）,I,帧,I,帧采用类似,JPEG,的编码方式实现。它不以任何其他帧做参考帧，仅仅进行帧内的空域冗余压缩。,（,2,）,P,帧,P,帧是由一个过去的,I,帧或,P,帧采用运动补偿的帧间预测进行更有效的编码方式。图像,P,由残差图像,SAD,和运动矢量,MV,组成。,DCT+,量化,+RLE,图,5-12,运动自适应帧内插,（,3,）,B,帧,B,帧是用过去的图像,(I,帧或,P,帧,),和后来的图像帧,(I,帧或,P,帧,),，采用运动补偿的双向预测编码方式。,DCT+,量化,+RLE,4.,像素块预测,MPEG,编码时，先将一帧图像分割成若干横条，每一横条称为一片，在,625,行的,PAL,制中，每帧图像切成,18,片，在,525,行的,NTSC,制中，每帧图像切成,15,片。,每一片再纵向切割成,22,块，这些块称为宏块或大块，它是,MPEG,标准的图像处理基本单元。,每个宏块中的彩色图像，可以用一个亮度信号,Y,和两个色差信号,Cb,和,Cr,来表示，由于人眼对亮度信号敏感高于色度信号，因而对每个宏块的亮度信号再平均分成,4,个像块。,每个像块在水平方向分成,8,个像素，垂直方向也分成,8,个像素，则每个像块可分成,64,个像素，而两个色差信号,Cb,、,Cr,宏块不再分成像块，而是直接分成,64,个像素，如图,5-8,所示。,图,5-8 MPEG,图像的格式,在图像编码领域目前使用的运动估值算法有块匹配法、像素递归法、相位相关法以及针对由摄像机运动引起图像全局运动的全局运动参数估值等。,其中块匹配法是最常用的一种方法，在活动视频编码的国际标准,H.261,、,MPEG-1,、,MPEG-2,中，实际都采用块匹配法做运动估值。,变换编码的基本原理就是将原来在空间域或时间域内描述的信号，变换到正交矢量空间（频域或变换域）中去，用变换系数来表示原始图像，并对变换系数进行编码。,3.3.2,变换编码,尽管变换本身并不带来数据压缩，但由于变换后信号的能量大部分集中于少数几个变换系数上，删去对信号贡献较小（方差小）的系数，就可以达到有效压缩的目的，并且不会引起明显的失真。,正交变换,K-L,变换,离散余弦,DCT,变换,K-L,变换只是理论上的最佳方法，由于本身没有通用的变换矩阵，计算量大，应用起来不现实。,在实际编码工作中，人们更常采用离散余弦变换（,DCT,）。它也是正交变换，非常接近,K-L,变换，效果仅次于,K-L,变换。,对大多数图像信源来说，,DCT,变换是在现行变换编码方法中最接近,K-L,变换的方法。,图,5-16,变换编码系统框图,实现变换编码可以分,4,个步骤完成：,第,1,步是选择方块的大小，较好的方块尺寸是,44,（,H.264,）、,88,（,H.261,，,JPEG,，,MPEG,）或,1616,；,第,2,步是选择变换类型，,DCT,变换是目前应用最广泛的一种类型；,第,3,步是选择变换系数，并对其进行高效的量化，以便传输或存储；,第,4,步是对量化系数进行比特分配即编码，通常使用,Huffman,编码或游程编码。,1,二维,88 DCT,变换,图,5-17 DCT,后系数,图,5-18 Z,字形扫描,图,5-20 8,8,亮度抽样信号的,DCT,压缩编码实例,图,5-20 8,8,亮度抽样信号的,DCT,压缩编码实例,Z,字形扫描和,0,游程编码,按顺序记录数据，直到最后一个非,0,数据，然后加上块结束码,EOB,。,解码端收到,EOB,后自动补,0,，直至补够,64,个系数。,图,5-21,转换扫描示意图,转换扫描：,MPEG-2,中采用，适用于隔行扫描。,3.3.3,统计编码,根据信息码字出现的概率分布特性寻找概率与码字长度间的最优匹配，据此对信息进行压缩，这就是统计编码方法。,常用的统计编码有霍夫曼（,Huffman,）编码、游程编码和算术编码三种。,哈夫曼编码,最佳编码定理,哈夫曼,1952,年提出,内容：在变字长编码中，对于出现概率大的信息符号编以短字长的码，对于概率小的符号编以长字长的码。如果码字长度严格按所对应符号出现概率大小逆序排列，则平均码字长度一定小于其他以任何符号顺序排列方式得到的平均码字长度,.,哈夫曼编码,编码方法,步骤,1.,将符号按出现概率由大到小排列，给最后两个符号赋予一个二进制码，概率大的赋,1,，小的赋,0,（反之亦可）,;,2.,把最后两个符号的概率合成一个概率，重复上一步,;,3.,重复步骤,2,，直到最后只剩下两个概率为止,;,4.,将每个符号所对应的分支的,0,1,反序排出即可,.,可以看出，概率大的符号其编码短，概率小的符号其编码长，符号使用其编码来表示，达到数据压缩目的。,哈夫曼编码过程演示,A1,A2,A3,A4,A5,A6,A7,0.23,0.21,0.18,0.15,0.13,0.07,0.03,1,0,0.10,1,0,0.23,1,0,0.33,1,0,0.44,1,0,0.56,0,1,1,编码,01,00,111,110,101,1001,1000,哈夫曼编码,哈夫曼编码过程演示,哈夫曼编码,哈夫曼编码结果分析,编码,01,00,111,110,101,1001,1000,码长,2,2,3,3,3,4,4,码字的平均长度,_ 7,N=n,i,P(a,i,)=2.72bit,i=1,信息符号的熵值,7,H(a,)=P(a,i,)log2P(a,i,)=2.61bit,i=1,编码效率：,=,2.61/2.72,96%,可见，哈夫曼编码结果，其平均长度接近于信息符号的熵值，但是仍有冗余。,哈夫曼编码,哈夫曼编码最佳情况示例,信源有四个符号：,X a1 a2 a3 a4,1/2 1/4 1/8 1/8,信息熵：,H(x,)=-1/2,log,2,(1/2)-1/4,log,2,(1/4)-1/8,log,2,(1/8),2=1.75 bit/,字符,哈夫曼编码,a,1,a,2,a,3,a,4,1/2,1/4,1/8,1/8,符号,概率,0,1,1/4,0,1,1/2,0,1,1,编码,0,10,110,111,采用哈夫曼编码（二进制编码）,a1 a2 a3 a4,_,0 10 110 111,平均码长：,N=(1/2),1+(1/4),2+(1/8),6=1.75 bit/,字符,编码效率：,=1.75/1.75=100%,哈夫曼编码最佳情况示例,图像的子带编码（,Subband,Coding,，,SBC,）是从语音的子带编码移植过来的。,子带编码与变换编码一样，是一种在频率域中进行数据压缩的方法。,3.3.4,子带编码（,SBC,）,取样后的信号经过量化、编码，合并成一个总的码流传送给接收端。,在接收端，首先把码流分成与原来的各子带信号相对应的子带码流（分频），然后解码，将频谱搬移至原来的位置，最后经带通滤波器后，合并得到重建的信号。,图,5-28 4,子带为基础的树状分裂结构,二维子带编码,图,5-29 140Mbit/s HDTV,子带编码系统框图,3.4,数字视频编码标准,JPEG,标准,MPEG,标准,ITU-R BT.601,数字视频标准,H.26X,标准,H.323,可视通信系统标准,

展开阅读全文