资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,6,章 多媒体数据的压缩,6.1,数据压缩概述,数据压缩的必要性,数据冗余,6.2,数据压缩的基本原理,信息编码基础,数据压缩方法,6.3,数据压缩的编码算法,统计编码(,行程编码 哈夫曼编码 算术编码),预测编码,变换编码,6.4,常用多媒体数据压缩标准,音频压缩编码标准,静态图像压缩标准,动态图像压缩标准视频压缩编码标准,6.1,数据压缩概述,1,、,压缩的必要性,声音、图像、视频和动画的数据量太大,声音,1,分钟立体声音乐采样频率为,44.1KHZ,,,16,位量化精度的数据量为,44.1*1000*16*2 *60/8=10.09MB,存储一首,4,分钟的歌曲约需,40MB,图像,1,副,640*480,的,RGB,彩色图像的存储容量为,640*480*24/8 =900KB,视频,1,秒钟(,25,帧,/,秒)的视频数据量为,25*900KB=21.97 MB,1,张,650MB,的,CD ROM,光盘只能存储约,650/21.97=29.59,秒的视频,2,数据冗余,空间冗余:图像内部相邻像素之间的相关性,时间冗余:视频序列中前后帧之间的相关性,视觉或听觉冗余(人眼或人耳具有一定的掩蔽效应),知识冗余(具有规律性的结构,用于图像理解上,如人脸),统计冗余(出现的频率具有一定的规律性,如元音多,有些辅音很少出现),结构冗余(具有纹理结构的图像区域),信息熵冗余(又叫编码冗余,用相同位数进行编码产生的冗余),6.2,数据压缩的基本原理,1,、信息编码基础,压缩的实质:,根据数据的内在联系将数据从一种编码映射为另一种编码,又叫,压缩编码,。,编码器,(压缩),存储器,或网络,解码器,(解压缩),输入数据,输出数据,数据压缩过程,数据压缩方法的衡量指标,压缩率:越大越好,压缩质量:数据失真越小越好,压缩与解压缩的速度:速度越快越好,2,、数据压缩方法,无损压缩,有损压缩,混合编码,预测编码,变换编码,PCM,编码,DPCM,编码,ADPCM,编码,帧间预测编码,离散余弦变换,K-L,变换,小波变换,JPEG,MPEG,H.261,行程,编码,哈夫曼,编码,算术编码,香农编码,LZW,编码,统计编码,6.3,数据压缩的编码算法,一、无损压缩:,减少或去除数据中的冗余,可以无失真地还原成原来的数据,一般适合压缩数据或程序,但是压缩比较小,一般在,2,:,1,到,5,:,1,之间。,序号,编码方法,基本原理,1,行程编码,将重复出现的数值序列采用出现次数和单个数值来表示,2,哈夫曼编码,利用不同码字出现的概率不同,出现概率大的码字短,出现概率小的码字长。,3,算术编码,将编码的消息表示成,0,到,1,之间的一个间隔,消息越长,间隔就越小,编码所需二进制位数越多。,1.,行程编码(游程编码),原理,:,将连续相同的数据序列用重复次数和单个数据来表示。,应用:,用于图像文件的压缩(尤其适合于由计算机生成的图像)如,bmp,和,tiff,等图像格式。,(,1,)多值信息的编码,编码格式:信息重复次数,+,被重复的信息,例:字符串为:,atttefppppppddddss,行程编码为:,a3tef6p4d2s,(,2,)二值信息的编码,编码格式:,0,或,1,重复的次数,例如二进制数据流为,000111111000001111,假设行程约定以,0,开始,则编码为:,3654,若约定以,1,开始,则编码为:,03654,2.,哈夫曼(,Huffman,)编码,算法步骤:,(,1,)按照符号出现的概率大小进行排序,(,2,)把最小的两个概率值相加,得到一个新的概率序列,(,3,)重复上述两个步骤,直到概率值为,1,(,4,)从后往前进行编码,概率大的赋予,1,,概率小的赋予,0,。(反过来也可以,),(,5,)写出每个符号的码字,例,1,:字母,A B C D E,出现的概率分别为,0.15,、,0.25,、,0.1,、,0.37,和,0.13,,,其哈夫曼编码为:,P(C)=0.1,P(E)=0.13,P(CE)=0.23,P(A)=0.15,P(ACE)=0.38,P(B)=0.25,P(D)=0.37,P(BD)=0.62,P(ACEBD)=1,0,0,0,0,1,1,1,1,A:00,B:10,C:010,D:11,E:011,假设共有,100,个字符,若采用等长编码,每个字符至少需要,3,位二进制,,100,个字母需要,300,位,采用哈夫曼编码则只需要,15*2+25*2+10*3+37*2+13*3=223,位。,压缩比为,300,:,223=1.34,:,1,例,2,:字母,A B C D E,出现的概率分别为,0.53,、,0.25,、,0.07,、,0.05,和,0.1,,,其哈夫曼编码为:,A:1,B:01,C:0011,D:0010,E:000,若采用等长编码,至少需要,3,位二进制,,100,个字母需要,300,位,采用哈夫曼编码则需要,:,53*1+25*2+7*4+5*4+10*3=181,位,压缩比为,300,:,181=1.65:1,0,P(E)=0.1,P(D)=0.05,P(C)=0.07,P(DC)=0.12,P(EDC)=0.22,P(B)=0.25,P(EDCBA)=1,0,0,0,1,1,1,P(EDCB)=0.47,P(A)=0.53,0,1,3,、算术编码,编码原理:,将被编码信源表示为,0,,,1,)区间的一个实数,根据各符号出现的概率构造其所在区间,随着信息字符的不断出现,其所在区间越来越小,对应表示的实数也越来越小,那么表示这一消息所需的二进制位数就越多。,例,:,假设一个,4,个符号的信源,A=a1,,,a2,,,a3,,,a4,,各符号出现的概率及起始编码区间如下表。,信号字符,出现概率,编码范围,a1,0.2,0,0.2),a2,0.4,0.2,0.6),a3,0.2,0.6,0.8),a4,0.2,0.8,1.0),如果要传送的消息为,a1a2a3a2,,算术编码过程为:,区间计算方法:,新区间起始位置:,前面区间起始位置,+,当前区间左端*前面区间长度,新区间长度:,当前符号的概率*前面区间长度,a1,,取值区间为,0,,,0.2),a2,,起点:,0+0.2*0.2=0.04,,长度,0.4*0.2=0.08,,新区间为,0.04,,,0.12),a3,,起点:,0.04+0.6*0.08=0.088,,长度,0.2*0.08=0.016,,新区间为,0.088,,,0.104),a2,,起点:,0.088+0.2*0.016=0.0912,,长度,0.4*0.016=0.0064,,新区间为,0.0912 0.0976),信息:,a,1,a,2,a,3,a,2,信源符号,0.2 0.12 0.104 0.0976,0 0.04 0.088 0.0912,输出区间内任一数,编码区间,a4,a3,a2,a1,0.2,0.6,0.8,0,1,二、,有损压缩:,压缩时会丢失部分数据,且丢失的数据无法恢复。是不可逆的压缩,即解压缩以后的数据与原始数据不完全一致。,序号,编码方法,基本原理,1,PCM,编码,(脉冲编码调制),将模拟量经过采样、量化和编码得到其数字编码。,2,预测编码,根据算法模型,用已有的样本值对新样本进行预测,得到一个预测值,将实际值与预测值相减得到预测误差,再,对该误差值进行编码,,如果预测越准确,误差值就越小(那误差的幅度肯定小于原始信号),那编码所需的位数就可以减少,达到压缩的目的。,3,变换编码,将原始信号从一个域(如时间域)变换到另一个域(如频率域),然后对变换后的信号进行编码。主要用于图像数据的压缩。,1.PCM,(,Pulse Code Modulation,脉冲编码调制),采样:,按固定时间间隔获取一个样本值,量化:,按允许的误差将样本对应到近似的数值(幅度上的离散化)。有均匀量化和非均匀量化。,编码:,用二进制代码表示采样量化后的样本值。,2.,预测编码,(,1,),DPCM,(差分脉冲编码调制),编码器,量化器,输入,预测器,编码器,信道,信道,s,+,-,e,e,+,+,s,s”,编码器,预测器,+,+,s,s”,e,输出,解码器,原始信号为:,s,,预测器产生的预测值为:,s”,预测误差:,e=,s-s,”,发送端:,发送经过量化的误差,e,接收端:,用相同的预测器获得预测值,s”,输出,s=,s”+e,最终误差为:,s-s,=,s”+e-s,=,e (,s-s,”)=,e-e,(即量化器产生的量化误差),(,2,),ADPCM,(自适应脉冲编码调制),自适应量化:,当信号分布不均匀时,能随输入信号的变化改变量化区间的大小。,自适应预测:,采用过去的样本值估算下一个输入样本的预测值,得到最小的实际样本值与预测值之间的差值。,(,3,)帧间预测编码,利用视频图像各帧之间的时间相关性,减少帧内图像信号的冗余,即不直接传送当前帧的像素值,而是传送,x,和其前一帧或后一帧对应像素,x,之间的差值。,运动补偿的帧间预测,帧间内插法,(,4,)线性预测编码(,Linear Predictive,Coding,LPC,),采用过去的样本值,以一种前向反馈的方式预测当前采样值,预测值可以用过去,p,个样本值的线性组合来表示。该方法被广泛应用于,语音处理,。,3.,变换编码,将图像信号从一个域(如时间域)变换到另外一个域(如频率域),然后对变换后的信号进行量化与编码。,正交变换前两个样本的联合事件,正交变换后两个样本的联合事件,例,:,有两个相邻的数据样本,x1,和,x2,每个样本采用,3bit,编码,各自都有,8,个幅度等级,两个样本的联合事件共有,64,种可能,用,64,个点表示。对一般的像来说,两个相邻的数据样本很有可能出现近似的幅度,即很可能出现在,x1=x2,直线附近。,对该数据进行正交变换,将坐标系逆时针,旋转,45,度,在新坐标系中,y1,对应到,x1=x2,这条,直线,那么变换后的数据样本集中在,y1,轴上,,对这部分数据进行量化、编码和传输,其他,数据不做处理,这样就达到了压缩数据的目的,。,常用的变换编码方法有:,1,、,K-L,变换,2,、傅立叶变换,3,、离散余弦变换等,1,电话语音压缩标准,数据:,带宽为,200Hz,3.4kHz,,采样频率为,8kHz,,,8,位量化,传输速率为,64kb/s,语音压缩标准,:,G.722,(,64kb/s,)、,G.721,(,32kb/s,)、,G.728,(,16kb/s,)和,G.729,(,8kb/s,),应用:,数字电话通信。,6.4,常用多媒体数据压缩标准,6.4.1,音频压缩标准,2.,调幅广播语音压缩标准,数据:,带宽为,50hz,7khz,的调幅广播语音,使用,16kHz,采样频率和,14,位量化位数时,所对应的速率为,224kb/s,。,语音压缩标准,:,G.722,应用:,优质语音、音乐、音频会议和视频会议等。,3,高保真立体声的宽带音频压缩标准,数据:,采样频率,44.1kHz,,用,16,位量化,速率为每声道,705 kb/s,。,语音压缩标准,:,MPEG,音频,MPEG-1,音频:,层,(简化的,ASPEC,),层,(即,MUSICAM,,又称,MP2,),层,(又称,MP3,)。,MPEG-2,音频:多声道,,5.1,声道形式及,7.1,声道形式,应用:,影剧院、家庭影院系统,及将来的高清晰度电视(,HDTV,),。,6.4.2,静态图像压缩标准,JPEG,(,joint photographic experts group,)联合照片专家组,1.JPEG,标准,适应于彩色和单色多灰度或连续色调的静止数字图像。支持很高的图像分辨率和量化精度,具有较高的压缩比和图像质量。包含了基于,DCT,的有损压缩方法和基于预测方法的无损压缩方法。,2.JPEG2000,标准,特征:支持,低比特率传输,支持无损和有损压缩,象素精度和分辨率的渐进式传输,感兴趣域编码,随机码流访问和处理。,经典算法:,包含三个部分:小波变换、画布坐标系统、嵌入式优化截断编码(,EBCOT,)。,压缩标准,屏幕比例,分辨率,帧频,备注,MPEG-1,4,:,3,352x240,29.97,NTSC,制式,MPEG-1,4,:,3,352x288,25,PAL,制式,MPEG-2,4,:,3,720480,29.97,NTSC,制式,MPEG-2,4,:,3,720576,25,PAL,制式,HDTV,16,:,9,1920*1080p,60,逐行,但并没有信号源,HDTV,16,:,9,1920*1080i,60,隔行扫描,中国标准,HDTV,16,:,9,1280*720p,60,逐行,中国标准,6.4.3,运动图像和视频压缩编码标准,MPEG,:运动图像专家组(,Moving Picture Experts Group,),MPEG,标准和,HDTV,标准,视频压缩标准,1,H.261,和,H.263,标准,国际电信联盟电信标准组织,ITU-T,制定,H.261,:,主要用来支持在,ISDN,上进行可视电话、视频会议和其它视听服务。,H.263,:,主要用于公共电话交换网络(,PSTN,)上的视频会议和其它可视化服务,旨在以尽可能低的码率(,64kpbs,以下)进行通信。,2,H.26L,标准,在所有码率下都能持续提供较高的视频质量。,支持的图像格式常用的有,CIF,和,QCIF,。,更高的压缩效率,更灵活的网络适应性,增强对于差错的鲁棒性。,3,AVS,标准,2002.6,国家信息产业部科学技术司批准成立,数字音视频编解码技术标准工作组,,简称,AVS,工作组。,2006.3,成为中国,音视频编解码技术标准。,2007.5,成为国际上四个可选视频编码标准之一。,
展开阅读全文