资源描述
教师授课教案
/ 学年 第 学期 课程 多媒体技术
章节课题
第三章 多媒体数据压缩编码技术
授课方法
讲授
所需教具
授课时间
月 日 节
月 日 节
月 日 节
授课班级
目的要求:
了解数据压缩的基本原理
旧知复习:多媒体数据的特点
重点难点:数据压缩的基本原理
教学过程:(包括主要教学环节、时间分配)
一、 复习提问(5分)
二、 讲授新课
1. 数据压缩技术概述(20分)
2. 统计编码(40)
3. 预测编码(20分)
三、 总结(3分)
四、 布置作业(2分)
课后作业:P254 一、3 二、3
教学后记:
任课教师: 教研室主任
新课导入:在多媒体信息中包含有大量冗余的信息,把这些冗余信息去掉,实现了压缩。
第3章 多媒体数据压缩编码技术
一、 多媒体数据的特点:
l 数据量巨大
l 数据类型多
l 数据类型间区别大
l 多媒体数据的输入输出复杂
二、 多媒体数据压缩编码的重要性
数据两巨大:存储、传输、处理耗时耗空间
三、 多媒体数据压缩的可能性
在多媒体信息中包含有大量冗余的信息,把这些冗余信息去掉,实现了压缩。
l 冗余信息包括:
(1) 空域相关:在每一帧的相邻像素之间相关性很大,有很大的信息冗余量
(2) 时域相关:相邻帧之间存在很大的信息冗余量
(3) 视觉掩盖效应
四、 数据压缩技术的三个指标
(1) 压缩前后所需的信息存储量之比要大
(2) 实现压缩的算法要简单
(3) 恢复效果要好
六、数据压缩的基本原理
有40余年历史,常用压缩编码方法:
u 冗余压缩法(无损压缩):就是信息保持编码或熵编码。具体讲就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。
u 有损编码(熵压缩法):失真度编码或熵压缩编码。也就是讲解码图像和原始图像是有差别的,允许有一定的失真
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分类为:
(1)无损压缩编码种类
² 哈夫曼编码
² 算术编码
² 行程编码
² Lempel zev编码
(2)有损压缩编码种类
² 预测编码:DPCM,运动补偿
² 频率域方法:正文变换编码(如DCT),子带编码
² 空间域方法:统计分块编码
² 模型方法:分形编码,模型基编码
² 基于重要性:滤波,子采样,比特分配,矢量量化
(3)混合编码
² JBIG,H261,JPEG,MPEG等技术标准
八、变长编码
使用长度可变的代码来对以不同频率出现的样本进行编码,主要用于消除代码冗余。
1. HUFFMAN编码:对统计独立信源达到最小平均码长的编码方法。原理:对代码长度不均匀的编码,按信源符号出现的概率大小进行排序,出现概率大的分配短码,出现概率小的则分配长码
霍夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长 度最短的码字,有时称之为最佳编码,一般就叫作Huffman编码。下面引证一个定理,该定 理保证了按字符出现概率分配码长,可使平均码长最短。
定理:在变字长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平 均码字长度为最小。
现在通过一个实例来说明上述定理的实现过程。设将信源符号按出现的概率大小顺序排列为 :
U:
(
a1
a2
a3
a4
a5
a6
a7
)
0.20
0.19
0.18
0.17
0.15
0.10
0.01
给概率最小的两个符号a6与a7分别指定为“1”与“0”,然后将它们的概率相加再与原来的 a1~a5组合并重新排序成新的原为:
U′:
(
a1
a2
a3
a4
a5
a6′
)
0.20
0.19
0.18
0.17
0.15
0.11
对a5与a′6分别指定“1”与“0”后,再作概率相加并重新按概率排序得
U″:(0.26 0.20 0.19 0.18 0.17)…
直到最后得 U″″:(0.61 0.39)
分别给以“0”,“1”为止 }
霍夫曼编码的具体方法:先按出现的概率大小排队,把两个最小的概率相加,作为新的概率 和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变成1。每次相 加时都将“0”和“1”赋与相加的两个概率,读出时由该符号开始一直走到最后的“1”, 将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。
例如a7从左至右,由U至U″″,其码字为0000;
a6按践线将所遇到的“0”和“1”按最低位到最高位的顺序排好,其码字为0001…
用霍夫曼编码所得的平均比特率为:Σ码长×出现概率
上例为: 0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit
可以算出本例的信源熵为2.61bit,二者已经是很接近了。
2. 算术编码:二元码的编码方法
定义:是一种二元码的编码方法,在不考虑信源统计的情况下,只要监视一小段时间内码出现的频率,不管统计是平稳的或非平稳的,编码的码率总能趋近于信源熵值,每次迭代时的编码算法只处理一个数据符号,并且只有算术运算。
原理:也是一种统计编码,每个符号对应0到1上的一段子区间,区间长度为该符号出现的概率。该方法将被编码的符号串(数值串)表示成实数0到1之间的一个区间。初始把它设为整个区间。当出现一个新的待编码符号,先把完整的0到1区间映射到上一次形成的区间,然后新区间取为0到1上的新符号对应区间所映成的像。解码时,根据区间的覆盖性来逐一解出原符号串。
九、预测编码:由于离散信号见存在一定关联性,因此可以根据前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差值进行编码。预测的越准确,则误差信号就越小,这样,就可以用较小的数码对误差信号进行编码,进而达到压缩的目的。
根据某一数据模型利用以往的样本值对新样本值进行预测,然后将样本实际值与预测值的差值进行编码。如果模型足够好,且样本序列的时间相关性较强,那么误差信号的幅度将远小于原始信号,可以用较少的值对其差值量化,得到较好的压缩效果。预测编码常用的是差分脉冲编码调制(DPCM)和自适应的差分脉冲编码调制(ADPCM)。
教师授课教案
/ 学年 第 学期 课程 多媒体技术
章节课题
第三章 多媒体数据压缩编码技术
授课方法
讲授
所需教具
授课时间
月 日 节
月 日 节
授课班级
目的要求:
了解各种编码方法及各种压缩标准
旧知复习:数据压缩的技术指标
重点难点:各种编码方法及各种压缩标准
教学过程:(包括主要教学环节、时间分配)
五、 复习提问(5分)
六、 讲授新课
1. 变换编码(10分)
2. 其他编码(30)
3. 静态图象压缩标准(10分)
4. 动态图象压缩标准(10分)
5. MPEG-1的实现过程(10分)
6. H.261与H.263(10分)
七、 总结(3分)
八、 布置作业(2分)
课后作业:教学后记:
任课教师: 教研室主任
新课导入:其他压缩算法
第3章 多媒体数据压缩编码
视频信号的压缩编码
一、视频信号的压缩编码分类
1. 在多媒体系统中,图象压缩方法主要是利用消除图象在空间和时间上很强的相关性带来的数据冗余度来满足应用要求。
2. 图象压缩方法分为两类:有损压缩和无损压缩
无损压缩:利用数据的统计特性来进行数据压缩,典型的编码:Huffman编码、算术编码等。特点:不失真;压缩比低
有损压缩:利用人的视觉特性使解压缩后的图像看起来与原始图像一样。
特点:压缩比高
如:预测编码、变换编码、模型编码及混合编码等。
二、视频信号压缩编码的标准
1. 多灰度静止图像的数字压缩标准(JPEG)
JPEG是联合图象专家组(JointPictureExpertGroup)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。和相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前静态图象中压缩比最高的。而图象质量都差不多(JPEG处理的颜色只有真彩和灰度图)。正是由于JPEG的高压缩比,使得它广泛地应用于多媒体和网络程序中,例如HTML语法中选用的图象格式之一就是JPEG(另一种是GIF)。
JPEG算法的原理是利用单帧内的空间相关性,减小空间冗余度,这种方式称为帧内编码。
2. MPEG标准
MPEG是MovingPicturesExpertsGroup(动态图象专家组)的缩写。这个专家组始建于1988年,专门负责为CD建立视频和音频标准,其成员均为视频、音频及系统领域的技术专家。最早MPEG的缔造者们原先打算开发四个版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4,以适用于配合不同带宽和数字影像质量的要求。后由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。所以现存只有三个版本:MPEG-1,MPEG-2,MPEG-4。如果说,MPEG-1“文件小,但质量差”;而MPEG-2则“质量好,但更占空间”的话,那么MPEG-4则很好的结合了前两者的优点。它于1998年10月定案,在1999年1月成为一个国际性标准,随后为扩展用途又进行了第二版的开发,于1999年底结束。MPEG4主要应用于视像电话(VideoPhone),视像电子邮件(VideoEmail)和电子新闻(Electronicnews)等,对传输速率要求较低,在4800-64000bits/sec之间。利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少的数据获得最佳的图像质量。MPEG-4的特点是其更适于交互AV服务以及远程监控。这是一个有交互性的动态图像标准。从目前的情况看,MPEG-4很可能会被用于三个领域内:数字电视、交互式的图形应用(包括内容上的合成技术)、交互式多媒体领域等。MPEG-4提供了标准的技术使其能被整合到产品、分类、内容访问等过程中去。
Ø MPEG-1标准(ISO/IEC11172)制定于1992年,是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际标准,主要用于在CD-ROM(包括Video-CD、CD-I等)存储彩色的同步运动视频图像,它针对SIF(标准交换格式)标准分辨率(NTSC制为352×240;PAL制为352×288)的图像进行压缩,每秒可播放30帧画面,具备CD(指激光唱盘)音质。同时,它还被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)、教育网络等。
使用MPEG-1的压缩算法,可以将一部120分钟长的电影压缩到1.2GB左右,因此,它被广泛地应用于VCD制作和一些视频片段的下载,目前90%以上的VCD都是用MPEG-1格式压缩的。
Ø MPEG-2标准ISO/IEC13818)制定于1994年,是针对3~10Mbps的数据传输率制定的的运动图像及其伴音编码的国际标准。MPEG-2可以提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量和带宽的要求。它在与MPEG-1兼容的基础上实现了低码率和多声道扩展:MPEG-2可以将一部120分钟长的电影压缩到4~8GB(它提供的是我们通常所说的DVD品质),其音频编码可提供左右中及两个环绕声道、一个加重低音声道和多达7个伴音声道(因此DVD可有8种语言配音)。
除了作为DVD的指定标准外,MPEG-2还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来说,由于现在电视机分辨率的限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,倒是其音频特性(如加重低音、多伴音声道等)得到了广泛的应用。
Ø MPEG-3是ISO/IEC最初为HDTV(高清晰电视广播)制定的编码和压缩标准,但由于MPEG-2的出色性能已能适用于HDTV,因此MPEG-3标准并未制定,我们通常所说的MP3指的是MPEGLayer3,只是MPEG的一个音频压缩标准。
Ø MPEG-4于1998年11月公布,预计投入使用的国际标准MPEG-4是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。为此,MPEG-4引入了AV对象(Audio/VisualObjects),使得更多的交互操作成为可能:
“AV对象”可以是一个孤立的人,也可以是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。
MPEG-4对AV对象的操作主要有:采用AV对象来表示听觉、视觉或者视听组合内容;组合已有的AV对象来生成复合的AV对象,并由此生成AV场景;对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据;允许接收端的用户在AV场景中对AV对象进行交互操作等。
MPEG-4标准则由6个主要部分构成:
1、DMIF(TheDeliveriesMultimediaIntegrationFramework,多媒体传送整体框架)。主要用于解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的连接与传输。
2、数据平面。为了使基本流和AV对象在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(ChannelAssociationTag)相连,CAT可实现该流的顺利传输。
3、缓冲区管理和实时识别。MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。
4、音频编码。MPEG-4不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
5、视频编码。与音频编码类似,MPEG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。
6、场景描述。MPEG-4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息组成场景描述,用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。
MPEG-4的应用
与MPEG-1和MPEG-2相比,MPEG-4更适于交互AV服务以及远程监控,它的设计目标使其具有更广的适应性和可扩展性:MPEG-4传输速率在4800-64000bps之间,分辨率为176×144,可以利用很窄的带宽通过帧重建技术压缩和传输数据,从而能以最少的数据获得最佳的图像质量。因此,它将在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、Internet/Intranet上的视频流与可视游戏、DVD上的交互多媒体应用等方面大显身手。
当然,对于普通用户来说,MPEG-4在目前来说最有吸引力的地方还在于它能在普通CD-ROM上基本实现DVD的质量:用MPEG-4压缩算法的ASF(AdvancedStreamingformat,高级格式流)可以将120分钟的电影压缩为300MB左右的视频流;采用MPEG-4压缩算法的DIVX视频编码技术可以将120分钟的电影压缩600MB左右,也可以将一部DVD影片压缩到2张CD-ROM上!也就是说,有了MPEG-4,你不需要购买DVD-ROM就可以享受到和它差不多的视频质量!播放这种编码的影片对机器的要求并不高:只要你的电脑有300MHz以上(无论是哪种型号)的CPU、64MB内存、8MB的显卡就可以流畅地播放。
不过,和DVD相比,MPEG-4属于一种高比率有损压缩算法,其图像质量始终无法和DVD的MPEG-2相比,毕竟DVD的存储容量比较大。此外,要想保证高速运动的图像画面不失真,必须有足够的码率,目前MPEG-4的码率虽然可以调到和DVD差不多,但总体效果还有不小的差距。因此,现在的MPEG-4只能面向娱乐、欣赏方面的市场,那些对图像质量要求较高的专业视频领域暂时还不能采用。
三、数字视频图像编码的有关技术
1、彩色空间和变换
彩色模型
彩色空间转换
公式见书:P66
2、广播视频标准
①、 NTSC视频标准
②、 PAL视频标准
③、 SECAM视频标准
④、 HDTV
四、JPEG静止图像压缩算法
1、在图像压缩率方面是 / 或接近当前的科学水平,图像的保真度在较宽的压缩范围里的评价是“很好”、“优秀”到与原图像“不能区别”。
2、可实际应用于任何一类数字图像源,如对图像的大小、色彩空间、像素的长宽比、图像的内容、复杂程度、颜色数及统计特性等都不加限制。
3、在计算的复杂程度方面可以调整,因而可根据性能和成本要求来选择用软件执行还是用硬件执行。
4、JPEG算法,具有以下四种工作方式:
Ø 顺序编码
Ø 累进编码
Ø 无失真编码
Ø 分层编码
五、MPEG运动图像压缩算法
六、H.261视听通信编码、解码标准
9
展开阅读全文