多媒体数据压缩考试要点.docx

资源描述

1、熵对数据压缩编码的理论意义信源的熵是对该信源进行无失真编码的极限对信源进行无失真编码的最低码率就是该信源的熵如果对信源进行编码的码率小于信源的熵，则这种编码是有失真的 2、例：某一信源X有四个符号，其出现概率为： · 则该信源的熵为： = 1.75 bit/符号平均码长L= =1/2*1+1/4*2+1/8*3= 1.75 bit/符号 3、启示１：只要信源不是等概率分布的，就存在无失真数据压缩的可能性。启示２：既然非负，严格上凸，且等概率时达到最大，任一pj=1时达到最小值0，那么我们可以通过某中变换 T: 　，使中某一个符号发生的概率尽可能大（）使其他的尽可能小（），这将有利于压缩，这就是变换编码的途径之一。 4\ 研究在限定失真下为了恢复信源符号所必需的编码率，简称率失真理论。 5. ——表示输入为Ｘ，输出为Ｙ时，整个系统所具有的不确定程度 6、 7、可见，只要允许误差存在，就可以减少编码输出的字符数，降低码率。输出字符数越少，译码误差失真就越大。 8、则平均失真 9、 10、率失真函数是在允许失真为D的条件下，信源编码给出的平均互信息量的下界。 ——有失真时的信源编码的逆定理当编码码率R<时，无论用何种编码方式，其平均失真必大于D 11、变长码要正确识别码字起点就不是那么容易了，并且还存在着唯一可译性等问题。 12、哈夫曼(Huffman)编码 ① 将信源符号出现概率按减小的顺序排列； ② 将两个最小的概率进行组合相加，并继续这一步； ③ 对每队组合中的上边指定为1，下边指定为0； ④ 画出由每个信源符号概率到1、0处的路径，记下路径的1和0； ⑤ 对于每个信源符号，写出1、0序列。则从右到左就得到哈夫曼码。哈夫曼编码的缺点：需要统计概率需要存储或传输码表数据流 13、游程长度(RL):由字符(或信号采样值)构成的数据流中各个字符重复出现而形成字符串的长度。形成串的字符、串的长度及串的位置 RL Sc aj 14、MH/MR编码一 Modified Huffman (MH) MH码的主要方法是：以多帧标准传真图像样本为统计依据，根据各种RL的出现的概率编出哈夫曼码表，实际过程只是查表，可以实时处理。由于规定每行标准取样1728点，又根据统计结果，实际RL在0—63居多，故MH编码表分为结尾码与组合基于码。编码规则如下： ① RL=0—63,用一个相应的结尾码表示； ② RL=64—1728，用一个组合基于码加一个补充结尾码，例如RL(白)=128,其编码为10010 00110101 补充结尾码为０(白)。　若RL(白)=129，则其编码为10010 000111 ③ 规定每行都从白游程开始，若实际扫描行由黑开始，则需要在行首加零长度的游程；每行结束时，要加行同步码EOL，每页文件第一个数据前加EOL; ④ 为了同步操作的需要,规定一个编码的结束时间T最小为20ms，最大为5 s，不是20ms的行需要再EOL之前填充足够的0，不可填在数据中间。 ⑤ 每行恢复像素应为1728个，否则认为该行的传输有误。 ⑥ 连续发6个EOL码，表示文件传输结束，转回控制规程，以后发送机将按照帧格式的CCITT建议Ｔ.30规定的控制信号速率发送各种报文后命令。 15、MR编码是MH编码的扩展，是一种二维逐行编码方式。把一页文件沿列扫描方向分成若干组，每组有K行图像数据; 第一行用一维MH编码，其余K-1行则利用行间相关性对当前像素模式识别后编码。 a2：在参考行上位于a1之后的下一个迁移像素。 b1：在参考行上位于a0右边，且与a0颜色相反的第一个迁移像素。 b2：在参考行上位于b1之后的下一个迁移像素。编码的模式 READ方案将扫描行的各种变化归纳为三种格式，MRC就是识别编码行上的每一个迁移像素应属于哪一个模式，并输出相应的码字，从而编码简化，压缩比提高。特征:a1位于b2右边的一种模式；编码方法: u 通过模(用P表示) 在通过模情况下，无论a0、b2多长，只用一个码字“0001”表示其长度。此后开始下一个模式编码，以b2正下方的像素作为下一个编码模式的参考模式a0。 u u 水平模(用H表示) 特征:a1位于b2左边且a1b1>3的一种模式。编码方法:统计表明，对a1b1编码还不如直接对a0 a1 和a1 a2两个游程长度编码的效率高。编码之后，a2作为下一次编码时的a0 16、第４章　量化编码 1、量化标量量化（Scalar Quantization) 矢量量化（Vector Quantization) 2、量化就是将连续取值的信号x(n)影射为离散取值的y(n)，即，使得y(n)能够很好地逼近x(n). 3、两种方法给定表示值的个数，利用x的pdf来寻找最佳值均匀量化：简单容易实现非均匀量化：复杂，有一定收益选择均匀的量化器，但具有不同的量化步长更实用，JPEG/MPEG使用 4、 5、第五章预测编码（Predictive Coding） 1、DPCM 第六章变换编码正交变换的性质：熵保持，不丢失信息；能量保持（parseval定理）；能量重新分配；去相关性，可将高度相关的空间样值变为相关性较弱的变换系数。 DCT的优点有: 全实数运算,处理容易;去相关能力较强,仅次于KLT变换;占用机时较多. JPEG定义了4种操作模式：基于DCT的顺序模式(Sequential encoding)；基于DCT的累进模式(Progressive encoding)；无失真模式(Lossless encoding)；次模式 (Hierarchical encoding) 编码过程种类特征基于DCT的基本过程 ①基于DCT的过程②源图像 8bit/pixel③顺序模式④Huffman编码基于DCT的扩展过程 ①基于DCT的过程②源图像：位或12位③顺序或累进模式 ④Huffman或算术编码 c. 无失真过程 ①预测过程②源图像： p bit/pixel, ③顺序模式④Huffman或算术编码 d. 层次过程 ①多帧②使用基于DCT的扩展过程编码过程种类 JPEG的目标是开发一种用于连续色调图像压缩的方法，满足四种要求： ①应用当时的先进图像压缩技术，图像质量好； ②适用于所有的连续色调图像，不受图像尺寸、色彩空间的限制 ③具有适中的计算复杂性，适用于软硬件实现； ④具有四种操作模式：顺序编码 •累进编码 •无失真编码 •层次编码 7．层次过程 ①把原图像的分辨率按2的倍数降低 ②把降低的子图像采用基本过程编码 ③将压缩数据解码，重建低分辨率图像，使用插值、滤波对其内插，幅度水平和垂直分辨率 ④对二者的差值进行基本过程编码 ⑤重复第七章　序列图像编码 1、静止图像编码（Still image coding)：单幅图像，设法去除图像内像素之间的相关性，压缩比较低 2、序列图像编码（Sequence image coding)：一系列图像组成，设法去除图像内和图像间的相关性，压缩比较高 3、运动估计: 对于当前帧的某块 ,在已编码的前一帧(t-1)中找到对应块的过程。两块在位置上的差,称为运动矢量 4、块匹配的方法-I 对于ＮＸＮ大小的块Ｓ，其运动矢量通过寻找最小化下式而得到 5、块匹配的方法-II：全局搜索 - 运算复杂 - 对噪声敏感 - 估计出的运动矢量场不平滑 6、块匹配的方法-III：N 步寻找方案 7、块匹配的方法-IV：金字塔式寻找方案 8、 9、 MPEG可用于通信；在通信中对延迟又较高要求,MPEG在这方面不太注意；ITU制定了类似的标准，但 - 较少的延迟 - 更高的鲁棒性 - 在较低的码率上进行了优化 10、层次化语法结构语法中的每一层包括：下一层相关参数的文件头：文件大小＼码率＼编码方法＼运动矢量．．．用于同步的唯一开始码 11、图片组(GOP)-I I-帧：单独编码；允许解码器随机解码；作为其他图片编码的参考帧 P-帧：使用混合编码器编码；作为其他图片编码的参考帧 B-帧：使用扩展的混合编码器；从不作为其它图片编码的参考 • 运动估计 - 在标准中,没有规定具体的运动估计方法 • 运动补偿：在宏块上进行(16X16)：半象素精度或更细 • 运动矢量的编码；与前一个矢量预测误差进行编码；对预测误差使用VLC编码

展开阅读全文