资源描述
1、熵对数据压缩编码的理论意义
信源的熵是对该信源进行无失真编码的极限
对信源进行无失真编码的最低码率就是该信源的熵
如果对信源进行编码的码率小于信源的熵,则这种编码是有失真的
2、例:某一信源X有四个符号,其出现概率为:
· 则该信源的熵为:
= 1.75 bit/符号
平均码长L= =1/2*1+1/4*2+1/8*3= 1.75 bit/符号
3、启示1:只要信源不是等概率分布的,就存在无失真数据压缩的可能性。
启示2:既然非负,严格上凸,且等概率时达到最大,任一pj=1时达到最小值0,那么我们可以通过某中变换 T: ,使中某一个符号发生的概率尽可能大()使其他的尽可能小(),这将有利于压缩,这就是变换编码的途径之一。
4\ 研究在限定失真下为了恢复信源符号所必需的编码率,简称率失真理论。
5.
——表示输入为X,输出为Y时,整个系统所具有的不确定程度
6、
7、可见,只要允许误差存在,就可以减少编码输出的字符数,降低码率。输出字符数越少,译码误差失真就越大。
8、
则平均失真
9、
10、率失真函数是在允许失真为D的条件下,信源编码给出的平均互信息量的下界。
——有失真时的信源编码的逆定理
当编码码率R<时,无论用何种编码方式,其平均失真必大于D
11、
变长码要正确识别码字起点就不是那么容易了,并且还存在着唯一可译性等问题。
12、哈夫曼(Huffman)编码
① 将信源符号出现概率按减小的顺序排列;
② 将两个最小的概率进行组合相加,并继续这一步;
③ 对每队组合中的上边指定为1,下边指定为0;
④ 画出由每个信源符号概率到1、0处的路径,记下路径的1和0;
⑤ 对于每个信源符号,写出1、0序列。则从右到左就得到哈夫曼码。
哈夫曼编码的缺点:需要统计概率 需要存储或传输码表
数据流
13、游程长度(RL):由字符(或信号采样值)构成的数据流中各个字符重复出现而形成字符串的长度。
形成串的字符、串的长度及串的位置
RL
Sc
aj
14、MH/MR编码
一 Modified Huffman (MH)
MH码的主要方法是:
以多帧标准传真图像样本为统计依据,根据各种RL的出现的概率编出哈夫曼码表,实际过程只是查表,可以实时处理。
由于规定每行标准取样1728点,又根据统计结果,实际RL在0—63居多,故MH编码表分为结尾码与组合基于码。
编码规则如下:
① RL=0—63,用一个相应的结尾码表示;
② RL=64—1728,用一个组合基于码加一个补充结尾码,例如RL(白)=128,其编码为10010 00110101 补充结尾码为0(白)。 若RL(白)=129,则其编码为10010 000111
③ 规定每行都从白游程开始,若实际扫描行由黑开始,则需要在行首加零长度的游程;每行结束时,要加行同步码EOL,每页文件第一个数据前加EOL;
④ 为了同步操作的需要,规定一个编码的结束时间T最小为20ms,最大为5 s,不是20ms的行需要再EOL之前填充足够的0,不可填在数据中间。
⑤ 每行恢复像素应为1728个,否则认为该行的传输有误。
⑥ 连续发6个EOL码,表示文件传输结束,转回控制规程,以后发送机将按照帧格式的CCITT建议T.30规定的控制信号速率发送各种报文后命令。
15、MR编码是MH编码的扩展,是一种二维逐行编码方式。
把一页文件沿列扫描方向分成若干组,每组有K行图像数据;
第一行用一维MH编码,其余K-1行则利用行间相关性对当前像素模式识别后编码。
a2:在参考行上位于a1之后的下一个迁移像素。
b1:在参考行上位于a0右边,且与a0颜色相反的第一个迁移像素。
b2:在参考行上位于b1之后的下一个迁移像素。
编码的模式
READ方案将扫描行的各种变化归纳为三种格式,MRC就是识别编码行上的每一个迁移像素应属于哪一个模式,并输出相应的码字,从而编码简化,压缩比提高。
特征:a1位于b2右边的一种模式;
编码方法:
u 通过模(用P表示)
在通过模情况下,无论a0、b2多长,只用一个码字“0001”表示其长度。
此后开始下一个模式编码,以b2正下方的像素 作为下一个编码模式的参考模式a0。
u
u 水平模(用H表示)
特征:a1位于b2左边且a1b1>3的一种模式。
编码方法:统计表明,对a1b1编码还不如直接对a0 a1 和a1 a2两个游程长度编码的效率高。
编码之后,a2作为下一次编码时的a0
16、
第4章 量化编码
1、量化
标量量化(Scalar Quantization)
矢量量化(Vector Quantization)
2、量化就是将连续取值的信号x(n)影射为离散取值的y(n),即,使得y(n)能够很好地逼近x(n).
3、
两种方法
给定表示值的个数,利用x的pdf来寻找最佳值
均匀量化:简单容易实现
非均匀量化:复杂,有一定收益
选择均匀的量化器,但具有不同的量化步长
更实用,JPEG/MPEG使用
4、
5、
第五章 预测编码(Predictive Coding)
1、DPCM
第六章 变换编码
正交变换的性质:熵保持,不丢失信息;能量保持(parseval定理);能量重新分配;去相关性,可将高度相关的空间样值变为相关性较弱的变换系数。
DCT的优点有:
全实数运算,处理容易;去相关能力较强,仅次于KLT变换;占用机时较多.
JPEG定义了4种操作模式:
基于DCT的顺序模式(Sequential encoding);基于DCT的累进模式(Progressive encoding);无失真模式(Lossless encoding);次模式 (Hierarchical encoding)
编码过程种类
特征
基于DCT的基本过程
①基于DCT的过程②源图像 8bit/pixel③顺序模式④Huffman编码
基于DCT的扩展过程
①基于DCT的过程②源图像: 位或12位③顺序或累进模式
④Huffman或算术编码
c. 无失真过程
①预测过程②源图像: p bit/pixel, ③顺序模式④Huffman或算术编码
d. 层次过程
①多帧②使用基于DCT的扩展过程
编码过程种类
JPEG的目标是开发一种用于连续色调图像压缩的方法,满足四种要求:
①应用当时的先进图像压缩技术,图像质量好;
②适用于所有的连续色调图像,不受图像尺寸、色彩空间的限制
③具有适中的计算复杂性,适用于软硬件实现;
④具有四种操作模式:顺序编码 •累进编码 •无失真编码 •层次编码
7.层次过程
①把原图像的分辨率按2的倍数降低
②把降低的子图像采用基本过程编码
③将压缩数据解码,重建低分辨率图像,使用插值、滤波对其内插,幅度水平和垂直分辨率
④对二者的差值进行基本过程编码
⑤重复
第七章 序列图像编码
1、静止图像编码(Still image coding):
单幅图像,设法去除图像内像素之间的相关性,压缩比较低
2、序列图像编码(Sequence image coding):
一系列图像组成,设法去除图像内和图像间的相关性,压缩比较高
3、运动估计: 对于当前帧的某块 ,在已编码的前一帧(t-1)中找到对应块的过程。 两块在位置上的差,称为运动矢量
4、块匹配的方法-I
对于NXN大小的块S,其运动矢量通过寻找最小化下式而得到
5、 块匹配的方法-II:全局搜索
- 运算复杂 - 对噪声敏感 - 估计出的运动矢量场不平滑
6、 块匹配的方法-III:N 步寻找方案
7、 块匹配的方法-IV:金字塔式寻找方案
8、
9、 MPEG可用于通信;在通信中对延迟又较高要求,MPEG在这方面不太注意;ITU制定了类似的标准,但
- 较少的延迟 - 更高的鲁棒性 - 在较低的码率上进行了优化
10、层次化语法结构
语法中的每一层包括:下一层相关参数的文件头:文件大小\码率\编码方法\运动矢量... 用于同步的唯一开始码
11、图片组(GOP)-I
I-帧 :单独编码;允许解码器随机解码;作为其他图片编码的参考帧 P-帧:使用混合编码器编码;作为其他图片编码的参考帧 B-帧:使用扩展的混合编码器;从不作为其它图片编码的参考
• 运动估计
- 在标准中,没有规定具体的运动估计方法
• 运动补偿:在宏块上进行(16X16):半象素精度或更细
• 运动矢量的编码;与前一个矢量预测误差进行编码;对预测误差使用VLC编码
展开阅读全文