资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
题目: 图像压缩技术的综述
学生姓名: 徐欢 学号:
系别: 计算机与信息学院专业: 计算机科学与技术
入年份: 9月
导师姓名: 陈蕴谷职称/学位: 讲师/硕士研究生
导师所在单位: 中国科学院合肥物质研究院
完成时间: 4月
1.引言
随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、 信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输, 而且要求复原图像有较好的质量。利用图像压缩, 能够减轻图像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。
图像数据是用来表示图像信息的, 如果不同的方法为表示相同的信息使用了不同的数据量, 那么使用较多数据量的方法中, 有些数据必然代表了无用的信息, 或者是重复的表示了其它数据表示的信息, 前者成为数据冗余, 后者成为不相干信息。图像压缩编码的主要目的, 就是经过删除冗余的或者是不相干的信息, 以尽可能地的数码率来存储和传输数字图像数据。
图像压缩编码技术能够追溯到1948年提出的电视信号数字化, 到今天已经有50多年的历史了。在此期间出现了很多种图像压缩编码方法, 特别是到了80年代后期以后, 由于小波变换理论, 分形理论, 人工神经网络理论, 视觉仿真理论的建立, 图像压缩技术得到了前所未有的发展, 其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述, 讨论了它们的优缺点以及发展前景。
图像编码基础
图像编码压缩是指在满足一定图像质量的条件下, 用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论, 从此理论出发能够得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之中, 去除她们之间的相关性, 使之成为或基本成为不相干信源, 如预测编码, 变换域编码, 混合编码等, 但也都受信息熵的约束。总体上能够概括为熵编码, 预测编码, 变换编码, 也成为三大经典编码方法。另一种是设法改变信源的概率分布, 使其尽可能地非均匀, 再用最佳编码方法使码长逼近信源熵。使用此途径的压缩方法其效率一般以其熵为上界, 压缩比饱和于10: 1, 如Huffman编码, 算术编码, 行程编码等。
随着人们对传统压缩编码方法的深入研究和应用, 逐渐发现了这些传统方法的许多缺点。如高压缩比时回复图像会出现方块效应, 人眼视觉系统( HVS) 的特性不易被引入到算法中等。为了克服这些缺点, 1985年M.Kunl等人提出了第二代图像压缩编码的概念。经过近20年的发展, 在这一框架下, 人们踢出了鸡枞新的编码方法: 分形编码, 小波变换编码和基于模型的编码方法等。于是, 对数据压缩技术的研究就突破了传统Shannon理论的框架, 使得压缩效率得以极大提高。
图像编码基本原理
数字图像的冗余主要表现为以下几种形式: 空间冗余, 时间冗余, 信息熵冗余, 结构冗余和知识冗余。图像数据的这些冗余信息为图像压缩编码提供了依据。图像编码的目的就是充分利用图像中存在的各种冗余信息, 特别是空间冗余, 时间冗余以及视觉冗余, 以尽量少的比特数来表示图像。利用各种冗余信息, 压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题, 它是使数字信号走上实用化的关键技术之一, 虽然表示图像需要大量的数据, 可是图像数据是高度相关的, 或者说存在冗余信息, 去掉这些信息后能够有效压缩图像, 同时不会损害图像的有效信息。
2.常见的编码方法及其分类
图像压缩分为无损压缩和有损压缩, 有损压缩分为预测编码, 变换编码, 混合编码, 有损编码分为: JPEG,MPEG,P*64, 无损编码分为: LempdZew,Huffman编码, 行程编码, 算数编码。
当前常见的数字图像压缩编码方法可分为两大类: 一是冗余压缩发, 也称为无损压缩发; 另一无损压缩的算法删除的仅仅是冗余的信息, 因此能够在解压缩时精确的恢复原图像。有损压缩的算法把不相干的信息也删除了, 解压缩时只能对图像进行类似的重构, 而不能精确的复原, 所i有损压缩算法能够达到更高的压缩比。
对于多数图像来说, 为了达到更高的压缩比, 保真度的轻微损失是能够接受的; 有些图像不允许进行任何修改, 只能对她们进行无损压缩。无损压缩利用数据的统计特性进行数据压缩, 其压缩率一般为2: 1至5: 1。有损压缩不能完全恢复数据, 而是利用人的视觉特性( 人的眼睛好比是一个”积分器”) 使解压缩后的图像看起来与原始图像一样。压缩比随编码方法的不同差别较大。
2.1预测编码
在图像中, 相邻像素一般在灰度上存在较大的相关性, 因此, 图像中某一像素的灰度能够用邻近的若干个像素灰度来估计。只对实际值和预测值的差进行编码和传输。因为预测编码是根据信号的一些已知情况, 预测信号可能发生的情况, 因此预测时有误差, 如果预测比较准确, 误差就较小, 预测编码就能达到压缩数据的目的。典型预测编码的压缩算法有: DPM(差分脉冲调制)和ADPCM( 自适应差分脉冲调制) 。
2.2Huffman编码
无失真编码方法中, Huffman编码是一种较有效的编码方法。Huffman编码是一种长度不均匀的, 平均码率能够接近信息熵值的一种编码。她的编码思想是: 对于出现概率较大的信息, 采用字短的码, 对于出现概率低的信息采用字长的码, 以达到缩短平均码长, 从而实现数据的压缩。Huffman编码小变字长编码方法是最佳的, 其码字平均长度很接近信息符号的熵值。Huffman编码的最高压缩效率可达到8: 1.
2.3行程编码
在一个逐行存储的图像中, 具有相同灰度值的一些像素组成的序列称为一个行列。在编码时, 对于每个行程只存储一个灰度值的码, 再紧跟着存储这个行程码的长度。这种按照形成进行的编码被称为行程编码。
行程编码是相对简单的一种编码, 是指一行扫描的像素中, 比较相邻像素的幅度( 如: 亮度) , 当幅度有一显着变化时, 就说有一行程存在。随终点位置标记方法不同, 行程编码可分为”行程终点编码”和”行程长度编码”。行程编码对于仅包含很少几个灰度级的图像, 特别像二值图像, 比较有效。
量化编码器
样本选择
2.4变换编码
增值
F(u,v)
变换
f( m,n)
F( u,v)
f(m,n)
迭变
解码
变换编码的原理框图如图所示, 在发送端, 原始图像被分成若干个相同大小的子图像, 对每个子图像做变换, 采用”区域采样”的方法, 只取变换系数中幅度较大的元素, 即变换结果阵列中的一些主要阵元进行编码, 然后进行传输, 而把其它幅度较小的大部分变化系数当作零, 不予编码。在接收端, 解码器将收到的信号进行解码, 以零补足所有未被传输的阵元, 然后对每个子阵进行相应的反变换, 将每个反变换阵列拼起来便得到重建图像。
只取变换阵列中的一些主要阵元进行编码和传输, 本身就已经达到了一定程度的数据压缩效果, 在辅以非线性量化, 能够进一步压缩数据率。DCT变换, 傅里叶变换和HARR变换等。
2.5矢量量化压缩方法
前面说的预测编码, 变换编码等都属于标量量化, 即先将图像经某种映射变换变成一个数的序列, 然后一个数一个数地进行量化编码。矢量量化( 简称VQ) 在近几年发展很快, 它与标量量化方法不同, 她把图像数据分成很多组, 每组看成为一个矢量, 然后逐个矢量进行量化编码。在VQ算法中, 图像中的各种相关信息( 如: 各像素点见, 各块之间以及相邻编码地址间等) 可经过有效的码书设计得以充分地去除, 矢量量化是限失真压缩编码方法, 压缩比可达到40: 1。
2.6统计编码
统计编码是根据消息出现的概率分布特性而进行的压缩编码。其宗旨在于: 在消息和编码之间找到明确的一一对应关系, 以便在回复是能准确无误地再现出来, 使平均码长或码率压低到最低限度。其中常见的有: Huaffman码, ShannonFano码, 算数编码等, 。行程编码就是其中一种典型的统计编码, 她首先计算信源符号出现的行程长度, 然后将行程长度转换成代码。这种方法0, 1成片出现的数据压缩。
2.7混合编码
混合编码对信源数据同时使用两种或者两种以上的编码方法, 能大大提高数据压缩的效率。静态图像压缩标准JPEG就是一种典型的混和编码的压缩标准。
2.8JPEG编码
JPEG是联合图像专家组的缩写名称。JPEG致力于研制彩色的和单色的, 夺回度连续色调的静态图像的数字图像压缩的通用国际标准。JPEG算法中首先对图像进行分块处理, 一般分成互不重叠的大小的块, 再对每一块进行二维离散余弦变换( DCT) 。变换后的系数基本不相关, 且系数矩阵的能量集中在低频区, 根据量化表进行量化, 量化的结果保留了低频部分的系数, 去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织, 然后进行哈夫曼编码。JPEG的特点
优点: ( 1) 形成了国际标准;
( 2) 具有中端和高端比特率上的良好图像质量。
缺点: ( 1) 由于对图像进行分块, 在高压缩比时产生严重的方块效应;
( 2) 系数进行量化, 是有损压缩;
( 3) 压缩比不高, 小于50。
JPEG压缩图像出现方块效应的原因是: 一般情况下图像信号是高度非平稳的, 很难用Gauss过程来刻画, 而且图像中的一些突变结构例如边缘信息远比图像平稳性重要, 用余弦基作图像信号的非线性逼近其结果不是最优的。
( 1) DCT零树编码
DCT零树编码把DCT块中的系数组成log2N个子带, 然后用零树编码方案进行编码。在相同压缩比的情况下, 其PSNR的值比EZW高。但在高压缩比的情况下, 方块效应仍是DCT零树编码的致命弱点。
( 2) 层式DCT零树编码
此算法对图像作的DCT变换, 将低频块集中起来, 做反DCT变换; 对新得到的图像做相同变换, 如此下去, 直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。
JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应, 因此在今后的研究中, 应重点解决DCT变换产生的方块效应, 同时考虑与人眼视觉特性相结合进行压缩。
基于DCT的JPEG标准的压缩是有失真的, DCT变换后系数的量化是引起失真的主要原因。压缩效果与图像内容本身有较大的关系。
2.9JEPG 压缩
JPEG 是由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。 3月的东京会议, 确定了彩色静态图像的新一代编码方式—JPEG 图像压缩标准的编码算法。
JPEG 压缩编码过程主要分为以下几个过程: 预处理、 核心处理和位流组织。预处理部分包括对图像分片、 直流电平( DC) 位移和分量变换。核心处理部分由离散小波变换、 量化和熵编码组成。位流组织部分则包括区域划分、 码块、 层和包的组织。
JPEG 格式的图像压缩比, 可在现在的JPEG基础上再提高10%~30%, 而且压缩后的图像显得更加细腻平滑。对于当前的JPEG标准, 在同一个压缩码流中不能同时提供有损和无损压缩, 而在JPEG 系统中, 经过选择参数, 能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按”块”传输的, 而JPEG 格式的图像支持渐进传输, 这使用户不必接收整个图像的压缩码流。由于JPEG 采用小波技术, 可随机获取某些感兴趣的图像区域( ROI) 的压缩码流, 对压缩的图像数据进行传输、 滤波等操作。
3数据压缩新技术
分形图像编码是在分形几何理论的基础上发展起来的一种编码方法, 分形几何是欧氏几何理论的扩展, 她描述了自然界物体的自相似性, 这种自相似性能够引入迭代函数来刻画, 并将其用于图像编码。
基于分型的压缩方法分形( fractal) 的应用十分广泛, 与多媒体领域相关的应用的不规则几何造型, 图像处理等方面。
小波变换在图像压缩中的应用也取得了很大的进展, 小波( wevelet) 分解编码本质上是一种变换编码技术。简单地说, 小波变换就是将原图像信号分解成不同的频率区域, 对不同的频率区域采用不同的压缩编码手段, 从而使数据量减少。这种犯法非常适合满足视觉要求的图像压缩编码方法, 而且压缩比能够达到100左右。当前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码( EZW) , 分层树中分配样本图像编码( SPIHT) 和可扩展图像压缩编码( EBCOT) 。
( 1) EZW编码器
1993年, Shapiro引入了小波”零树”的概念, 经过定义POS、 NEG、 IZ和ZTR四种符号进行空间小波树递归编码, 有效地剔除了对高频系数的编码, 极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式, 算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则: 高效的压缩编码器必须经过高复杂度的算法才能获得, 因此EZW编码器在数据压缩史上具有里程碑意义。
( 2) SPIHT编码器
由Said和Pearlman提出的分层小波树集合分割算法( SPIHT) 则利用空间树分层分割方法, 有效地减小了比特面上编码符号集的规模。同EZW相比, SPIHT算法构造了两种不同类型的空间零树, 更好地利用了小波系数的幅值衰减规律。同EZW编码器一样, SPIHT编码器的算法复杂度低, 产生的也是嵌入式比特流, 但编码器的性能较EZW有很大的提高。
( 3) EBCOT编码器
优化截断点的嵌入块编码方法( EBCOT) 首先将小波分解的每个子带分成一个个相对独立的码块, 然后使用优化的分层截断算法对这些码块进行编码, 产生压缩码流, 结果图像的压缩码流不但具有SNR可扩展而且具有分辨率可扩展, 还能够支持图像的随机存储。比较而言, EBCOT算法的复杂度较EZW和SPIHT有所提高, 其压缩性能比SPIHT略有提高。
小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中, 应充分考虑人眼视觉特性, 进一步提高压缩比, 改进图像质量。而且考虑将小波变换与其它压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。
同傅里叶变换相比, 小波变换在频率的精度上差一些, 在时间的分析能力上好一些, 而且对时间和频率能够同时分解, 这就是傅里叶变换无法做到的。
4、 其它压缩算法
除了以上几种常见的图像压缩方法以外, 还有: NNT( 数论变换) 压缩、 基于神经网络的压缩方法、 Hibert扫描图像压缩方法、 自适应多相子带压缩方法等, 在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~[13]。
( 1) 形状自适应DCT( SA-DCT) 算法
SA-DCT把一个任意形状可视对象分成的图像块, 对每块进行DCT变换, 它实现了一个类似于形状自适应GilgeDCT[10][11]变换的有效变换, 但它比GilgeDCT变换的复杂度要低。可是, SA-DCT也有缺点, 它把像素推到与矩形边框的一个侧边相平齐, 因此一些空域相关性可能丢失, 这样再进行列DCT变换, 就有较大的失真了[11][14][15]。
( 2) Egger方法
Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中, 首先将可视对象的行像素推到与边界框的右边界相平齐的位置, 然后对每行的有用像素进行小波变换, 接下来再进行另一方向的小波变换。此方案, 充分利用了小波变换的局域特性。然而这一方案也有它的问题, 例如可能引起重要的高频部分同边界部分合并, 不能保证分布系数彼此之间有正确的相同相位, 以及可能引起第二个方向小波分解的不连续等。
( 3) 形状自适应离散小波变换( SA-DWT)
Li等人提出了一种新颖的任意形状对象编码, SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展( ZTE) , 以及嵌入式小波编码( EZW) 。SA-DWT的特点是: 经过SA-DWT之后的系数个数, 同原任意形状可视对象的像素个数相同; 小波变换的空域相关性、 区域属性以及子带之间的自相似性, 在SA-DWT中都能很好表现出来; 对于矩形区域, SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。
5、 结束语
在进行图像压缩编码的时候, 人们总是希望选择压缩比大, 恢复效果好且速度快的算法。实际研究表明, 图像数据实际被压缩多少, 不但取决于所采用的方法, 而且与给定图像的结构, 分布, 相关性和特征匹配等因素有关。为了使压缩方法更为有效, 应首先了解原始图像的性质, 然后选择合适的方法。
从图像和视频压缩的发展能够看到: 图像压缩的操作对象由像素到块再走向对象; 压缩的分辨率逐渐提高, 可扩展性逐渐增强; 压缩的目的由单纯的减少数据量走向功能的多元化: 交互性、 可分级性、 灵活性; 压缩的方法由单一化走向自适应的使用多种压缩工具。随着新理论、 新技术的不断发展,必然全有更有效的功能更全面的压缩编码方法出现。总之, 图像压缩是一个非常有发展前途的研究领域, 这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。
6.致谢
经过很久的构思准备与重复的修正, 论文撰写工作终于划上句号。使我对图像压缩技术有了更深一步的理解。感谢我的论文指导教师陈蕴谷给予我的悉心指导和帮助。陈老师严谨的教学态度让我终生难忘, 无论是在论文资料的搜集还是在内容的修改方面都给予了我很多的指导和帮助, 经过陈老师的多次教导, 我才能够完成这篇论文。感谢计算机与信息学院的各位老师对我的谆谆教诲和关心, 使我学识增长、 受益匪浅。感谢全体同学对我的帮助和关心, 这份真挚友谊是我人生的一份宝贵财富。
展开阅读全文