1、2024/9/26 周四信息隐藏技术与应用1教材p王丽娜、张焕国、叶登攀 编著,信息隐藏技术与应用(第二版),武汉大学出版社,2009年p王丽娜、郭迟、李鹏 编著,信息隐藏技术实验教程,武汉大学出版社,2004年2024/9/26 周四信息隐藏技术与应用2信息隐藏技术概论 p什么是信息隐藏p信息隐藏模型p信息隐藏的分类p信息隐藏的算法p信息隐藏技术的发展p信息隐藏技术的应用领域2024/9/26 周四信息隐藏技术与应用3什么是信息隐藏?p信信息息隐隐藏藏是把一个有意义的信息隐藏在另一个称为载体C(Cover)的信息中得到隐蔽载体S(Stego Cover)。所用的载体可以是文文字字、图图象象、
2、声声音音及视频视频等。p多媒体数据作为信息隐藏载体n冗余性n人眼、人耳对某些信息具有掩蔽效应2024/9/26 周四信息隐藏技术与应用4什么是信息隐藏?p信息隐藏与密码技术的比较n密码技术密码技术:研究如何将机密信息进行特殊的编码,以形成不可识别的密文进行传递n易被拦截、破译n信息隐藏信息隐藏:研究如何将某一机密信息秘密隐藏于另一公开信息中,然后通过公开信息的传输来传递机密信息。n截获的公开信息中是否有机密信息?如何获取?保证了机密信息的安全2024/9/26 周四信息隐藏技术与应用52024/9/26 周四信息隐藏技术与应用6p为增加攻击的难度,也可以把加加密密与信信息息隐隐藏藏技术结合起来
3、即先对消息M加密得到密文消息M,再把M隐藏到载体C中。这样攻击者要想获得消息,就首先要检测到消息的存在,并知道如何从隐蔽的载体S中提取M,以及如何对M解密以恢复消息M。什么是信息隐藏?2024/9/26 周四信息隐藏技术与应用7信息隐藏技术特点 p(1)透明性p(2)鲁棒性 p(3)不可检测性p(4)安全性 p(5)自恢复性p(6)对称性 p(7)可纠错性2024/9/26 周四信息隐藏技术与应用8信息隐藏模型2024/9/26 周四信息隐藏技术与应用9信息隐藏的分类 p按载体类型分类n基于文本,图像,声音和视频的信息隐藏技术p按密钥分类n若嵌入和提取采用相同密钥,则称其为对称隐藏算法,否则
4、称为公钥隐藏算法p按嵌入域分类n主要可分为空域(或时域)方法及变换域方法 p按提取的要求分类n若在提取隐藏信息时不需要利用原始载体C,则称为盲隐藏;否则称为非盲隐藏。2024/9/26 周四信息隐藏技术与应用10信息隐藏的分类p按保护对象分类(主要分为隐写术和水印技术)1)隐写术的目的是在不引起任何怀疑的情况下秘密传送消息,因此它的主要要求是不被检测到和大容量等。2)数字水印是指嵌在数字产品中的数字信号,可以是图像,文字,符号,数字等一切可以作为标识和标记的信息,其目的是进行版权保护、所有权证明、指纹(追踪发布多份拷贝)和完整性保护等。3)数据隐藏和数据嵌入4)指纹和标签2024/9/26 周
5、四信息隐藏技术与应用112024/9/26 周四信息隐藏技术与应用12信息隐藏算法 p应用于图像的信息隐藏技术n空域法直接改变图像元素的值,一般是在图像元素的亮度和色带中加入隐藏的内容n频域法利用某种数学变换,将图像用频域表示,通过更改图像的某些频域系数加入待隐消息,然后再利用反变换来生成隐藏有其他信息的图像。常用的数学变换:小波变换、傅立叶变换、DCT变换等。2024/9/26 周四信息隐藏技术与应用13几类信息隐藏算法 p空域算法n该类算法中典型的算法是将信息嵌入到随机选择的图像点中最不重要的像素位(LSB:Least Significant Bit)上,这可保证嵌入的水印是不可见的。nL
6、SB算法的主要优点是可以实现高容量和较好的不可见性,但是该算法的鲁棒性差,容易被第三方发现和得到,遭到破坏,对图像的各种操作如压缩,剪切等都会使算法的可靠性受到影响。2024/9/26 周四信息隐藏技术与应用14几类信息隐藏算法 p空域算法n为了增强算法的性能,提出了各种改进的方法,如利用伪随机序列,以随机的顺序修改图像的LSB;在使用密钥的情况下,才能得到正确的嵌入序列。另外一个常用方法是利用像素的统计特征将信息嵌入像素的亮度值中。2024/9/26 周四信息隐藏技术与应用15几类信息隐藏算法p Patchwork算法n随机选择对像素点(ai,bi),然后将每个ai点的亮度值加 1,每个bi
7、点的亮度值减1,这样整个图像的平均亮度保持不变。n适当地调整参数,Patchwork方法对JPEG压缩、FIR滤波以及图像裁剪有一定的抵抗力,但该方法嵌入的信息量有限。为了嵌入更多的水印信息,可以将图像分块,然后对每一个图像块进行嵌入操作。2024/9/26 周四信息隐藏技术与应用16几类信息隐藏算法p频域算法n算法实现:n先计算图像的离散余弦变换(DCT),然后将水印叠加到DCT域中幅值最大的前k系数上(不包括直流分量),通常为图像的低频分量。n若DCT系数的前个最大分量表示为=di,i=1,水印是服从高斯分布的随机实数序列=wi,i=1,那么水印的嵌入算法为di=di(1+awi),其中常
8、数a为尺度因子,控制水印添加的强度。然后用新的系数做反变换得到水印图像I。n还可以将数字图象的空间域数据通过离散傅里叶变换(DFT)或离散小波变换(DWT)转化为相应的频域系数 2024/9/26 周四信息隐藏技术与应用17p压缩域算法基于JPEG、MPEG标准的压缩域数字水印系统不仅能节省大量的完全解码和重新编码过程,而且在数字电视广播及 VOD(Video on Demand)中有很大的实用价值。一种针对MPEG-2压缩视频数据流的数字水印方案MPEG-2的数据流包括数据信息、运动向量和DCT编码信号编码信号块块三个部分。几类信息隐藏算法视频数据块DCT编码信号块量化器DCT哈夫曼编码器2
9、024/9/26 周四信息隐藏技术与应用18p压缩域算法一种针对MPEG-2压缩视频数据流的数字水印方案嵌入水印的过程:nDCT编码信号块-哈夫曼解码-逆量化-当前块的DCT系数n把相应水印信号块的变换系数与之相加,得到叠加的DCT系数,再重新进行量化和哈夫曼编码n为保证不增加视频数据流的位率,比较新的哈夫曼码字的位数n1和原码字n0;只在n1不大于 n0的时候,才传输水印码字,否则传原码字。水印引起视频降质,通常用对运动向量的漂移补偿来抵消几类信息隐藏算法2024/9/26 周四信息隐藏技术与应用19p NEC算法n该算法在数字水印算法中占有重要地位,由NEC实验室的Cox等人提出,其实现方
10、法是,首先以密钥为种子来产生伪随机序列,该序列具有高斯N(0,1)分布,密钥一般由作者的标识码和图像的哈希值组成,其次对图像做DCT变换,最后用伪随机高斯序列来调制(叠加)该图像除直流(DC)分量外的1000个最大的DCT系数。几类信息隐藏算法2024/9/26 周四信息隐藏技术与应用20p NEC算法n具有较强的鲁棒性、安全性、透明性等。由于采用特殊的密钥,因此可防止IBM攻击,而且该算法还提出了增强水印鲁棒性和抗攻击算法的重要原则,即水印信号应该嵌入源数据中对人感觉最重要的部分,这种水印信号由独立同分布随机实数序列构成,且该实数序列应该具有高斯分布N(0,1)的特征。几类信息隐藏算法202
11、4/9/26 周四信息隐藏技术与应用21p生理模型算法n人的生理模型包括人类视觉系统HVS(Human Visual System)和人类听觉系统HAS。该模型不仅被多媒体数据压缩系统利用,同样可以供数字水印系统利用。n利用视觉模型的基本思想均是利用从视觉模型导出的JND(Just Noticeable Difference)描述来确定在图像的各个部分所能容忍的数字水印信号的最大强度,从而能避免破坏视觉质量。也就是说,利用视觉模型来确定与图像相关的调制掩模,然后再利用其来插入水印。这一方法同时具有好的透明性和强健性。几类信息隐藏算法2024/9/26 周四信息隐藏技术与应用22信息隐藏技术的发
12、展p 传统的信息隐藏技术p 数字信息隐藏技术的发展n1994年,第一篇图像数字水印的文章发表n到1999年8月,国际已发表信息隐藏论文400篇左右n信息隐藏学术会议召开;信息处理领域会议开展关于信息隐藏的专题会nDVD影碟防盗版技术(日本、美国)n 数字水印保护和伪造电子照片(德)n美国版权保护技术组织成立专门的数据隐藏小组,制定版权保护水印的技术标准n音乐版权保护技术SDMI-音频水印np信息隐藏技术尚未发展到完善的可实用阶段,密码加密仍是主流;未找到自己的理论依据。但潜在价值巨大。2024/9/26 周四信息隐藏技术与应用23信息隐藏技术的应用领域 p 数据保密 p 数据的不可抵赖性 p
13、数字作品的版权保护 p 防伪 p 数据的完整性 2024/9/26 周四信息隐藏技术与应用24谢谢,任何问题?2024/9/26 周四信息隐藏技术与应用25IBM攻击pIBM攻击,有时也称为可逆(Inversion)攻击,它是采用添加水印的方法使图像的所有权产生歧义。p这种攻击的出发点是:若媒体数据中存在两个以上的水印时,一般的水印系统中没有区别那个水印是先加入的机制。p假定原始媒体数据是d,版权人a在d中嵌入了版权水印wa,得到了加水印后的数据d+wa。而攻击者b在得到d+wa后,从中减去他的水印wb,而形成了d+wa-wb,并声称拥有该数据的版权。这时的版权归属将成为一个有歧义的问题。20
14、24/9/26 周四信息隐藏技术与应用26离散余弦(DCT)变换2024/9/26 周四信息隐藏技术与应用27量化p量化量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。2024/9/26 周四信息隐藏技术与应用28哈夫曼(Huffman)编码p哈夫曼(Huffman)的基本原理是频繁使用的数据用较短的代码代替,较少使用的数据用较长的代码代替,每个数据的代码各不相同。这些代码都是二进制码,且码的长度是可变的。p举个例子:假设文件中出现了8种符号S0,S1,S2,S3,S4,S5,S6,S7,那么每种符号要编码,至少需要3比特。假设编码成000,001,01
15、0,011,100,101,110,111(称做码字)。那么符号序列S0S1S7S0S1S6S2S2S3S4S5S0S0S1编码后变成000001111000001110010010011100101000000001,共用了42比特。我们发现S0,S1,S2这三个符号出现的频率比较大,其它符号出现的频率比较小,如果我们采用一种编码方案使得S0,S1,S2的码字短,其它符号的码字长,这样就能够减少占用的比特数。例如,我们采用这样的编码方案:S0到S7的码字分别01,11,101,0000,0001,0010,0011,100,那么上述符号序列变成011110001110011101101000
16、000010010010111,共用了39比特,从而实现了压缩。2024/9/26 周四信息隐藏技术与应用29哈夫曼(Huffman)编码p下面给出具体的Huffman编码算法n(1)首先统计出每个符号出现的频率,上例S0到S7的出现频率分别为4/14,3/14,2/14,1/14,1/14,1/14,1/14,1/14。n(2)从左到右把上述频率按从小到大的顺序排列。n(3)每一次选出最小的两个值,作为二叉树的两个叶子节点,将和作为它们的根节点,这两个叶子节点不再参与比较,新的根节点参与比较。n(4)重复(3),直到最后得到和为1的根节点。n(5)将形成的二叉树的左节点标0,右节点标1。把从最上面的根节点到最下面的叶子节点途中遇到的0,1序列串起来,就得到了各个符号的编码。2024/9/26 周四信息隐藏技术与应用30哈夫曼(Huffman)编码哈夫曼编码示意图






