毕业设计-基于matlab的语谱图的显示与分析及dct域数字.doc

资源描述

1、摘要语谱图一般根据语音信号的时域特性，通过分帧加窗、短时傅里叶变换计算得到其灰度图，也可以进行伪彩色显示观察。首先，为了得到更高的分辨率和更好的视觉效果来进行语音信号的处理与分析，本文利用MATLAB的编程算法和函数库，对运算得到的语谱图使用伪彩色映射算法来观察能量分布，并对声音作进一步的研究；其次，研究了一种基于DCT域数字水印技术的实现算法；最后，试想利用语谱图将运用于图像水印的算法，是否也能运用到音频当中，如果实现了那么将在音频数字水印领域有很大的应用。文章给出了一种基于MATLAB的语谱图显示原理及实现方法。该算法实现了宽带语谱图的灰度图和彩色图。文中也介绍了语谱图显示的前期准备工作

2、，如语音信号的去噪、预处理和分帧加窗等，实验结果说明了宽带语谱图能够获得较高的时间分辨率，从而反映出频谱快速的时变过程。然后介绍了一种基于DCT域图像水印算法原理及实现方法。文中通过对现有数字图像水印算法的研究，设计并实现了DCT变换域中嵌入水印的算法。该算法能够根据人眼的视觉对图像数据中频区域不敏感的特性，通过一定的规则对宿主图像分块后依次对每块进行DCT变换，从而实现了水印的嵌入。实验结果表明该算法可以很好的兼顾数字图像水印的鲁棒性和不可见性。关键词: MATLAB，语谱图，伪彩色映射，DCT，数字水印I第一章绪论1.1研究的背景及意义随着时代的变迁和社会的发展，在这个物欲横流的社会背景

3、下，互联网中传播信息的媒介越来越多，如音视频、图像、数字图书等种类日益繁多。21世纪初，一大批的以网络视频、电子图书、商务办公等新的服务和在线运营为科研。商业等创造了无线的发展空间，新媒体的崛起给互联网带来了巨大的商机。但是在利益的驱使下，通过不正当手段获取和传播未经授权的数字产品的盗版者也异军突起了。因此，为了维护版权所有者属于他们的正当利益，防止盗版等侵权事件屡屡发生，建立良好的知识产权保护制度迫在眉睫。与数字图像、网络视频等传播媒介的对嵌入水印的要求一样，数字音频水印技术同样也是必须在保证了不损坏或破坏原有的音频数据的情况下，通过对音频数据特性的研究，采用利用一定的算法嵌入水印后，依然可

4、以使得原始音频数据具有一定鲁棒性、不可感知性及可证明性等。与传统的数字图像水印技术和趋于日渐成熟的视频水印技术相比，数字音频水印技术将会是一个长期需要坚持不懈去努力的方向。一是因为人类听觉系统（HAS human auditory system）比较灵敏，对周围的声音长期处于接收状态中，所以听觉感官对存在改变的音频数据有一定察觉，导致可以嵌入到音频数据中的水印信息少之又少；二是互联网上存在许多音频编辑工具，可以对原始音频的数据进行不可控的修改，将导致着音频数据的丢失，从而对嵌入了水印的原始音频数据的起不到版权保护的作用。语音信号处理的工作的相关研究，可以追溯到20世纪50年代末，贝尔实验室通过

5、研究发明出了一台将语音信号转换成图像显示的语谱图仪，从此为语音信号的研究与分析提供了极大的帮助。首先语谱图的产生为数字音频水印技术的发展奠定了夯实的基础。其次，利用语音信号所产生的语谱图，根据语谱图的灰度及伪彩色显示，通过分析出的关于语谱图相关的特性，将运用于数字图像水印的算法也运用到音频数据当中。最后，利用前人所研究出的关于图像水印和信息隐藏的成果，结合音频数据产生的语谱图，将应用于数字图像水印的算法应用到语谱图上，相信只要坚持研究下去积极面对遇到的问题以及找寻解决方案，那么音频数字水印领域将会有很大的发展前景。1.2国内外研究现状分析关于语音研究分析表明，很早都多是从语音频域和时域开始的，

6、综合其特点。语谱图-语音频谱图，一般是通过处理接收具有足够长度的的时域信号就可以得到频域图，即针对语音数据的频谱分析图。可以理解为把语音复杂的表示过程用三维图谱的分析出来，横轴代表时间，纵轴代表频率，坐标点值代表语音数据能量，强度可以由平面的灰度表示强弱。通过分析语音的特征发现语谱图可以为研究提供重要的工具。早期可以通过语普仪制作语谱图，而现在随着科技的发展，业内人士可以通过计算机和数字信号处理等技术来显示语谱图，语谱图能够将语音的许多特性淋淋尽致地呈现在人们眼前，通过研究语谱图可以得出以下结论：语谱图在语音识别、语音合成及编码等方面的研究都具有重大意义。在1970-1979年中科院声学所大张

7、旗鼓的对进行计算机语音方面等技术领域进行了深入的研究，通过这几年对语谱图的深入研究得出来的经验。进一步推动了语普图在我国的发展。随着科技的发展，水印技术在我国很多领域也受到了足够的重视，已经有很多专业人士投身于数字水印的技术研究，并且已经成立了很多具有相当实力的科研机构投入到这一领域。自20世纪末12月召开了我国信息隐藏学术研讨会之后，随之又有各种相关数字水印的学术会议不断召开，接着国家实施了各项计划，并且国家相关单位也对数字水印技术提供了多项帮助,例如：项目资助。在国家的大力支持和帮助下，数字水印技术领域的学术研究水平几乎可以与世界数字水印水平发达工具相提并论，相信在不久的将来肯定会投入实际

8、应用中。总的说来，因为数字水印的研究基础是：计算机科学、密码学、通信理论、算法设计和信号处理等。每个数字水印方案必将利用以上的多项技术来完成。随着科技的发展，技术也会日新月异，在利用的过程中也会或多或少的存在着一些缺点。尽管人们都在大力探索发展和研究完善数字水印的深层次技术，但从对数字水印发展技术现状而言，数字水印技术还是存在着一些不足，没有完全成熟，并不能完全驾驭。所以说，数字水印只能说是一门新兴的技术领域学科。综上所述：数字水印技术还不是特别的成熟，只是处在一个技术评估的时段。在这个时段，数字水印技术的深层技术并没有完全被人们广泛理解和应用，同样数字水印的高深技术问题还有很多没有得到解决。

9、音频数字水印是数字水印的一个分支，是以音频数据为载体的防伪及版权保护技术。数字水印是根据互联网中传播的数字媒体作品具有不确定性和存在一定的冗余数据的特征，将日期、图像标志等带有标志性的信息嵌入到原创作者的作品中，从而达到维护版权所有者的作品所有权和支配权的目的。这一操作不能影响宿主数据原先所具有的应用价值，也不能改变原来数据量的大小。嵌入的水印信息可以通过技术软件提取或检测出来，如果水印信息嵌入到音频数据上，则可以通过特殊的设备或软件来检测、提取水印信息。该技术在军事通信，国家信息安全、数字化网络等领域都具有研究发展的空间。1.3本文研究内容和章节安排论文主要研究了语谱图显示的实现方法和基于

10、DCT域数字图像水印算法实现，论文首先通过MATLAB编程实现了音频数据生成宽带语谱图并对器灰度和彩色显示作了对比分析。然后对于原始图像通过DCT变换嵌入水印图像，与原始图像做分析比较，最后实时提取水印并对其质量进行评价。实验结果表明语谱图是语音信号处理中重要的一种工具，用于处理语音信号在图像等领域的应用具有十分重大的意义；证实DCT算法较好达到了数字图像水印的鲁棒性和不可见性之间的平衡。论文各章节具体安排如下：第一章语音信号处理及数字水印算法的研究背景和意义的阐述，以及对语谱图和数字水印国内外现状的分析。第二章首先阐述语音信号的基本特征，然后介绍语音信号的产生、预处理，以及使用分帧加窗函数的

11、作用。最后介绍了数字水印的特点，典型算法以及对数字水印算法的性能评价的基准。第三章主要介绍语谱图的实现过程以及各个过程的具体实施步骤主要包括六个部分：语音录制，数据读入程序，信号分帧加窗，能量密度谱计算，功率谱伪彩色显示，语谱图显示及对结果分析。第四章主要介绍DCT数字水印算法的设计与实现过程，首先根据人眼对图像的敏感程度确定水印嵌入位置对宿主图像嵌入水印；然后通过与原始图像对比来检测水印是否存在，进而生成含有水印信息的二值图像并对其质量进行评价。第五章总结主要概括了本课题进行实验结果的说明，其中存在许多需要解决及有待改进的地方，通过对现有水印算法的设计与实现，根据前人所研究成果进一步对下一步

12、的工作进行了阐述。11第二章语言信号和图像数字水印技术2.1概述语音的发音过程中，声道通常都是处于运动状态的，因此它的共振峰特性也是时变的。不过这个时变过程比起振动过程来说要缓慢得多，因此一般可以假定它是短时平稳的，每一时刻我们都可以用这时刻附近的一短段(例如15ms)语音信号分析得到一种频谱。基于MATLAB的语谱图显示与分析李富强2.2 语言信号的预处理2.2.1 预处理利用手机等通讯设备录制一段声音，经过音频剪辑软件的去噪后，接下来就可以针对语音信号做一些预处理。本课题中预处理的步骤有以下两个部分：（1）预加重。可以很方便快捷的压缩信号大致波动的范围，排除一些外力因素的额干扰，一般

13、可以通过一阶数字滤波器来实现将语音信号信噪比提高。这个数字滤波器有6dB/倍频程的提升特性，它的表达式为式(2.1)： (2.1)式(2.1)中，值向1 趋向，其取值范围是0.940.97。由于人耳对语音高频部分较为敏感，预加重还可以将语音高频部分进行加重，提高了实验数据的准确性。（2）加窗处理。具体的加窗处理条件和分析将在下一小节详细说明。开始对信号进行预处理。信号的预处理过程有预加重、加窗处理等。预加重目的是有三点：一是提升高频段，对语音高频部分进行加重，去除口唇辐射的影响，增加语音的高频分辨率；二是使得该语音信号在整个频段中保持频谱平坦，方便进行频谱分析。还有就是预加重可以压缩信号的动

14、态范围，提高其信噪比。在计算机中一般通过2.2.2 窗函数的选择在对语音信号进行预加重、去噪等处理之后，接着开始借助MATLAB的窗函数对语音信号进行分帧加窗操作。假设实验中30ms50ms内语音信号平稳。为了能够快速的得到数据量小方便处理的语音信号帧，就要使用窗函数对该语音信号进行加窗处理。窗函数缓缓地滑动，就将去噪操作之后的该段语音信号依次处理成短时语音帧信号。常用的窗函数都是矩形窗和汉明窗。矩形窗表达式： (2.2)汉明窗表达式： (2.3)首先我们需要合理的选择合适的窗函数，通过对这个窗函数所具有的一些短时参数特性的研究和讨论，剖析出实验所需要语音信号相对应的基本性质。在选择汉明窗时所

15、对比的矩形窗和汉明窗的参数数据如表2.1所示。表2.1 矩形窗与汉明窗的比较窗类型旁瓣峰值主瓣宽度最小阻带衰减矩形窗-134/N-21汉明窗-418/N-53由于汉明窗的第一个零值频率位置比矩形窗要大一倍左右，且汉明窗的带宽大约是同样宽度矩形窗带宽的两倍。矩形窗的主瓣宽度小于汉明窗，具有较高的频谱分辨率，但是矩形窗的旁瓣峰值较大，因此其频谱容易泄露，丢失高频成分，汉明窗比矩形窗显得更平滑些，它的旁瓣急剧的发生变化。可以更好地反映信号时频特性。基于声纹识别的身份确认系统的研究白燕燕 -西安工业大学硕士论文- 2012-05-02（是否引证：否）综上所述，根据短时语音信号是平稳的，我们就可以通过

16、MATLAB编程实现对原始录制的一段语音信号进行分帧加窗处理，这样一来这段语音信号就被分成一小段的短信号帧，便于我们后续实验进行频域变换操作，以达到提取语音信号其特征参数的目的。2.3 数字水印2.3.1数字水印的概念数字水印是将含有一定信息量的数据嵌入到指定需要被证明或保护的宿主数据中，但是不改变宿主数据的外在体现且可以被继续使用或传播。数字水印是根据互联网中传播的数字媒体作品具有不确定性和存在一定的冗余数据的特征，将日期、图像标志等带有标志性的信息嵌入到原创作者的作品中，从而达到维护版权所有者的作品所有权和支配权的目的。它具有：安全性、可证明性、不可感知性、鲁棒性的特点，主要运用于版权保护

17、、篡改提示、隐藏标识，拷贝保护、数据隐藏和保密通讯。2.3.2 数字水印的特点数字水印不仅仅要求一味的维护版权所有者起到知识产权的保护作用，还需要即使加入了版权保护的水印信息，该数字产品也能和未加水印时的一样是可用的，并且应该和宿主数据的一样承载相同的应用价值，即水印不会影响宿主数据的内在主要结构。然而，在不同的领域涉及的各种各样的水印算法，都会为了不同的要求去追求更好的实现效果而不断地进行实验。通常情况下认为数字水印具有以下四个基本特点：（1）安全性：安全性就是说数字水印的算法是公开的，但是算法实现过程中会选取的适当用于加密的密钥。（2）可证明性：从宿主数据产品中提取出的水印信息，是一串

18、有效的信息数据，可以通过该信息对数据产品的版权所有做出一定的判断。（3）不可感知性：嵌入在宿主数据中的水印信息应该是不可见的，主观上是说不能通过人眼直接观察出水印相关信息，客观上来看的话是指无法通过概率学或是统计学的计算得出水印信息。（4）鲁棒性：是指水印信息在宿主数据中无法被去除。也就是说任何破坏水印信息的动作都会导致原始数据无法实现和原来同样的应用价值，在对嵌入水印算法的分析时，只了解水印信息相关的部分参数也是几乎无法完整的擦除水印信息。2.3.3 数字水印系统的性能评价该评价标准是通过计算图像之间的一些失真量度来测试图片的质量高低，计算较为简单，可重复性较强。常用的评价失真度量方法，

19、如平均绝对差分、均方误差、峰值信噪比等。目前在图像中的编码压缩比较流行的就是峰值信噪比(PSNR)和互相关系数（NC），其计算方法如（2.4）和（2.5）式。这里的MAX通常是图像的灰度级，一般就是255了。W表示原始水印,大小为，表示提取的水印，大小为。 (2.4) (2.5)第三章语谱图显示与分析3.1语音的录制用自己的笔记本电脑上自带的录音机或者其他通讯设备(比如说Cool Edit Pro或者手机自带的录音软件)录取人说话的声音，本课题录制的语音为“我是周华”。录制完毕后格式需要做一定的处理，一般将其格式转化wav格式的文件。通过查阅相关书籍，根据语谱图的产生原理，本实验进行的前提

20、条件是短时间（30ms50ms）的语音信号是平缓的。本课题是在较为安静的室内环境下收集和选取的录音。3.2数据读入程序利用MATLAB编程实现语谱图的显示中实现语谱图程序设计的流程图如图3.1所示。图3.1 语谱图显示与分析系统框架图语音信号的收集完成后，首先要将录制完毕的MP3格式的语音文件利用声音格式转换软件（例如格式工厂）转换成wav格式，接着使用wavread()函数对去噪后读入程序的语音信号进行采样，本程序中选取的采样频率为44.1kHz，采样点数为：1024个。本课题中运用wavread函数的调用格式如下：X,fw,nbits=wavread(zhouhua.wav), zhouh

21、ua.wav为自己录制的wav文件，返回的采样值存放在向量X中，参数fw表示的是采样频率，本程序中为44.1kHz，参数nbits表示采样位数，本程序中为16位矢量量化采样点。信号分帧加窗：分帧加窗函数，本课题中采用的是hanning窗，根据要求还可选用hamming(N)，其中N为窗长课题中N=1024个采样点。课题中选择帧长N=2048，帧移128。3.3能量密度谱计算能量谱也叫能量谱密度，单位是焦耳/Hz，针对能量有限的信号，能量信号的傅里叶变换绝对值的平方就是能量谱密度，即帕塞瓦尔定理。通过该伪彩色映射函数来生成彩色语谱图P(n,k)，能给人更好的视觉观察从而得出较为准确的结论。为得到

22、理想的实验效果，对编写好的程序进行的多次测试，得出了最佳的基准电平值Base，最终得到了能给人更好视觉效果的语谱图，并采用伪彩色模式进行观察。经过上述的分析，我们可以得出控制语谱图灰度显示还是彩色显示的操作主要是根据对基准值Base判断，大于基准值Base时得出的就是彩色语谱图了，就能更好的反应该语音信号能量的分布情况。3.4相关 MATLAB 功能函数3.4.1 用于短时频谱分析的功能函数1) 分帧加窗函数:hanning（N）。其中参数N 为窗长，在本实验中即为分帧操作时选取的帧长。在信号处理中，窗函数是一种除在给定区间之外取值为0的实函数。本文所编写的程序中所采用的是 hanning窗。

23、也可以选用其他窗，如方窗等。2) 快速傅里叶变换函数: fft(s)。参数s为加窗后的一帧信号。3) 复数取共扼函数: conj(z)。3.4.2 伪彩色映射和语谱图显示的功能函数1）伪彩色映射函数：colormap（MAP）。其中MAP是该函数方法中的一个参数，默认值为JET，当MAP=colormap时获得当前的MAP，其中0 0 0表示黑色，1 1 1表示白色，1 0 0表示红色，.5 .5 .5则表示灰色。2) 频谱图显示函数: imagesc(t, f, L)。为了获得语音信号的能量谱，对信号帧进行短时的傅里叶变换后测试出合适的阀值，方便程序的调试，该函数中第一个参数 t 表示时间

24、，第二个参数则f代表频率，第三个参数L 则是通过设置合适的阀值而计算出的彩色电平值。3.5 语谱图显示及结果分析首先利用MATLAB的VOICE工具箱和M文件编写程序，然后借助实现录制好的语音“我叫周华”，运行程序后的宽带语谱图灰度显示结果如图3.2所示。图3.2 语音“我叫周华”的宽带语谱图灰度显示结果产生的关于“我叫周华”的宽带语谱图彩色显示结果如图3.3所示。图3.3 语音“我叫周华”的宽带语谱图彩色显示结果从图3.3中我们可以根据语谱图的频率分辨率，通过语音信号所具有的频谱特性，利用伪彩色函数所显示的彩色语谱图所反映出来的语音信号的能量分布十分显著，上图中用其横坐标来表示时间，其纵坐标

25、则表示的是频率，而图上的时深时浅的彩色带条纹泽表明了通过语谱图时间分辨率的特性，显示出较短时间的语音信号的频谱，其颜色的深浅表示在某个时刻且确定的某个一定的频率下，该语音信号的强度。图3.3中几条忽明忽暗的深黄色的条纹表示浊音，但是在一小段的浊音信号内，这些纹理图形分布得较为稠密。图中的宽带语谱图可以获得较高的时间分辨率，反映频谱的快速时变过程。宽带灰度语谱图上也因其灰度等级的不一样，构成了错落有致的纹理，我们称之为“声纹”。在法律中常用到的录音证据，就是根据每个人有不同的声纹来进行鉴定的。所以，它也经常在司法、安全等场合中屡试不爽。第四章 DCT图像水印算法设计及实现4.1概述目前流行的数字

26、水印算法主要分为两大类，分别为时域和空域两种。由于空域中对语音或者图像数据的影响因素较少，故我们采用离散余弦变换DCT（Discrete Cosine Transform）。离散余弦变换不仅仅应用于图像压缩中，还适用于数字水印。在图像水印算法中，DCT首先根据嵌入强度因子k的取值将宿主图像分割成一个个Block，紧接着借助MATLAB中的函数dct2()再对每一个Block依次进行DCT变换。4.2二维DCT的定义在数字图像处理中使用的是二维DCT，对一副的图像，离散余弦变换（Discrete Cosine Transform，简称DCT）变换对如式(4.1)所示 (4.1) 离散余弦逆变换（

27、Inverse Discrete Cosine Transform，简称IDCT）变换对如式(4.2)所示 (4.2)式（4.1）与（4.2）中，本文采用离散余弦变换（DCT）设计实现数字水印的嵌入与提取的算法，主要基于以下几个原因：首先分析图像数据时，在频域存在的干扰参数相较于时域较少，且干扰因素参数都相对集中；其次根据图像的功率谱可以分析得出其信号的能量大部分是集中在为数不多的几个变换系数上，如嵌入位置、嵌入强度因子k等。所以我们选取在宿主图像的合适位置，选择较佳的嵌入强度因子k，利用离散余弦变换（DCT）进行水印的嵌入。4.3 基于DCT域的图像水印算法设计4.3.1水印与载体图像的选取

28、从水印的功能角度出发，大致可以把水印分成两种：一种是包括了记录身份、版权等详细内容；而另一种则是利用概率函数所产生的伪随机数来作为水印序列投入使用时只需检测相应的水印信息是否存在于宿主图像中即可。然而，当今主流中用于表现水印信息的方法参差不同，但是在现生活和理论研究中使用较多的还是这两种：0-1比特序列水印与图像水印。下面分别介绍两种水印：（1）0-1比特序列水印：采用的是混沌现象，这是在非线性动力系统中出现的确定性的、类随机过程的过程，这种过程既非周期又不收敛，并且对初始值有极其敏感的依赖性。（2）图像水印：另一种方法是使用图像作为水印信息。本文中选取的是图像水印中的二值图像来作为本实验中

29、的水印图像。之所以使用二值图像，是由于其图像的像素只有两种颜色：黑和白，那么在计算机中就可以通过0和1来表示，可以更加方便的利用MATLAB的工具箱中的图像读入函数，将二值图像以矩阵的形式保存在二维数组中，以便于实验的进行。根据现实生活中通过拍照、美图、PS的等媒体软件我们时常接触到图像，如BMP、JPG、JIF等。其中有静态图像也有动态图像，本课题谈论的是BMP格式的静态图像。本课题选取的是BMP格式的512*512像素的“lena”灰度图像作为数字水印的宿主图像，利用Windows 7自带的画图工具制作出实验中所采用的带有一定信息的水印图像定制为32*32像素的BMP格式的二值图像。4.3

30、.2水印的生成在本文中，我使用自制的32*32大小的BMP格式的二值灰度图像作为水印图像。其具体的生成方法为：首先，我们根据本次数字图像水印实验的需要来设定它的大小，并在制图工具中做出该图像，如在本文中的图像水印为“西北师大”的静态文字，其次将其大小设置为32*32并保存为1位（单色位图）的BMP格式图像。最后，我们用MATLAB工具中的工具函数将此图像读入，将其表示为与图像一一对应的二维数组。因此，根据本实验的要求，此二维数组序列就对应为本次实验所需要的水印序列。4.3.3水印的嵌入位置选取在载体图像与水印图像都已经选取好的情况下，接下来我们就是将水印图像根据一种算法嵌入到载体图像中去，即水

31、印的嵌入。本文采用的算法为上文中提到的离散余弦变换（DCT）。在将载体图像分块之后，根据人眼的视觉特性我们知道利用DCT块的区域特性来选择相应位置的系数，据研究统计表明，人眼视觉去对图像的低频区域相对较为敏锐，若在图像数据的低频区域隐藏隐秘的水印信息反而达不到算法的实现后的预期效果，导致水印的不可见性降低；然而，图像的高频区域主要是运用于图像数据的压缩，若在此处嵌入水印信息，随着市面上的音频剪辑软件日益增多，对于嵌入水印的宿主图像的鲁棒性大大降低了。因此，为了兼顾水印信息的不可见性和鲁棒性以及权衡水印在宿主图像的隐蔽性，图像数据的中频区域才应该是最合适的嵌入位置。本课题是通过修改图像数据的中

32、频DCT系数，并调整水印嵌入强度因子k的值，从而来实现水印的嵌入最终达到了信息隐藏的目的。4.3.4水印的检测与提取水印的检测通常是根据水印图像的位图和结构，以及宿主图像嵌入水印时所采用的算法，主要是要知道在嵌入水印时选取嵌入的位置以及设置的一些比较主要的参数等重要的内在信息，才可以比较完整地从载体图像中检测是否存在水印信息，决定着最终能否正确提取表示水印信息的图像数据。当然，采用不同的水印嵌入的算法就应该采取不一样的检测水印信息和提取水印图像的方案。对于检测水印信息来说，主要有两种方案：一是需要有原始载体图像进行对比检测出水印信息；二是不需要原始图像的盲检测水印算法。本课题中所采用的方案是使

33、用原始载体图像进行对比参照，从而提取出水印信息的水印检测算法。该算法大致可以分成以下的三个步骤：（1）首先将生成的已嵌入水印的宿主图像读入到二维数组I中，然后读取未嵌入水印的原始图像到二维数组W中，最后I与W进行比对。（2）根据嵌入强度因子k的取值，依次对嵌入水印图像分块成Block后，再对每个Block都进行一次DCT逆变换。（3）借助之前记录的中频区域为最佳嵌入位置，来进一步分析在该嵌入水印图像的每一个Block，通过判断其中的水印序列值是“1”还是“0”，并存储到相应的二维数组中就可以完整的复原出二值水印图像，从而达到提取水印的目的。4.4基于DCT域的图像水印算法实现与分析4.4

34、.1.水印的嵌入将二值图像水印信息嵌入到载体图像中，并通过在MATLAB系统中的具体实现，将原始载体图像和含有水印信息的载体图像两幅图像进行对比。在本次实验中，我们根据嵌入强度因子k的取值不同，分别列出了其在不同嵌入强度下的原始图像与含有水印图像之间的对比图。如图4.1为当嵌入强度k的取值不同时原始图像与含水印图像之间的对比图。（a）原始图像（b）k取8 （c）k取12 (d) k取14 （d）k取16 图4.1 k取不同值时原始图像与嵌入水印图像对比由图4.1可知，利用MATLAB运行嵌入水印的程序，随着嵌入强度k的取值不断增大，宿主图像在嵌入水印后质量进一步在降低，逐渐开始出现若隐若现

35、的斑纹及微小的突兀，即水印的不可见性越来越差。因此，本论文在所数字水印的嵌入时，因选取合适的k值，使其在满足不可见性的前提下最大限度的增强鲁棒性。4.4.2.水印的提取将水印嵌入到载体图像后，我们应该还能够将其从含水印载体图像中将水印提取出来。在下面的4.2中为在不同的嵌入强度下，对含水印的载体图像不进行任何的攻击手段，直接提取数字水印图片的提取水印与原始水印的对比图： (a)水印图像 (b)k取8 (c)k取12 (d)k取14 (e)k取16图4.2 k取不同值时原始水印与提取水印对比下表为通过改变程序中嵌入强度因子k的取值，分别对psnr值和nc值进行记录，反映出对于不同k值提取出水印结

36、果其质量的评价与性能等级。表4.1 直接提取水印时的性能评价嵌入强度k取值psnrnc提取水印等级844.98340.6757差1243.17570.9940良1442.63861优169.12581优30-100-根据上表中的数据信息分析和比较，我们可以得出以下结果：当数字水印嵌入强度因子k30时开始，水印无法成功嵌入原始图像，自然就无法成功提取出水印信息，也不会存在两图像对比的峰值信噪比（PSNR）的数据，当然，也无法对提取的水印进行合适的性能评价，所以如表4.1所示，当k=30和k=100时，实验数据并未录入。但是当嵌入强度因子k14以后，通过与原始图像进行对比，从嵌入水印的宿主图像中直

37、接检测并提取的水印信息，与原始水印信息竟达到1的惊人相似度，也就是说已经几乎可以完全的复原出原始水印信息，这也就呈现出在数字水印嵌入过程中鲁棒性与不可见性的矛盾。然而，如果不断的逐渐增大嵌入强度因子k的值，PSNR值就出现了持续性的减小，但NC的值仍然保持原有的1不变。即伴随着嵌入强度因子k的逐渐增大，嵌入水印后的宿主图像会陆续会出现斑纹，其宿主图像的质量将会大打折扣，而嵌入其中的水印信息却会更加健壮，并且从宿主图像中将能更加方便的提取出之前所嵌入的水印信息。原始图像与含水印的宿主图像之间的峰值信噪比（PSNR）则是用来度量经过处理后载体图像的质量，通常情况下是其值越小表示图像质量越次，反之，

38、其值越大表示图像质量越好。本课题实验表明随着嵌入强度因子k值持续增大的同时导致了PSNR值骤然减小，也就是说提取到的水印图像信息不够清晰，质量较低。因此，在选取水印嵌入强度时，我们既要考虑水印的不可见性，又要考虑水印的鲁棒性，使它们达到一个平衡，这样，让我们的数字水印不但有良好的不可见性，而且还能有很强的鲁棒性。第五章总结本课题首先论述了关于语音信号一些基本的处理，以及针对数字水印算法的特点，设计并给出了关于数字水印系统质量的评价。其次，借助MATLAB编程绘制短时间的语音信号的语谱图，简易地阐述了语谱图显示过程中涉及到的相关的MATLAB 函数，并根据窄带语谱图的彩色图和灰度图进行对比做了

39、简要的分析。语音信号的采集与预处理均是借助音频软件的录音、放大和去噪等功能实现的，因此通过MATLAB实现语谱图的显示时，要求本着正确地对待和处理问题的态度对语音信号反复地进行多次的采集，还需要不断进行预处理操作以及求其功率谱，最终显示出较为完善的语谱图。本课题接着阐述了DCT图像水印算法分析与设计，以及在MATLAB中编程实现该算法。通过取不同的k值，对原始图像与嵌入水印图像进行不可见性的验证，对提取出的水印图像也作出相应的质量评估；最后得出k=14时较好达到了数字图像水印的鲁棒性和不可见性之间的平衡。本文实验中所提到的所有采集的声音、图像等数据均是从较为安静的室内环境下收集和选取的。本课题虽然将一段较短的语音信号通过MATLAB编程绘制出其语谱图。但仍需要继续对较长的未经去噪的语音信号进行剖析，以及通过语谱图再逆变换成原始的语音信号。首先语音信号可以用语谱图来表示，然后将运用于图像水印的算法运用到语谱图中，那么将在音频数字水印领域有很大的应用。本人在撰写毕业论文期间是在杨春风老师的指导下进行的。感谢杨春风老师在课题研究中所给予的帮助、关心、细心指导和教诲。感谢本人的学友和朋友们对本人的关心和帮助。最后感谢我的家人一直以来对我的理解、支持和鼓励。由于本人能力有限，论文中难免出现疏漏之处，敬请各位老师和同学批评指正。

展开阅读全文