基于动态差分扩展的强鲁棒数据库水印算法研究.pdf

资源描述

1、2023 年 10 月 Chinese Journal of Network and Information Security October 2023 第 9 卷第 5 期网络与信息安全学报 Vol.9 No.5 基于动态差分扩展的强鲁棒数据库水印算法研究汪天琦1,2,3，张迎周1,2,3，邸云龙1,2,3，李鼎文1,2,3，朱林林1,2,3（1.南京邮电大学计算机学院，江苏南京 210023；2.南京邮电大学软件学院，江苏南京 210023；3.南京邮电大学网络空间安全学院，江苏南京 210023）摘要：科技行业的快速发展带来信息量的暴增，各行各业都需要收集和应用大量的数据，海

2、量数据在发挥价值的同时，给数据安全领域带来了史无前例的挑战。关系型数据库作为数据的底层存储载体之一，其存储的数据规模大、数据内容丰富、数据隐私度高。数据库的数据一旦泄露将会造成巨大的损失，保护数据库的所有权，确认数据的归属刻不容缓。对于现有的数据库水印技术来说，提高水印嵌入容量和减小数据失真之间存在固有矛盾问题，为了缓解此问题且进一步提高水印的鲁棒性，提出了一种基于动态差分扩展的强鲁棒数据库水印算法。该算法选取QR码作为水印，利用经过Haar小波变换的图像低频部分进行奇异值分解（SVD，singular value decomposition），提取部分特征值，用取余后的特征值作为待嵌入的水印

3、序列，使得相同长度的水印序列包含更多信息，缩短了嵌入水印的长度。该算法结合自适应差分进化算法和最小差值算法选择最佳嵌入属性位，以缓解传统差分扩展技术在嵌入水印时计算效率低、数据失真大、鲁棒性差的问题，提高水印嵌入容量的同时减少了数据的失真。实验结果表明，该算法保证高水印嵌入率的同时数据失真较低，能够抵御多种攻击，具有良好的鲁棒性，追踪溯源的能力强，且与现有的算法对比优势明显，在数据安全领域具有广阔的应用前景。关键词：数据库水印；差分进化；差分扩展；SVD；Haar 小波变换；QR 码中图分类号：TP393 文献标志码：A DOI:10.11959/j.issn.2096109x.202306

4、5 Research on strong robustness watermarking algorithm based on dynamic difference expansion WANG Tianqi1,2,3,ZHANG Yingzhou1,2,3,DI Yunlong1,2,3,LI Dingwen1,2,3,ZHU Linlin1,2,3 1.Department of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China 2.Department of S

5、oftware,Nanjing University of Posts and Telecommunications,Nanjing 210023,China 3.Department of Cyberspace Security,Nanjing University of Posts and Telecommunications,Nanjing 210023,China Abstract:A surge in the amount of information comes with the rapid development of the technology industry.Across

6、 all industries,there is a need to collect and utilize vast amounts of data.While this big data holds immense value,it also poses unprecedented challenges to the field of data security.As relational databases serve as a 收稿日期：20220402；修回日期：20221121 通信作者：张迎周，引用格式：汪天琦,张迎周,邸云龙,等.基于动态差分扩展的强鲁棒数据库水印算法研究J.

7、网络与信息安全学报,2023,9(5):150-165.Citation Format:WANG T Q,ZHANG Y Z,DI Y L,et al.Research on strong robustness watermarking algorithm based ondynamic difference expansion J.Chinese Journal of Network and Information Security,2023,9(5):150-165.第 5 期汪天琦等：基于动态差分扩展的强鲁棒数据库水印算法研究 151 fundamental storage mediu

8、m for data,they often contain large-scale data rich in content and privacy.In the event of a data leak,significant losses may occur,highlighting the pressing need to safeguard database ownership and verify data ownership.However,existing database watermarking technologies face an inherent tradeoff b

9、etween improving watermark embedding capacity and reducing data distortion.To address this issue and enhance watermark robustness,a novel robust database watermarking algorithm based on dynamic difference expansion was introduced.The QR code was employed as the watermark,the SVD decomposition of the

10、 low frequency part of the image was utilized after Haar wavelet transform.By extracting specific feature values and using residual feature values as the watermark sequence,it was ensured that the same-length watermark sequence contains more information and the embedded watermark length can be reduc

11、ed.Furthermore,by combining the adaptive differential evolution algorithm and the minimum difference algorithm,the optimal embedding attribute bits were selected to alleviate the problems of low computational efficiency,high data distortion and poor robustness of traditional difference expansion tec

12、hniques in embedding watermarks,and to improve the embedding capacity of watermarks while reducing the distortion of data.Experimental results demonstrate that the proposed algorithm achieves a high watermark embedding rate with low data distortion.It is resilient against multiple attacks,exhibiting

13、 excellent robustness and strong traceability.Compared to existing algorithms,it offers distinct advantages and holds great potential for broad application in the field of data security.Keywords:database watermarking,differential evolution,difference expansion,singular value decomposition,Haar wavel

14、et transform,quick response code 0 引言科技行业的快速发展带来的是信息量的暴增，各行各业都需要收集和应用大量的数据，累积的数据规模正以惊人的速度增长。海量数据蕴含的商业价值巨大，但其发挥价值的同时，也为数据安全领域带来了史无前例的挑战。数据库作为最常用的底层存储工具之一，其信息安全问题不容小觑。国内外学者大多是通过数据库水印技术来保护数据库的数据安全，解决信息泄露、源头难以追踪的困扰。在数据库背后利益的驱使下，攻击者在数据库所有者不知情的情况下对其加以复制、分发和篡改。数据库的数据一旦泄露将会造成巨大损失，保护数据库的所有权，确认数据的归属刻不容缓。数字水印

15、技术1可以有效解决很多信息安全问题，作为一种安全有效的保护数字版权的技术手段，数字水印技术广泛应用于多媒体领域2-3。但是，针对数据库的数字水印研究相对较少。目前，数字水印技术主要关注其不可见性、鲁棒性、安全性和嵌入容量等特性4。可逆水印技术是数字水印技术的一个重要分支，Zhang 等5提出了经典的可逆水印算法，该算法利用直方图平移拓展出的冗余空间按照指定的运算公式来嵌入水印，经过逆运算即可恢复出原始数据和水印信息，但是该算法的鲁棒性较差，在面对不法分子的恶意攻击时提取出的水印信息不完整。针对 Zhang 等提出算法的不足，Hu 等6引入了遗传算法训练出最佳的水印嵌入位置，结合分组密钥和平移直

16、方图设计了一种基于遗传算法的直方图平移可逆水印技术。对于数据库水印来说，水印隐藏在关系数据库中，数据值变化较大，严重破坏原始数据的质量，水印的鲁棒性低，攻击者很容易破坏水印信息。Gupta 等7吸取了数字水印技术的经验，提出了基于差分扩展的可逆数据库盲水印，选取元组中的任意两个属性值，通过差分扩展计算将水印嵌入数值中，对两个属性值进行计算嵌入一位水印，导致数值改动大于水印的嵌入，影响了数据库的可用性和鲁棒性。差分扩展技术中增加了水印嵌入容量，但不可避免地增大了数据的失真，于是研究者想到利用优化算法改进差分扩展数据库水印方法。Jawad 等8利用遗传算法改进了基于差分扩展的可逆数据库盲水印，提出

17、基于遗传算法的差分扩展可逆数据库水印，提高数据库水印算法的鲁棒性同时减少数据失真。但是，经过遗传算法优化的水印嵌入率并不尽如人意。邱升红9152 网络与信息安全学报第 9 卷设计了一种基于差分扩展和人工蜂群算法的数据库可逆水印方法，使用人工蜂群算法代替遗传算法进行优化，增大了水印的嵌入容量并减少了数据的失真，进一步提高了水印算法的鲁棒性。宋岩等10利用改进的布谷鸟算法启发式地搜索水印嵌入属性位，通过差分扩展嵌入水印，对于大规模的数据库算法的水印嵌入率较高，对抗攻击的能力较强。孔嘉琪等11基于模拟退火改进的粒子群算法寻找更好的水印嵌入位置，提出了基于属性重要度的带权损失函数，解决了现有方案在

18、抗属性维度攻击时鲁棒性较差的问题。由于数据库存储的是纯数据，其数值的改变对原载体的影响远大于多媒体水印，所以数据库水印技术很难在水印容量和数据失真方面保持平衡。Shi 等12试图通过恢复原始数据和嵌入式水印信息来克服数据失真的问题。可逆水印技术能够在提取水印的同时恢复数据，然而目前的可逆数据库水印技术在嵌入水印后，数据质量和水印鲁棒性方面存在缺陷，基于此，Ge 等13对水印容量和数据失真做了研究和改进，在一定的数据失真范围内提高了水印嵌入容量。现有的技术主要通过增加水印长度或提取水印特征压缩数据两种方法来达到提高水印嵌入容量的目的。陈青等14提出了一种新的基于旋转稳定区域和两级奇异值分解（SV

19、D，singular value decomposition）的水印算法，保证水印的嵌入容量，且具有良好的不可见性和较高的鲁棒性。关虎等15将大容量、高容错的二维码理论应用于变换域图像水印算法，在保证水印不可见性和算法安全性的基础上，显著提高了水印容量和鲁棒性。在学者不断研究改进的过程中，数据库水印的鲁棒性和嵌入容量逐渐提高，数据的失真能够控制在合理的范围内。1 本文算法 1.1 算法框架大多数据库水印技术是单纯地嵌入一串数字序列或一副图像，包含的信息量较少且容易被攻击者破坏。当数据库发生泄露被恶意攻击时常常会导致水印被破坏，无法根据提取的信息锁定攻击者，因此水印的鲁棒性和溯源度较差。为了解

20、决这一问题，需要增加水印的嵌入容量，但是嵌入容量过多会造成数据严重失真，影响数据库正常使用。针对数据库冗余性小、水印嵌入容量和数据失真之间存在固有矛盾等问题，本文提出了一种基于自适应差分进化（ADE，adaptive dif-ferential evolution）和动态差分扩展（DDE，dynamic difference expansion）的强鲁棒数据库水印算法，以下简称 ADE-DDEW。所提算法首先对经过 Haar 离散小波变换的图像低频部分进行SVD，提取非 0 特征值，然后对特征值进行取余，对取余后的特征值进行动态压缩作为待嵌入的水印序列。结合自适应差分进化算法和最小差值算法选择

21、最佳的水印嵌入属性位，最后通过动态地选取传统的或改进的差分扩展技术进行水印的嵌入。算法的总体框架如图 1 所示，主要包括水印预处理、水印嵌入和水印提取 3 个部分。1.2 数据库水印预处理为了解决嵌入容量和数据失真之间的矛盾，尽可能达到嵌入更多身份信息的同时压缩待嵌入水印长度的目的，将水印嵌入数据库之前，需要对水印图像进行预处理。为了包含更多的信息，图像水印是最佳的选择。图像作为水印嵌入数据库往往采用分割的方法，未经过数据压缩直接嵌入导致有效嵌入率很低。QR 码容量密度大且容错性极强，因此使用 QR 码作为原始的水印载体。假设关系型数据库1DB(PK,Arr,Arr,Arr)iN，其中 P

22、K 为数据库每个元组的主键，Arri(1iN)为DB 的第i 个属性列，DB 中包含M 个元组，记为1,jMttt，每个元组 t 都有唯一的主键 t.PK 和 N 个属性列，第 j 个元组的第 i 列属性值Arri值表示为.Arrjit，数据库 DB 的第 i 列属性值表示为1.Arr,.Arr,.ArrijiMittt。待嵌入的 QR 码分别为嵌入数值信息的 QR 码和嵌入文本信息的 QR 码。QR 码的预处理过程主要分为频域分解、SVD 和动态压缩3 个阶段，具体操作如下。基于 Haar 小波变换的图像压缩算法的核心思想是通过计算平均值和差值得到细节系数（分为低频和高频），

23、将图像分解成若干个高频图像和一个低频图像，可以在不影响主要信息的情况下初步对原始图像进行压缩，达到减小图像信息量的目的。Haar能够完全无失真地还原出原始图像，进而提高水印的可溯源性。本文采用 Haar 小波变第 5 期汪天琦等：基于动态差分扩展的强鲁棒数据库水印算法研究 153 换对 QR 码图像进行频域分解，由于低频部分包含图像大多数的有用信息，并且低频信号对于图像压缩、高斯噪声等多种图像处理操作有很强的抵御能力，所以本文提取分解后的低频图像作为处理完成的水印图像。假设水印图像的 4 个相邻像素值是a,b,c,d，基于 Haar 小波变换的 QR 码频域分解的具体步骤如下。步骤 1 将

24、4 个像素值两两分组，得到a,b和c,d。步骤 2 根据式(1)分别计算这两组像素值的均值和差值，很容易得到两组均值和差值分别是1,01,0,和1,1,1,1，其中表示均值，表示差值。将这两组值重新组合成为1,01,11,01,1,，这两个均值被称为一级均值。步骤 3 分别计算两个一级均值（即一级均值1,01,1,）的差值和均值，根据式(2)可以进行二级小波系数的计算，其均值和差值分别是0,0和0,0。用0,0和0,0替换掉步骤 2 的两个一级均值，就可以得到 4 个相邻像素值a,b,c,d最终的二级Haar 小波变换系数0,00,01,01,1,。1,01,11,01,12222abcdab

25、cd(1)1,01,10,01,01,10,022(2)步骤4 根据实际的需求重复步骤2、步骤3，最后提取由低频系数0,0组成的水印低频图像。SVD16主要应用在数据降维和数据压缩领域，是很多机器学习算法的基石，其核心思想是将图像矩阵分解出特征值和特征向量。矩阵的运算可以描述为线性空间中的变换，当一个矩阵进行运算时，本质上就是在矩阵空间下进行的一次线性变换（拉伸或者旋转），线性变化无法直观地通过图像来展示，但是经过奇异值分解得到的部分特图 1 算法的总体框架 Figure 1 General framework of the algorithm 154 网络与信息安全学报第 9 卷征向量

26、代表了该矩阵的主要变化方向。在这些方向上进行变换，就可以模拟矩阵的运算。基于上述性质，SVD 可以做到无失真的压缩，不对图像造成损坏的同时通过逆运算还原出原始图像。目前，图像作为水印嵌入数据库的场景基本是需要分割图像，然后将分割后的子图像分别嵌入分组后的子数据表。这种传统的方法不仅对图像的尺寸有一定的要求，而且由于数据库的分组不是无限的，所以嵌入的图像也有一定的限制。为了将二维的图片水印压缩成一维的水印序列，使用 SVD 技术对频域分解后提取出的低频图像进一步压缩，提取部分特征值生成水印序列。SVD不要求图像的尺寸并且有很强的数据降维能力，提高了水印信息的压缩率，使得相同长度的水印序列中包含更

27、多的数据信息。假设 QR 码图像是一个MN的矩阵A，经过SVD 可以变成如式(3)的形式。TAUSV(3)其中，M MUR是左奇异值矩阵，N NVR是右奇异值矩阵，M NSR是奇异值矩阵，仅在对角线上有值，其他元素均为 0，其一般形式如式(4)所示。120000000000000000NM NS(4)式中diagS(12,N)是一个对角矩阵，12,N 表示图像的特征值，大小满足120k，呈速度下降趋势。第一个特征值1远大于其他的特征值，包含最多的数据信息，以此类推，越末尾的特征值越小，含信息量越低。基于这一特性，提取出的水印序列即使丢失部分特征值也不影响水印图像的还原，鲁棒性较高。水印 SVD

28、流程如图 2 所示。为了增加嵌入的水印信息，使其可以更好地抵御攻击，分别选取嵌入数值信息和文本信息的 QR 码低频图像进行SVD，首先对两幅低频图像1P和2P进行 SVD，分别得到特征值矩阵1S和2S，然后从1S和2S中提取非 0 特征值得到一维水印序列12,(,W)k，1()kMN。图 2 水印 SVD 流程 Figure 2 Watermark singular value decomposition flow 1.3 算法设计（1）数据库分组大多水印算法的分组采用传统的哈希分组方法，利用主键和密钥作为参数进行分组。考虑到差分扩展的计算特性，为了尽可能地减小数据的失真，本文采用聚类的分

29、组方法，将相似的数据分到一组，聚类的方法可以避免从遭受置乱攻击的数据库中提取出来的水印乱序的问题。根据K-means 算法17对数据库 DB(1PK,Arr,Arr,ArriN)进行分组，将属性数值较为相似的元组分为一组，划分为K个大小不同的子组12,KG GG。为了提高水印的鲁棒性，采用冗余嵌入水印的方法，即对于每个子组来说，其待嵌入水印的元组都嵌入相同的水印比特位，因此要求分组数量K=L，L为要嵌入的水印序列的长度。定义 1 属性失真：定义数据库嵌入水印后大于原本属性列最大值或者小于最小值的属性值为失真的属性值。即对于有N个属性列的数据库DB来说，每个特征属性列数值的非失真范围为min

30、maxArr,Arrii(1,2,iN)。定义 2 水印嵌入容量（WEC，watermark embedding capacity）：把嵌入水印的元组数和总元组数的比值定义为水印嵌入容量。由于水印嵌入在数据库的属性值中，因此水印的嵌入容量与嵌入水印位置的个数有关，即与数据库中嵌入水印的元组数相关。水印嵌入容量的计算方法如式(5)所示。其中，Tuple表示数据第 5 期汪天琦等：基于动态差分扩展的强鲁棒数据库水印算法研究 155 库分组后子组中的元组总数，Tupleew表示嵌入水印后属性值未超过失真范围的元组行数。ewTupleWECTuple(5)定义 3 数据失真量（AoDD，amount

31、 of data distortion）：定义嵌入水印前后属性值的改变率为数据失真量。即对于任意属性列来说，是嵌入水印造成的整体数据差值和该属性列极差之间的比值。数据的变化量受原始数值的影响较大。具体来说，一位数的数据变化量只能在区间0,9，而两位数则可以达到0,99，以此类推，可以得出原始数值越高，可能导致数据变化量越大，如果只是单纯地累加数值变化量，对于有失真统计来说有失公平。本文数据失真量的计算方法如式(6)所示。Col,1maxminmaxmin,11AoDDCol|.Arr.Arr|.Arr.Arr|ArrArrArrArririji jSrjrjriritS SiijjEtttt

32、(6)其中，Col表示数据库要嵌入水印的属性列个数，Si表示第i列属性中嵌入水印后的属性值集合，iSE表示Si中有多少个元素，maxArri表示第i列属性中的最大值，minArri表示第i列属性中的最小值，.Arrrit表示第r行第i列的属性值，.Arrrit表示第r行第i列嵌入水印后的属性值。由于差分扩展技术使每个元组改变两个属性数值，因此要分别对其改变量进行计算。将上述WEC和AoDD两个指标作为目标函数的主体得到最终的目标函数，如式(7)所示。objFuncWECAoDDcdww (7)其中，cw(cw0)为水印嵌入容量WEC的权重值，dw(dw0)是数据失真AoDD的权重值，满足cw

33、1dw。可以根据对水印嵌入容量和数据失真的不同需求动态调整训练参数。（2）最佳嵌入属性位选取本文利用自适应差分进化算法15进行水印最佳嵌入位置的选择，在提高嵌入容量的同时数据失真也会比较大。因此，通常选择每一个元组差值最小的两个属性进行嵌入，但是该算法难以抵御最小差值攻击。于是，在嵌入水印之前增加一次属性失真的判断，将超过属性失真范围的属性位置用最小差值计算的属性位置来代替，具体步骤如下。步骤 1 初始化基因种群X。首先根据式(8)随机产生包含N个个体的初始基因种群00012,NXxxx，0ix基因个体是一个浮点数，表示当前数据库子组被选择属性列的决策值，其中，整

34、数部分表示第一个嵌入水印的属性位，小数部分表示第二个嵌入水印的属性位。确定交叉算子CR，确定最大的进化迭代次数maxEI，初始EI=0。0rand(0,1)(ublb)ix (8)其中，ub和lb分别为0ix取值的上下界，rand(0,1)表示在区间(0,1)内随机取一个数。步骤 2 根据式(9)式(11)对初始基因种群进行变异处理得到变异后的基因个体数组V。12EI+1EIEIEIbest()iiiVxF xx(9)12EI+1EIEIEIEIEIbest()()iiiiiVxF xxF xx(10)EI3objmaxEIbestEIbest3objminEI()1,FuncFunc()()

35、1,FuncFunc()iif Vf xFf xf V (11)步骤 3 生成随机值randj，rand0,1j，如果randCRj或者randjj，则变异个体保留到下一代；否则当前个体保留到下一代。根据式(12)将生成的变异个体和当前个体进行交叉操作，生成交叉后的个体数组U。EI+1randEI+1EI,rand0,1CR,(1,2,)ijjijijVjjUxjN或者其他(12)步骤 4 分别计算U和X的适应度函数，适应度函数越小，说明越符合收敛目标。步骤 5 根据步骤1重新随机产生一个新的初始种群X，分别计算X和X的适应度函数。步骤 6 重复执行步骤2到步骤5，直到获得最优决策向量或者达到

36、最大的进化迭代次数，计156 网络与信息安全学报第 9 卷算得到的最优值即当前数据库子组的最佳待嵌入水印属性位，与元组主键一起构成水印嵌入位置表adet。步骤 7 提取每个参与水印运算的元组取余后属性差值最小的两个属性，从而记录最小差值的水印嵌入位置表mdt。对adet进行属性失真判断，如果元组嵌入水印后的值超过了有失真范围，则将其水印嵌入位的下标记为1，然后把下标为1的位置用mdt的下标来代替，生成最终的嵌入水印的属性位置表ade_mdt。（3）水印嵌入算法差分扩展技术18的核心思想是利用数值间的平均值和差值计算将水印嵌入数据载体中。基于这一特性，差分扩展的水印嵌入率很高，但同时如果数

37、据之间的差值过大，刚经过计算后得到的新数据的改变量也很大，数据的失真降低了数据水印的可用性。因此本文对要嵌入水印的数据进行有条件的取余，尽量将数据之间的差值控制在一定范围内，优化差分扩展特性导致的数据失真过大的弊端，增大水印的嵌入容量。假设要嵌入水印的属性值为12AA、，待嵌入的水印比特为Wi，改进的差分扩展技术采用取余的方式降低数值间的差值，如式(13)所示。11mod22mod11mod22modmodValmodValdiv/Valdiv/ValaAaAAA(13)其中，12aa、为取余后的属性值，modVal为取余值，12divdiv、表示对应的除数。取余后属性值间的均值avg和差值d

38、计算如式(14)所示。1212avg2aadaa(14)其中，x表示向下取整，在水印嵌入阶段，嵌入水印的方式是对差值进行扩展，如式(15)所示。2iddW (15)得到嵌入水印的取余属性值12aa、，计算如式(16)所示。121avg2avg2dada (16)取余数和除数相乘加上嵌入水印的取余属性值还原得到最终嵌入水印的属性数值12AA、。计算如式(17)所示。1mod112mod22ValdivValdivAaAa(17)传统差分扩展技术和改进差分扩展技术对数值的改变量受到原始数据差值的影响，根据图3可以看出，在原始数据差值小于10时，传统的差分扩展的数据改变量普遍小于改进的差分扩展，而在

39、原始数据差值大于10时，改进的差分扩展的数据改变量明显小于传统的差分扩展。因此，选取嵌入水印的属性位置后，先判断该位置上的属性差值d，如果d10，则选择传统的差分扩展算法，反之选择改进的差分扩展算法。图 3 传统的差分扩展和改进的差分扩展算法应嵌入水印后的数据改变量对比 Figure 3 Comparison of the amount of data change between the traditional differential extension algorithm and the improved differential extension algorithm after e

40、mbedding the watermark 基于自适应差分进化和动态差分扩展的水印嵌入算法如算法1所示。首先对数据库进行聚类分为K个子组；其次对所有子组使用自适应差分进化算法初步选择出水印嵌入位，通过有失真分析结合最小差值算法确定最佳的水印嵌入位；最后判断嵌入水印数值间的差值，根据差值的范围动态选择传统的或改进的差分扩展算法，依次对第 5 期汪天琦等：基于动态差分扩展的强鲁棒数据库水印算法研究 157 子组进行水印的嵌入。特别地，每个子组冗余地嵌入同一水印比特位。算法 1 ADE-DDEW水印嵌入算法输入数据库DB，数据库分组数K，嵌入水印属性列数N，待嵌入水印序列W，取余值Valmo

41、d 输出嵌有水印的数据库DB，最终的嵌入水印位置表ade_mdt 1)ade_mdt=/初始化最终的嵌入水印位置表ade_mdt 2)adet=/初始化根据自适应差分进化计算的水印最佳嵌入属性位置表adet 3)mdt=/初始化根据最小差值计算的水印最佳嵌入属性位置表mdt 4)DBikmeans(DB,K)/利用K-means 算法进行数据库分组，得到K个子组 5)For i=0 to K1 do /遍历每个子组嵌入水印，得到嵌有水印的数据库DB 6)adetADE(DBi,K,N)/自适应差分进化算法计算出最佳属性下标存放在adet数组中 7)mdtMD(DB,K,N)/最小差值函数计算

42、出差值最小的属性下标存放在数组 mdt 中 8)If Distortion(adet)Amiw,Amax then /模拟嵌入水印判断是否超过允许有失真范围 9)adet12=1 /如果超过有失真范围，将有失真属性位置下标置为1 10)End if 11)ade_mdt 将adet数组中下标为1的部分用mdt的下标代替 12)For j=0 to ade_mdt.GetLength(0)1 do /遍历当前子组嵌入水印位置表ade_mdt 的嵌入位置 13)For k=1 to ade_mdt0.length1 do 14)If ade_mdt ik!=1 then 15)If dv1 the

43、n /大数表决 15)Wi=0 /如果提取的水印0的个数大于1的个数，则该子组的水印比特为0 16)Else 17)Wi=1 /否则该子组的水印比特为 1 18)End if 19)W.append(Wi)/依次组合每个子组提取的水印比特值 20)QRSVD(W,U,D)/W和左右奇异值矩阵相乘得到低频图像矩阵QR 21)QRHar(QR)/通过Haar小波逆变换还原出QR码图像 22)DB=1KiUDBi /各个子数据库合并成原始数据库 23)End for 24)Return DB,W,QR 2 实验与结果分析 2.1 实验指标本文的仿真实验采用UCI机器学习资源库提供的Applianc

44、es energy prediction Data Set作为数据样本，该数据库包含19 735个元组和29个属性。由于ADE-DDEW水印算法是对整数型的数值属性进行计算，所以对于浮点型属性值进行预处理，将其扩大成整数型数据然后通过差分扩展嵌入水印，最后等比例还原成浮点型。将ADE-DDEW算法与已有的GADEW10、GAHSW8、RF-GADEW14和RF-GAHSW14等可逆数据库水印算法进行对比实验分析。本文通过对比原始水印比特位和提取的水印比特位的方法来衡量数据库水印算法的鲁棒性，即水印的误码率（BER，bit error rate）8。鲁棒性评价指标BER的计算如式(23

45、)所示。第 5 期汪天琦等：基于动态差分扩展的强鲁棒数据库水印算法研究 159 11BERKiiiWWK(23)其中，K为数据库的分组数，即水印序列的长度，Wi和 Wi分别是嵌入水印和提取水印的第i位比特值。由式(23)可知，算法的鲁棒性和BER成反比，较低的误码率值意味着较高的水印鲁棒性。对于数据库水印算法的嵌入容量，通过水印嵌入容量（WEC）来衡量，即计算嵌入水印的数据库元组占数据库元组的比例。对于数据失真，即嵌入水印后造成数据库数据的改变量。本文通过水印嵌入前后属性的平均值（Mean）、标准差（Std）的变化以及平均绝对误差（MAE）来量化其统计失真，MAE的计算如式(24)所示。1|

46、MAEniiiAAn(24)其中，n为数据库元组的个数，iA和iA分别为嵌入水印前后对应的属性值。2.2 相关参数分析在将水印嵌入数据库之前，需要对QR码和数据库进行预处理，使得嵌入的水印序列包含更多信息，提高嵌入容量。为了在相同长度下得到更多信息，经常采用数据压缩技术，这其中Haar小波变换效果最好，嵌入数字QR码和嵌入文本QR码的小波变换对比分别如表1和表2所示。压缩率和绝对最大差异是衡量小波变换压缩效果的指标。压缩率越高，表示数据压缩的能力越好，信息密度越高；绝对最大差异越大，表示数据信息的多样性越好，过滤信号的能力越强。本文对不同像素的QR码进行了小波变换实验，从表1和表2可以看出，

47、Haar小波变换的压缩率和绝对最大差异综合强于另外3种小波变换（Daubechies、Coiflet、Symlet）算法，这也是文本选用Haar小波变换压缩QR码的理由。改进差分进化算法中的取余值modVal决定了数据的改变量，取余值过小，数据碰撞频繁，嵌入难度大；取余值过大，数据失真增大，数据库的可用性降低。本文对530的取余值进行了实验，计算其平均数值改变量，取余值modVal与数值改变量的关系如图4所示，可以看出取余值modVal=7时，数据的平均变化量最少。ADE-DDEW水印算法采用自适应差分进化算法计算最佳属性位，不同的种群规模对算法最优解的计算有一定的影响，种群规模过大导致算法的

48、收敛速度下降，搜索时间增加；种群规模过小容易过早收敛，全局搜索能力差，影响算法的鲁棒性。对区间10,120的种群规模P进行测试，不同种群规模下适应度值对比如图5所示，结果显示，当种群规模为90时，目标函数适应度值最小。表 1 嵌入数字 QR 码的小波变换对比 Table 1 Comparison of wavelet transform with embedded digital QR code 小波变换 QR 码像素为 6464 QR 码像素为 128128 QR 码像素为 256256 压缩率绝对最大差异压缩率绝对最大差异压缩率绝对最大差异 Haar 70.7 001 953 5

49、.4 001 247 78.3 752 441 7.3 896 444 93.3 868 408 9.094 947 Daubechies 68.8 720 703 1.0 516 032 74.2 797 851 1.2 221 335 82.588 195 1.4 687 962 Coiflet 71.508 789 1.4 861 683 75.8 422 851 7.6 738 615 84.6 649 169 1.8 301 996 Symlet 69.2 626 953 1.0 461 462 74.1 210 937 9.0 750 518 84.1 064 453 2.1 75

50、3 364 表 2 嵌入文本 QR 码的小波变换对比 Table 2 Comparison of wavelet transform with embedded text QR code 小波变换 QR 码像素为 6464 QR 码像素为 128128 QR 码像素为 256256 压缩率绝对最大差异压缩率绝对最大差异压缩率绝对最大差异 Haar 69.5 751 953 5.9 685 589 83.203 125 7.3 896 444 89.979 553 7.6 738 615 Daubechies 67.8 955 071 9.3 791 641 77.1 911 621

展开阅读全文