基于注意力机制的音频隐写算法研究.pdf

资源描述

1、：引用格式：李宗佑，高勇基于注意力机制的音频隐写算法研究无线电工程，（）：，（）：基于注意力机制的音频隐写算法研究李宗佑，高勇（四川大学电子信息学院，四川成都）摘要：为提高音频隐写算法的安全性，提出了一种将卷积注意力模块（，）与深度神经网络相结合的高容量、高透明性和高鲁棒性的隐写术。网络在频域对信号进行处理，其模型包含部分：含密音频的自适应编码、解码和提取秘密音频。编码器和解码器在末尾卷积层后添加注意力模块，在提高模型感受野的同时，增强了秘密信息对隐写嵌入位置的敏感程度，大大提升了隐写术的容量和透明性。实验在多个干净与含噪语音数据集上进行，结果表明，该隐写术相较于传统隐写方案，含密音频信

2、噪比提升，嵌入容量提升约倍；相较于对比神经网络生成的含密音频，信噪比提高了约。此外，实验还进行了加噪训练，测试结果证明该模型具有较好的鲁棒性。关键词：隐写术；神经网络；注意力模块；频域中图分类号：文献标志码：开放科学（资源服务）标识码（）：文章编号：（），（，）：，（），：，：；收稿日期：基金项目：国家部委基金资助项目（）：（）引言隐写术是一门将秘密信息隐藏在载体中的技术，除了通信双方外，第三方很难察觉到除载体外隐藏信息的存在。音频的隐写术最先兴起的是将文本隐藏在音频文件中并进行端对端传播，随着需求的不断增加，语音作为秘密信息进行传输逐渐进入人们的视野。音频隐写系统主要有个评价指标，分

3、别是透明性、鲁棒性以及隐写容量，这三者相互制约，很难同时达到最优效果。文献通过改变音频相位编码来进行数据隐写，虽然结果表明其具有较好的抗攻击能力，但是隐写容量仅有。文献是在音频的时域中去寻找隐写空间，其中最为流行的技术是修改最低有效位（，）来进行秘密信息的嵌入。文献提出了一种基于离散小波变换特征值量化的语音隐藏技术，首先通过应用离散小波变换将数字语音的每一帧变换到小波域，然后利用奇异值分解计算系数的特征值，最后对特征值进行量化处信号与信息处理年无线电工程第卷第期理来嵌入信息，结果表明透明性和鲁棒性均有了不错的提升，但是隐写容量仍然很低。针对传统隐写算法的不足，等首次提出使用神经

4、网络进行音频隐写，虽然透明性一般，但是将隐写容量提升至一个新高度；等提出了一种基于生成对抗网络的音频隐写算法，目的是利用对抗训练来进行数据增强，从而提升含密音频的透明性。为了在隐写容量与透明性上都能有较出色表现，本文提出一种基于注意力机制的音频隐写算法，将音频信号的短时傅里叶变换（，）和短时傅里叶逆变换（，）作为网络的输入，在编解码器不同位置加入卷积注意力模块（，）来提高网络对有效特征的敏感程度，使得整个系统具有较高透明性、鲁棒性以及较大隐写容量。注意力机制注意力机制是在神经网络计算能力有限的情况下，通过分配权重将计算资源分配给更重要的特征任务，过滤了绝大部分无关特征信息，从而解决信息过载的问

5、题。本文采取的是用于前馈卷积神经网络的简单有效的注意力，给定一个中间特征图作为输入，按照顺序推导一维的通道注意力图和二维空间注意力图。的整个注意力机制流程如图所示，整个过程用式（）表示：（）（），（）式中：表示基于元素的乘法，表示通道注意力模块对输入信号进行处理后提取到的通道维度特征。空间注意力模块对进行空间维度的特征提取后得到最终输出特征。图注意力机制流程通道注意力模块首先使用平均值池化和最大值池化操作来聚合特征图的空间信息，生成的个不同特征信息上下文描述符号和。这个特征被输入到一个共享网络中，生成通道注意力图，这个共享网络是由一个隐藏层的多层感知机（，）组成。同时，为了降低计算成本，隐藏

6、层的激活规模被设置为，其中为减小率。通道注意力模块的计算过程如下：（）（）（），（）（）（）（），（）式中：表示激活函数，表示（），表示（），和是个输入的共享权重。空间注意力模块将得到的同时采用了种池化方法，进而得到个维数相同的特征图和。然后将得到的个特征图串行地拼接起来，并利用一个的卷积层对拼接后的特征图进行卷积操作，最后利用函数激活生成空间注意力特征图。空间注意力模块运算如下：（）（；），（）（）（；），（）式中：表示卷积运算中滤波器的大小为。隐写术隐写方案本文以端对端的方式提出了一个基于的隐写方案。方案提出的模型在频域工作，但为了将音频作为时域信号传输，本节参考文献在模型训练过程中将

7、音频信号的和作为可微层应用，从而对网络输出施加另一个重要约束。流程如图所示。整个模型由个关键模块组成：学习从原信号与信息处理始音频信号中提取潜在冗余的映射，并将秘密信息“塞入”进去，从而使载体受到的影响最小；解码含密音频；从含密音频中提取隐藏消息。上述每个模块都是一个独立的神经网络，网络中需要学习的模型参数是通过最小化载体音频与含密音频、秘密音频与重构音频之间的均方误差（，）函数来实现的，因此损失函数可以表示如下：（，），（）（，），（）（，），（）式中：和分别表示含密音频和重构音频对应的，和的加入是为了平衡含密音频和秘密音频的重构。图隐写方案流程网络模型本文采用了深层注意力网络，为了简化

8、展示，、可以视为由子模块和子模块组成。子模块借鉴了网络的残差架构，引入残差边的目的是为了加速网络的收敛以及防止出现深层网络梯度爆炸的情况。网络结构如图图所示。图子模块图子模块图模型信号与信息处理年无线电工程第卷第期图模型图模型实验结果及讨论本次实验采用了和类语言（中、英文）的数据集对模型进行评测，按照的标准比例分割数据集作为训练、验证和测试集。种音频信号数据的采样率均为。为了提升模型效率，中傅里叶采样点数设置为，段间重叠采样点数设置为，可以保证获取到的特征数据宽度和高度是的幂次。通过随机选择一条音频作为载体信息、任意一条其他音频作为秘密信息来获取一组训练数据，并以

9、的形式完成嵌入，实验中对载体和秘密音频的选择是随意的。模型采用经典的优化器，初始学习率设置为，并采用每隔个学习率下降的策略进行训练，网络以连续个不下降作为停止训练的条件，给出模型在通用数据集上的临界值。在损失函数的设计中，设置为，设置为，以权衡载体音频与含密音频、秘密音频与重构音频之间的损失。透明性测试本节给出了音频透明性基本评价指标（含密音频信噪比）、（重构音频信噪比）以及（含密音频的均方误差）、（重构音频的均方误差）的计算如下：（）（）（），（）（）（）（），（）（）（），（）（）（），（）式中：（）和（）分别表示时域中的原始载体音频和含密音频，（）和（）分别表示时域中的原始秘密音频和重构

10、音频，（）和（）分别表示模型预测的含密音频与重构音频。表和表给出了本文模型在中、英文数据集上进行隐写实验后的透明性测试结果。在数据集下，含密音频的最低为?，信噪比最高可达；重构音频的最低为信号与信息处理?，信噪比最高可达。在数据集下，含密音频的最低为?，信噪比最高可达；重构音频的最低为?，信噪比最高可达。表数据集透明性分析训练轮数最优表数据集透明性分析训练轮数最优为了能够更加客观地评价音频的听觉质量，除了网络训练过程中的个基础指标外，还引入了客观语音质量评估（，）。是建议书中提供的客观语音质量感知评估方法，能将客观的语音质量评估映射到主观刻度范围，得分在，得分越高，音频质

11、量越好。表表明了不同语种的音频在通过本文模型进行隐藏后，含密音频的在以上，人耳主观不能发现异样；重构音频的在左右，可以清楚理解秘密信息的语义。表给出本文方案与一些研究结果的含密音频信噪比的比较结果，可以看出本文隐写模型生成的含密音频具有更好的透明性。表含密音频和重构音频测试样本含密音频重构音频中文样本中文样本英文样本英文样本表与其他隐写方案的信噪比对比单位：方案算法文献（传统算法）文献（传统算法）文献（传统算法）文献（神经网络）本文（神经网络）鲁棒性测试本节对模型抗干扰的能力进行测试。在训练过程中，样本分别添加了“”和“”两种噪声，定义为噪声系数，其计算如下：噪声能量信号能量。

12、（）表给出的鲁棒性分析结果表明在带噪环境下，模型隐写后的含密音频信噪比不会发生较大变化，重构出的秘密信息也和原来的效果无差，且高度可理解。实验说明本文提出的隐写方案具有良好的鲁棒性。表鲁棒性分析噪声类别数据集未加噪声信号与信息处理年无线电工程第卷第期续表噪声类别数据集嵌入容量嵌入容量表示在一定时间内可以嵌入的秘密信息比特数，用每秒比特数（）来衡量，计算如下：，（）式中：为含密音频时间长度，为嵌入到含密音频中总的秘密信息比特数。本文采取的隐写算法嵌入容量为，大小是传统隐写方法的倍左右。由此可以看出神经网络的训练使模型具有自适应嵌入秘密信息的能力，大大提升了隐写方案的嵌入容

13、量，弥补了传统隐写方法隐写容量小的缺陷。结束语本文提出了一种将注意力机制运用到深度神经网络的音频隐写方法，该方法利用深度学习优势实现了对音频的自适应编解码，在透明性、鲁棒性以及隐写容量这个指标中做到了较好的平衡。实验结果表明：该隐写方法相较于多种传统隐写术，含密音频信噪比提升，嵌入容量提高倍左右；相较于对比神经网络，生成的含密音频信噪比提高了左右。网络重构出的秘密信息值在左右，可以清楚理解重构的秘密信息的语义。模型具有较好的鲁棒性，在训练过程中分别引入为和的噪声，网络生成的含密音频质量几乎不受影响。?参考文献，（）：，：彭飞，刘亮，高勇变换域内利用的音频数字盲水印算法无线电工程，（

14、）：，：，：，：，：，：，：王俊杰，莫倩，梅东霞，等一种基于的鲁棒音频水印算法广西大学学报（自然科学版），（）：王璇，陈朝辉基于的时域音频水印改进算法的软件实现郑州轻工业学院学报（自然科学版），（）：吴秋玲变换域音频鲁棒数字水印技术研究南京：南京邮电大学，（）：信号与信息处理孙汉卿，李喜艳，王桂芝，等域的水印置乱新研究激光杂志，（）：，（）：，：，：，：，：（）：，：?，：，：，（）：，：，（）：，：作者简介李宗佑男，（），硕士研究生。主要研究方向：深度学习在隐蔽通信中的应用等。（通信作者）高勇男，（），博士，教授。主要研究方向：深度学习在通信信号处理中的应用、通信抗截获和通信抗干扰技术、语音信号处理、盲信号处理等。信号与信息处理

展开阅读全文