1、现代电子技术Modern Electronics Technique2023年12月1日第46卷第23期Dec.2023Vol.46 No.230 引 言随着互联网技术与多媒体技术的飞速发展与普及,致使以音频、图像、视频等为主要内容的多种类型作品创作、存储与传播变得极为便利。尤其是音频领域,多种编辑软件兴起与应用,数字音频已经成为现今多媒体的主要表现形式之一,受到了社会大众的广泛关注。但是,由于数字音频制作、传播过程中受多种因素的影响,使得数字音频中存在着大量的噪声信号,不但会降低音频信号的信噪比,还会影响音频信号的清晰度,为其应用与传播带来了较大的阻碍。如何构建一个有效的数字音频降噪模型已经
2、成为音频领域亟待解决的难题之一。就现有研究成果来看,使用较为广泛的降噪算法为一种基于小波阈值的变步长 LMS 语音降噪算法1与启发式联合 PCD 快速降噪算法2。前者主要应用小波软阈值分析语音信号的时频,将具有噪声特征的小波系数进行剔除,通过变步长最小均方误差算法对语音信号进行进一步的降噪处理,从而实现语音信号的降噪处理;后者将音频信号转化为信号矩阵,利用 JointPCD 与超完备字典同多轨道数字音频自适应变阶谱降噪模型构建文雅洁,陈 娟(中北大学,山西 太原 030051)摘 要:文中提出多轨道数字音频自适应变阶谱降噪模型构建,采用一阶高通数字滤波器预加重处理多轨道数字音频信号,以此为基础
3、,通过最大熵谱估计算法估计数字音频信号频谱,搭建自适应变阶谱降噪模型,确定谱减阶数的自适应取值规则。将待处理的多轨道数字音频频谱估计结果输入至训练好的降噪模型中,输出结果经过逆变换即为降噪完成后的多轨道数字音频,从而实现了多轨道数字音频的自适应变阶谱降噪。实验数据显示:构建模型应用后,可以有效去除音频噪声信号,并不会缺失音频有效信息,降噪后多轨道数字音频信噪比最大值为91.25 dB,充分证实了构建模型降噪效果更佳。关键词:自适应变阶谱;阈值选取;降噪模型;多轨道数字音频;频谱分析;自适应谱估计中图分类号:TN911.434;TP183 文献标识码:A 文章编号:1004373X(2023)2
4、3005504Construction of adaptive variable order spectrum noise reduction model for multitrack digital audioWEN Yajie,CHEN Juan(North University of China,Taiyuan 030051,China)Abstract:An adaptive variable order spectrum noise reduction model for multitrack digital audio is proposed.A firstorder highpa
5、ss digital filter for pre emphasis processing of multitrack digital audio signals is adopted.On this basis,the maximum entropy spectral estimation algorithm is used to estimate the spectrum of the digital audio signal,an adaptive variable order spectrum noise reduction model is established,the adapt
6、ive value rules for the spectrum reduction order is determined,and the estimated results of the multitrack digital audio spectrum to be processed are input into the trained denoising model.The output result,after inverse transformation,will be the multitrack digital audio when noise reduction is ful
7、filled,which achieves adaptive variable order spectrum noise reduction for multitrack digital audio.The experimental data shows that the audio noise signals can be effectively removed without missing effective audio information after the application of the constructed model.The maximum value of mult
8、i track digital audio signal to noise ratio(SNR)after noise reduction is 91.25 dB,which fully demonstrates that the constructed model has a better effect of noise reduction.Keywords:adaptive variable order spectrum;threshold value selection;noise reduction model;multitrack digital audio;spectrum ana
9、lysis;adaptive spectral estimationDOI:10.16652/j.issn.1004373x.2023.23.010引用格式:文雅洁,陈娟.多轨道数字音频自适应变阶谱降噪模型构建J.现代电子技术,2023,46(23):5558.收稿日期:20230426 修回日期:202305225555现代电子技术2023年第46卷时对信号矩阵进行降噪处理,获得信噪比较高的音频信号。上述两种算法虽然能够实现音频信号的降噪处理,但是前者运行时间过长,后者降噪效果较差,无法满足数字音频领域的发展需求,故本文提出多轨道数字音频自适应变阶谱降噪模型构建。1 数字音频自适应变阶谱降噪
10、模型研究1.1 预加重多轨道数字音频信号频谱估计预加重处理后多轨道数字音频信号yi呈现非平稳特性,说明音频信号参数指标存在着一定的随机性,故采用最大熵谱估计算法估计数字音频信号频谱,为研究目标实现提供支撑。一般情况下,随机序列M阶自回归模型当前值可以用M个过去值进行估计表示3。依据上述理论,数字音频信号yi可以表示为:yi=-m=1MAM,myi-m+Ei(1)式中:AM,m表示自回归模型系数;yi-m表示数字音频信号过去值;Ei表示白噪声估计误差46。需要注意的是,为了研究便利,将其均值设置为零。从本质角度出发可知,最大熵谱估计算法就是在特定背景下推出一系列序列7。因此,其等价于自回归模型,
11、可以通过求解自回归模型的参数来估计数字音频信号频谱8。依据功率谱定义对式(1)进行频谱模平方运算,计算结果为:|AM,m()f2|yi()f2=|Ei()f2(2)式中:AM,m()f表示自回归模型系数的频谱;yi()f表示数字音频信号的频谱;Ei()f表示白噪声的频谱。根据公式(2)即可推导出数字音频信号频谱的表达式为:Syi()f=|yi()f2=|Ei()f2|AM,m()f2 =PM|1+AM,1e-i2f+AM,Me-i2Mf2(3)式中Syi()f表示数字音频信号频谱。通过公式(3)可知,只要求解出自回归模型系数AM,m即可估计出数字音频信号频谱910。因此,此节利用最大熵估计算法
12、对AM,m进行求解与计算。设置自相关序列为Ryy()0,Ryy()1,Ryy()2,Ryy()M,其是已知的,则自回归模型系数AM,m求解矩阵表达式为:Ryy()0Ryy()1Ryy()M-1Ryy()1Ryy()0Ryy()M-2Ryy()M-1Ryy()M-2Ryy()0AM,1AM,2AM,M=-Ryy()1Ryy()2Ryy()M(4)求解公式(4)即可获得自回归模型系数,表达式为:AM,m=AM-1,m+MAM-1,M-m(5)式中:M表示偏相关系数,主要以白噪声频谱PM为核心进行计算,计算公式为M=1-PMPM-1。将公式(5)的计算结果AM,m代入公式(3)中,即可获得数字音频信
13、号频谱的估计结果Syi()f,为后续降噪模型搭建提供依据。1.2 多轨道数字音频自适应变阶谱降噪实现以上述数字音频信号频谱估计结果Syi()f为基础,搭建自适应变阶谱降噪模型,确定谱减阶数的自适应取值规则,将待处理的多轨道数字音频输入至训练好的降噪模型中,输出结果为降噪完成后的多轨道数字音频,为数字音频的传播与应用提供助力。自适应变阶谱降噪模型表达式为:|Syi()f=p()f|Syi()f-q()f|Ei()f(6)式中:Syi()f表示降噪后音频信号频谱估计结果11;表示谱减阶数;p()f与q()f表示谱减系数。由公式(6)可以看出,自适应变阶谱降噪模型的性能优劣由谱减系数与谱减阶数决定。
14、其中,谱减系数最佳取值计算公式为:q()f=()f1+()f()1-()f-/2(7)式中()f表示通过直接判决法估计的先验信噪比。在实际情况下,为了避免数字音频出现失真现象,通常会对其增益函数设定一个最低限值。若是最低限值过小,在降噪过程中极易产生失真现象,使得数字音频失效1213。而谱减阶数与增益函数之间存在着紧密的联系,当谱减阶数较大时,增益函数数值较大,此时降噪效果较差;反之,当谱减阶数较小时,增益函数数值较小,此时降噪效果较好。根据上述阐述内容,确定谱减阶数的自适应取值规则,具体如下:56第23期 =1+e-()f-1()f=10 lg()|yi()f-|Ei()f2|Ei()f2(
15、8)式中:与表示谱减阶数自适应取值计算的辅助常数,需要根据数字音频信号实际情况进行相应的设置;()f表示数字音频信号增益函数。除此之外,为了防止谱减阶数过小,而导致数字音频信号增益函数()f过小,进而造成数字音频失真现象的发生,需要保证谱减阶数大于最低限值 0.1。将公式(7)与公式(8)计算的谱减系数与谱减阶数代入公式(6)中,即可获得降噪后的数字音频信号频谱估计结果Syi()f,通过逆变换将其重构为数字音频信号,表达式为:xi=Syi()fo e-(9)式中:xi表示降噪处理后的数字音频信号;Syi()f表示数字音频信号逆变换函数;o表示逆变换因子,取值范围为0,1.2。综上所述,实现了多
16、轨道数字音频自适应变阶谱的降噪,为多轨道数字音频的应用与后续发展提供了一定的帮助。2 实验与结果分析2.1 实验准备阶段构建模型在降噪多轨道数字音频信号重构过程中应用了逆变换因子o,其取值大小直接关系着音频信号重构质量的优劣。因此,在实验准备阶段需要对其最佳取值进行相应的确定。通过测试获得逆变换因子o与音频信号重构质量(采用误差来表示)之间的关系,如图 1所示。图1 逆变换因子与音频信号重构质量关系示意图如图 1数据所示,当逆变换因子取值为0.6时,音频信号重构误差达到最小值 4%。因此,确定逆变换因子o最佳取值为0.6。2.2 实验结果分析以上述确定的逆变换因子最佳取值为基础,应用对比模型
17、1、对比模型 2 与构建模型进行多轨道数字音频降噪对比实验,获得多轨道数字音频信号降噪结果如图2所示。图2 多轨道数字音频信号降噪结果示意图如图 2所示,相较于原始多轨道数字音频信号,构建模型、对比模型1与对比模型2应用后,均可以降低多轨道数字音频信号中的噪声信号占比,达到多轨道数字音频信号降噪的效果。但是,构建模型应用后获得的多轨道数字音频信号降噪结果是完整的,无丢失音频信号文雅洁,等:多轨道数字音频自适应变阶谱降噪模型构建57现代电子技术2023年第46卷现象,而对比模型 1与对比模型 2应用后获得的多轨道数字音频信号降噪结果是缺失的,均存在部分音频信号丢失现象,破坏了音频信号的完整性,表
18、明构建模型多轨道数字音频降噪效果更好。3 结 语多媒体技术的飞速发展与广泛应用,使得多轨道数字音频呈现急速增加的趋势,但是由于数字音频录制、传播设备较丰富,使得数字音频中包含着大量的噪声,影响数字音频有效信号的传播与应用,故本文提出多轨道数字音频自适应变阶谱降噪模型构建。实验数据显示,构建模型提升了多轨道数字音频降噪的性能,能为数字音频的后续应用提供更有效的方法支撑。参考文献1 刘庆强,郑长敏,何红凯,等.一种基于小波阈值的变步长LMS语音降噪算法J.吉林大学学报(理学版),2022,60(4):943949.2 何选森,徐丽,许莹.启发式联合PCD快速降噪算法J.电子科技大学学报,2021,
19、50(3):360367.3 何选森,徐丽,樊跃平.PCD 算法对音频信号降噪的参数选择J.西安理工大学学报,2021,37(2):215221.4 徐浩森,姜囡,齐志坤.基于注意力机制的卷积循环网络语音降噪J.科学技术与工程,2022,22(5):19501957.5 李伟光,兰钦泓,马贤武.基于峭度原则的VMDSVD微型电机声音信号降噪方法J.中国测试,2023,49(1):111118.6 熊新中,万生鹏,刘恒,等.直线型Sagnac光纤语音传感器及语音降噪的研究J.激光与光电子学进展,2021,58(11):100106.7 曾庆宁,王师琦.扩散噪声下协方差矩阵重构的语音分离与降噪J.
20、声学学报,2021,46(5):775784.8 徐信芯,姜鑫,张辉,等.基于多层联合降噪的信号处理方法J.科学技术与工程,2021,21(29):1256612573.9 张俊翔,赵玲峰,范杰成.半导体激光器的音频信号处理系统设计J.激光杂志,2021,42(6):193197.10 吴礼福,吕长明,陈晶晶,等.一种多通道低时延同步音频信号采集分析系统J.现代电子技术,2021,44(19):4348.11 张皓然,万书芹,蒋颖丹,等.基于 FPGA 的多通道音频信号评估系统J.电子技术应用,2022,48(2):7883.12 赵清颖,殷福亮,陈喆.基于子带处理与 Volterra自适应滤波的广播音频信号相似性检测方法J.信号处理,2021,37(10):19411951.13 樊翔宇,张聪,杨柳.融合梅尔谱和循环残差的小样本音频分类模型J.计算机仿真,2022,39(2):195202.作者简介:文雅洁(1995),女,回族,山西太原人,研究生在读,研究方向为数字信号处理。陈 娟(1982),女,山西太原人,硕士研究生,副教授,研究方向为数字信号处理。58