收藏 分销(赏)

面向语音分离的GA_FastICA算法_兰朝凤.pdf

上传人:自信****多点 文档编号:245253 上传时间:2023-05-06 格式:PDF 页数:8 大小:733.56KB
下载 相关 举报
面向语音分离的GA_FastICA算法_兰朝凤.pdf_第1页
第1页 / 共8页
面向语音分离的GA_FastICA算法_兰朝凤.pdf_第2页
第2页 / 共8页
面向语音分离的GA_FastICA算法_兰朝凤.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 27 卷第 6 期2022 年 12 月哈 尔 滨 理 工 大 学 学 报JOUNAL OF HABIN UNIVESITY OF SCIENCE AND TECHNOLOGYVol.27No.6Dec.2022面向语音分离的 GA_FastICA 算法兰朝凤,陈英淇,林小佳,刘岩,陈旭奇(哈尔滨理工大学 测控技术与通信工程学院,哈尔滨 150080)摘要:随着语音处理技术的发展,新的语音分离算法不断地被提出。针对观测信号中噪声而导致分离效果不理想的问题,将几何运算(GA)方法和快速独立成分分析(FastICA)算法结合提出了 GA_FastICA 算法。为探究 GA_FastICA 算法

2、的有效性,绘制了分离后语音信号的时域波形,给出了分离前后语音信号的相关系数。当信噪比为 4 dB 时,分离后语音信号与原始语音信号的相关系数为0.785 2。仿真实验结果表明,在信噪比为 12 dB,factory、babble 噪声条件下,GA_FastICA 算法相较于 FastICA 算法相关系数提高了0.021 2和0.030 4;信噪比为 8 dB 的条件下,相关系数提高了0.137 4和0.132 8。GA_FastICA 算法可有效分离语音信号,在噪声环境下具有较好的语音分离效果。关键词:语音处理;语音分离;独立成分分析;信噪比DOI:10 15938/j jhust 2022

3、06 010中图分类号:TN912.3文献标志码:A文章编号:10072683(2022)06008008GA_FastICA Algorithmfor Speech SeparationLAN Chao-feng,CHEN Ying-qi,LIN Xiao-jia,LIU Yan,CHEN Xu-qi(School of Measurement and Communications Engineering,Harbin University of Science and Technology,Harbin 150080,China)Abstract:With the development

4、of speech processing technology,new speech separation algorithms areconstantly proposed.The GA _ FastICA algorithm is proposed by combining the Geometric Approach(GA)algorithm and Fast Independent Component Analysis(FastICA)algorithm for the problem of unsatisfactoryseparation due to the noise in th

5、e observed signal and combining the geometric operation method.The time domainwaveforms of the separated speech signals are plotted,and the correlation coefficients of the original and separatedspeech signals are given to investigate the effectiveness of the GA algorithm.When the signal-to-noise rat

6、io is 4 dB,the correlation coefficient of the separated speech signal and the original speech signal is 0.785 2.The experimentalsimulation results show that under the signal-to-noise ratio of 12 dB,factory and babble noise conditions,the GA_FastICA algorithm improves the correlation coefficient by 0

7、.021 2 and 0.030 4 compared with the FastICAalgorithm,and the correlation coefficients were improved by 0.137 4 and 0.132 8 for a signal-to-noise ratio of8 dB.The GA_FastICA algorithm can effectively separate the speech signal,and the noisy environment GA_FastICA algorithm can effectively separate s

8、peech signals and has a better speech separation effect.Keywords:speech processing;speech separation;independent component analysis;signal to noise ratio收稿日期:2021 09 17基金项目:国家自然科学基金青年基金(11804068);黑龙江省自然科学基金(LH2020F033).作者简介:陈英淇(1998),男,硕士研究生;刘岩(1995),男,硕士.通信作者:兰朝凤(1981),女,博士,副教授,博士研究生导师,E-mail:lanch

9、aofeng .0引言随着智能家居设备的发展,通过音频信号控制智能设备变成了一种必然趋势,同时也对语音处理技术提出了更高要求1。为了更好的将语音处理技术应用到实际生活中,相关研究人员就语音分离技术、语音识别技术及语音降噪技术等进行了大量研究。语音分离问题最早起源于著名的鸡尾酒会问题2,就如何构建出类似于人脑听觉处理机制,进而从混合语音信号中分离出重点关注的语音部分,以对特定语音识别的目的进行了研究。根据观测信号和源信号数目的不同,可以分成单通道盲源分离算法和多通道盲源分离算法3 6。独立成分分析(Independent Component Analysis,ICA)是多通道分离中一种典型的算法

10、,最早在 20 世纪 80 年代被Jutten 等7 提出,并成功应用在盲源分离领域。此后,许多研究人员在 ICA 的基础上,对提高混合语音分离质量和降低算法计算复杂度等方面提出了一些改进算法8。1999 年,Hyvarinen 等9 提出 FastI-CA 算法,此算法提高了传统 ICA 算法的处理速度。Tahir Ahmad 等10 利用八阶牛顿算法对 FastICA 算法进行了改进,并将此应用到了语音信号分离中,研究表明改进算法具有迭代次数少、收敛速度快的优势。南开大学的朱立娟等11 提出将观测信号特征矩阵联合对角化的预处理的操作,得到初步分离的语音信号,并利用 FastICA 算法对初

11、步分离的语音信号进行处理,得到分离语音信号,研究表明所提出算法在保证分离质量的前提下,减少了算法计算量。非负矩阵分解算法(Non-negative Matrix Factoriza-tion,NMF)同样被广泛地应用在语音分离相关领域。其最早是由 DD.Lee 等12 提出的一种矩阵分解方式,基本思想是将混合矩阵在满足非负约束的限制下分解成两个矩阵乘积,并使其乘积尽可能的接近于混合矩阵13。NMF 算法分离过程简便,且分离结果解释性更强,相对于其它算法具有占用更小存储空间的优点14。典型的 NMF 算法有梯度投影算法和拟牛顿算法15 16。李煜等17 针对传统NMF 算法计算量大收敛速度慢的问

12、题,提出了一种基于投影梯度的 NMF 算法,通过增加相关约束条件减小了信号的重构误差,提高了算法的收敛速度和信号分离效果。刘忠健等18 针对基于乘性迭代NMF 算法收敛速度慢的问题,提出了一种非负矩阵分解的 NMF 算法,提高了 NMF 算法的收敛速度。卢宏等19 针对 NMF 算法在欠定盲源分离方面的限制,在 NMF 算法中增加行列式约束及稀疏性约束的限制条件,实现了 NMF 应用于欠定盲源目标的分离。王艳芳等20 将 NMF 和 FastICA 算法相互结合,利用 NMF 算法,通过观测信号幅度谱得到源混合信号的估计矩阵,而后利用 FastICA 算法实现源信号的分离,研究表明比传统 Fa

13、stICA 算法提高了算法的运行速度。在语音分离的过程中难免会混有噪声干扰,如何有效去除和抑制噪声是语音增强技术探究的目标,有学者对低信噪比(signal-to-noise ratio,SN)条件下,提高目标语音的可懂度和质量做出了研究。常用语音增强方法主要分为时域方法和频域方法。时域处理方式在语音分离过程中,难以在低SN 环境下做到对滤波器参数的准确预测,语音增强效果不理想;频域常用的算法有谱减法、维纳滤波、自适应滤波法等。其中,传统谱减法是当噪声信号与短时平稳语音信号相互独立时,利用混合语音功率谱和噪声语音功率谱做减法得到纯净语音功率谱,但在实际应用过程中,传统谱减法会在 SN 为0 dB

14、左右出现信号失真情况,但针对此问题可应用语音增强的几何运算(geometric approach,GA)方法21,重新构造出纯净功率谱和带噪功率谱间的增益函数,利用此增益函数求解纯净语音功率谱,弥补了传统谱减法信号失真的弊端。上述学者的研究使语音分离、语音增强技术取得了巨大的进步,但语音增强技术主要讨论的是在低 SN 环境下对噪声的抑制效果,没有考虑将目标语音信号进行分离,更加没有考虑分离多路有用语音信号情况。同样,语音分离问题也没有考虑到在观测信号中混有噪声时算法的适用性。本文针对上述研究内容存在的缺陷,考虑到人们运用语音分离技术控制智能设备时并不能保证周围环境完全安静的情况,基于 GA 算

15、法进行第一阶段降噪处理,将处理后信号利用 FastICA 算法进行音源分离,提出了GA-FastICA 算法,用于探讨含噪声情况下的语音分离问题,实验研究了不同 SN 环境下本文算法与FastICA 算法、基于二值掩蔽的语音信号分离算法(ideal binary mask,IBM)及四阶矩 盲 识 别 算 法(fourth-order blind identification,FOBI)的语音分离效果。1GA_FastICA 算法1.1FastICA 算法假定输入语音信号为 s(t),则观测信号 x(t)可18第 6 期兰朝凤等:面向语音分离的 GA_FastICA 算法表达为x(t)=As(

16、t)(1)式中:A 为 n n 矩阵(n 为通道数),称为语音信号混合矩阵,s(t)为 n 个元素构成的向量,可表达为s(t)=s1(t),s2(t),sn(t)T。观测信号可写为x(t)=x1(t),x2(t),xn(t)T。FastICA 算法实现的最终目标是找到解混矩阵W,使分解后的信号能够重新恢复出原始输入语音信号,满足如下关系:y(t)=Wx(t)=WAs(t)s(t)(2)式中:y(t)为恢复出来的原始语音信号,其可表达为:y(t)=y1(t),y2(t),yn(t)T。计算过程中,主要使解混矩阵 W 作用在观测信号 x(t)上,令得到结果 y(t)的非高斯性达到最大,达到接近原始

17、信号 s(t)的目的。利用负熵来衡量 y(t)的非高斯性,负熵越大,表示信号的非高斯性越强。负熵可表达为J(y)=E(G(y)E(G(v)2(3)其中:G 代表非线性函数;v 代表的是满足均值为 0、方差为 1 的高斯随机变量。若令 y(t)=WTz(t),z(t)代表的是观测信号经白化处理过的信号,则式(3)可表达为J(y)=E(G(WTz)E(G(v)2(4)通常,设定独立成分的方差为E(G(WTz)2)=1(5)则在此约束条件下,得到解混矩阵 W 的迭代公式,可表达为W(k)=E zG(W(k 1)Tz)E G(W(k 1)Tz)W(k 1)(6)式(6)在计算过程中,直到满足收敛条件,

18、迭代运算过程停止,此时可得到解混矩阵 W 的最优解。对 W 进行归一化处理,令 W 作用于式(2)即可得到还原后的原始语音信号,从而达到盲源分离目的。1.2GA_FastICA 算法在传统谱减法中假定噪声信号为 d(n),纯净的语音信号为 f(n),则带噪混合信号 h(n)可表达为h(n)=f(n)+d(n)(7)对 h(n)进行短时傅里叶变换,H(wk)代表h(n)经过短时傅里叶变换后得到的结果,可以表示为H(wk)=F(wk)+D(wk)(8)式中:F(wk)为 f(n)经过短时傅里叶变换后的频谱;D(wk)为 d(n)变换后的频谱。wk=2k/N,k 的取值范围是 k=1,2,3,N 1

19、,N 代表观测信号的帧长度。式(8)两端乘以 H*(wk),得到噪声语音的短时功率谱,在考虑到交叉项影响时,式(8)可以转换成下式:|H(wk)|2=|F(wk)|2+|D(wk)|2+H(wk)=|H(wk)|2+H(wk)(9)式中:H(wk)代表交叉项,在忽略交叉项条件时,会引入相对误差。相对误差的表示如式(10)所示:(k)=|H(wk)|2|H(wk)|2|H(wk)|2=|H(wk)|H(wk)|2(10)通过式(10)可以得到结论,交叉项误差通过语音噪声功率谱进行归一化,探究(k)随 SN 变化趋势为本文重点关注之处,该部分在 LU 等撰写论文中已经进行详细阐述22,相关结果如图

20、 1 所示。图 1(k)随 SN 变化示意图Fig.1Variation of(k)with SN通过图 1 可以得到结论,在 SN 为 0 dB 左右时,(k)达到最大值,并不接近于 0,所以交叉项不能被忽略,在利用传统谱减法进行信号处理时,出现信号失真现象。在假定满足交叉项为零条件下,则估计的纯净语音信号功率谱可表达为|F(wk)|2=|H(wk)|2|D(wk)|2(11)设 I(wk)代表增益函数,则式(11)可以表达为|F(wk)|2=I2(wk)|H(wk)|2(12)其中 I(wk)=(k)1)/(k)。并且,在该式中,(k)=|H(wk)|2/|D(wk)|2。式(12)在 S

21、N 为 0 dB 左右时,不满足谱减法交叉项为 0 的假设,所以通过式(12)的增益函数I2(wk)估算纯净语音功率谱时出现了信号失真情况,故有学者提出了 GA 方法对谱减法进行改进,其28哈尔滨理工大学学报第 27 卷通过几何计算的方式来重新构建出带噪语音功率谱和纯净语音功率谱间的增益函数,通过新的增益函数计算纯净语音功率谱,弥补了传统谱减法在 0 dB左右 交 叉 项 不 为 零 的 缺 陷,解 决 了 信 号 失 真问题23。由式(8)可以看出,混合信号在某个频率下的频谱由右侧两路信号频谱相加求得,如图 2 所示。这个过程同样可以在复平面中写成向量和的形式,式(8)的极坐标形式可以表达为

22、ahejh=afejf+adejd(13)式中:ah,af,ad分别对应于式(8)中的幅值,其在复平面中代表向量长度;h,f,d分别代表观测信号、纯净信号、噪声信号相位,在复平面中对应各路信号和实轴之间的夹角。传统谱减法基于交叉项为 0 的假设,也就是做出了 f d=/2 的假设,但 GA算法并不对二者相位差值做出任何假设。经过 GA 算法推导,新的增益函数 IGA可以表达为IGA=ahaf=(1 c2hd)/(1 c2fd)(14)其中:chd=cos(h d),cfd=cos(f d)。式(14)中,chd,cfd的计算需要依赖于信号间相位的差值,这在程序运行过程中并不能准确得到,所以 G

23、A 算法利用混合信号相位和噪声信号相位之间的显性关系,结合三角函数公式得到式(14)中参数的计算公式为chd=a2h+a2d a2f2ahad(15)cfd=a2h a2f a2d2afad(16)之后,利用 GA 算法计算得到的增益来计算纯净语音功率谱和混合语音功率谱之间的关系,计算过程如下式:|F(wk)|2=IGA|H(wk)|2(17)将式(17)得到纯净语音信号的功率谱,通过短时傅里叶逆变换可还原成原始语音信号。综上可知,GA 算法在语音增强方面较谱减法弥补了谱减法信号失真的缺陷,FastICA 算法可以完成适定盲源分离任务。因此,考虑到实际观测信号中可能混有噪声的情况,将两种算法结

24、合提出了GA-FastICA 算法。首先利用 GA 算法对混合信号进行降噪处理,然后将处理后的信号再运用 FastICA算法进行语音分离,近而获得分离后语音信号。图 2复平面混合语音信号频谱关系图Fig.2Spectral relationship of complex planemixed speech signal2仿真实验及结果分析2.1GA_FastICA 和 FastICA 算法分离效果研究为分析本文所提出 GA_FastICA 算法有效性,在带噪环境下对比了传统 FastICA 算法和提出算法分离结果。通过实验验证不同信噪比条件下,GA_FastICA 算法和 Fast_ICA 算

25、法分离效果。使用 TIM-IT 语音库作为实验样本,该数据库由麻省理工学院和斯坦福研究院合作构建。作为一个声学音素连续语音语料库,其在语音信号研究中被广泛使用,该语音库大约包含6 000个说话人语句,其中约 70%来自于男性,30%来自于女性,语音信号采样频率统一设置为 16 kHz。参与语音录制的说话人大约有 600人,分别来自于美国不同的 8 个方言地区,每个说话人给出 10 句话,语音库中的句子都在音素级别上进行了手动分割和标记。在 TIMIT 语音库中随机选取两路语音作为原始语音信号,原始信号经过线性混合后得到观测信号,随后在观测信号中引入不同信噪白噪声模拟现实环境观测信号中存在噪声干

26、扰现象。在实验中取信噪比(signal noise ratio,SN)为16 dB、12 dB、8 dB、4 dB 条件下进行实验研究,并通过分离结果计算分离后语音信号和原始语音信号间相关系数。本文中实验次数设置为 100 次,语音信号分离结果如图 3 所示。其中原始两路语音信号波形如图3(a)、图 3(b)所示;通过线性混合得到两路观测信号波形如图 3(c),图 3(d)所示。在 SN 为 12dB时,以第 1 路原始信号分离结果观察,传统 FastICA38第 6 期兰朝凤等:面向语音分离的 GA_FastICA 算法方法语音分离结果如图 3(e)所示,GA_FastICA 算法语音信号分

27、离结果如图 3(f)所示。图 3原始信号、观测信号及分离后信号的时域波形图Fig.3Time domain waveforms of the original signal,observed signal and separated signal根据图 3(e)与图 3(a)对比可知,通过 FastICA算法分离语音信号波形轮廓与原始语音信号相似,分离后信号对应峰值均被有效凸显,但分离后信号波形中全程都伴随着白噪声信号,并不能分离出干净原始语音信号,语音分离效果有待提高。通过图3(f)与图 3(a)对比可知,GA_FastICA 算法分离出来的语音信号与原始语音信号波形近乎相同。通过图 3(f

28、)与图 3(e)对比可知,图 3(f)信号波形轮廓与原始语音信号更加近似,图 3(e)分离后语音信号中混杂幅度值约为 0.1 的噪声干扰,通过分离结果证明了 GA_FastICA 算法对观测信号噪声起到抑制效果,被还原信号与原始信号更加近似。综上所述,GA_FastICA 算法可有效分离带噪语音信号,并具有较好信号分离效果。2.2GA-FastICA 与 FastICA、IBM、FOBI 算法的语音分离性能评价由 2.1 节可知,GA_FastICA 算法在白噪声干扰情况下相较于 FastICA 算法具有更好的语音分离性能,为进一步验证该算法的有效性,选择了基于二值掩蔽的语音信号分离算法(id

29、eal binary mask,IBM)、48哈尔滨理工大学学报第 27 卷四阶矩盲识别算法(fourth-order blind identification,FOBI)算法24 与本文 GA_FastICA 算法进行对比。IBM 算法的目标是计算出 1 个二值掩蔽,二值掩蔽通过计算不同频率下的 SN 来进行构建,使用时需要设置 1 个阈值,如果 SN 高于阈值则掩蔽对应位置为 1,低于阈值则为 0,本文通过 IBM 分离出两路语音信号,所以在分析其中一路信号时另外一路信号同样会被视为噪声干扰,本文中应用的第 1路语音信号的时频谱如图 4(a)所示,通过观测信号计算得到的二值掩码如图 4(b

30、)所示。将图 4 得到的二值掩蔽作用于混合语音信号时频谱,得到关注语音信号时频谱,通过短时傅里叶逆变换还原出原始语音信号。分离结果用语音相关系数进行界定,相关系数越接近于 1,证明分离后的语音信号和原始语音信号相似性越高,说明分离效果更好,相关系数用 表示,其计算过程为ij=|Ni=1yi(t)sj(t)|Ni=1y2i(t)Mi=1s2j(t)(18)式中:yi(t)表示分离后的语音信号;sj(t)表示原始的语音信号。为定量评价 GA-FastICA 算法和其他基础语音分离算法在语音分离效果上的差异,给出原始语音信号与分离后语音信号的相关系数,结果如表 1 所示。其中,两路原始语音信号记作

31、s1,s2,利用传统FastICA 算法分离后的信号记作 y1,y2,利用 IBM 算法分离后信号记做 e1,e2,利用 FOBI 算法分离后信号记做 f1,f2,利用 GA-FastICA 算法分离出来的语音信号记作 p1,p2。图 4IBM 算法分离语音信号图Fig.4IBM algorithm separates the speechsignal diagram表 1GA-FastICA 算法与基础语音分离算法相关系数()表Tab.1Table of correlation coefficients between GA-FastICA algorithm and basic speec

32、h separation algorithmSN原始信号分离信号y1y2e1e2f1f2p1p216 dB12 dB8 dB4 dBs10.895 40.028 70.895 00.037 20.894 80.014 20.898 20.025 8s20.008 20.902 40.015 60.895 20.023 60.894 60.007 60.909 4s10.854 60.013 20.852 40.049 60.841 80.047 80.879 60.017 3s20.095 40.868 40.042 60.854 70.057 40.849 60.012 40.882 8s1

33、0.112 30.710 90.710 20.124 60.696 70.136 40.846 80.086 1s20.713 00.122 00.127 20.708 60.135 20.698 00.018 50.856 9s10.417 20.528 00.537 40.375 60.485 60.507 40.785 20.006 3s20.604 50.180 40.621 40.565 80.643 20.486 40.019 20.735 9以下以第 1 路语音信号的分离效果为例进行讨论,由表 1 可知,当 SN 为 16 dB 时,4 种算法分离后语音信号与原始语音信号相关系数

34、都在 0.89 以上;当 SN 为 12 dB 时,GA_FastICA 算法相关系数58第 6 期兰朝凤等:面向语音分离的 GA_FastICA 算法为0.879 6,FastICA 算法的相关系数为0.854 6,IBM算法的相关系数为0.852 4,FOBI 算法的相关系数为0.841 8,GA_FastICA 较 FastICA、IBM、FOBI 算法相关系数分别提高了 0.025、0.027 2、0.037 8;当SN 为 8 dB 时,GA _ FastICA 算 法 相 关 系 数 为0.846 8,较 FastICA、IBM、FOBI 算法相关系数分别提高了0.135 9、0.

35、136 6、0.150 1;当 SN 为 4 dB时,FastICA 算法分离后的语音信号与第 1 路原始信号相关系数为0.417 2,与第 2 路原始语音信号的相关系数为0.604 5,相关系数都不接近于 0,表明分离出来的信号与原始的两路信号均具有相似性,FastI-CA 算法无法完成语音分离任务,IBM 和 FOBI 算法结果类似,同样无法完成语音分离任务。GA-FastI-CA 分离后的语音信号与第 1 路原始信号相关系数为0.785 2,与第 2 路原始语音信号相关系数为0.019 2,表明 GA-FastICA 算法依然具有较好的语音分离能力。且随 SN 减小,表 1 中提到算法语

36、音分离质量受噪声影响均呈现下降趋势,但 GA_FastI-CA 下降较慢,由此可见,GA-FastICA 算法在带噪语音中具有较好的分离效果。2.3不同噪声类型下的语音分离效果研究2.2 节实验结果证明在环境噪声为白噪声时,本文提出的 GA_FastICA 算法相对于原始 FastICA、IBM、FOBI 算法语音分离效果有所提高,抗噪性能较好。但是空间中噪声可能具有多样性,考虑到不同噪声类型影响,本文对多种环境噪声进行探究,将上文中白噪声替换为 Factory 噪声和 Babble 噪声,探究不同种类噪声对分离算法影响,分离结果同样用相关系数进行界定,实验结果如表 2 所示。表 2不同种类环

37、境噪声下语音分离效果Tab.2Speech separation effect under different kindsof ambient noiseSN分离算法White 噪声Factory 噪声Babble 噪声12 dB8 dB4 dBGA_FastICA0.879 60.876 40.867 8FastICA0.854 60.855 20.837 4GA_FastICA0.846 80.842 60.835 4FastICA0.710 90.705 20.701 6GA_FastICA0.785 20.781 40.778 6FastICA0.604 50.599 20.597 2

38、同样以第 1 路信号分离结果为例,在 12 dB 条件下,噪声信号类型为工厂噪声时,GA_FastICA 算法分离后信号相关系数为0.876 4,FastICA 算法相关系数为0.855 2,GA_FastICA 算法相较于原始算法相关系数提高了0.021 2。噪声类型为 Babble 噪声时,两种算法得到的结果分别为0.867 8和0.837 4,GA_FastICA 算法相较于原始算法相关系数提高了0.030 4;同理,在 8 dB 条件下,GA_FastICA 工厂噪声相关系数为0.842 6,FastICA 算法相关系数为0.705 2,GA_FastICA 算法相较于原始算法相关系数

39、提高了0.137 4,Babble 噪声条件下提高了0.132 8。在 4 dB 条件下,GA_FastICA 工厂噪声相关系数为0.781 4,FastICA 算法相关系数为0.599 2,GA_FastI-CA 算法相较于原始算法相关系数提高了0.182 2,噪声类型为 Babble 噪声条件下提高了0.181 4。通过上述实验结果表明本文提出算法在不同种类环境噪声影响下依然有效。3结论本文针对含噪情况下的语音分离问题,提出了一种 GA-FastICA 算法。研究表明,该算法可有效抑制分离过程中噪声的干扰。当 SN 为 16 dB 时,GA_FastICA、FastICA、IBM、FOBI

40、 算法语音分离后的语音相关系数均在0.89 以上,当 SN 为12 dB 及8 dB时,GA_FastICA 比 FastICA、IBM、FOBI 这些传统算法分离 后 的 语 音 相 关 系 数 分 别 提 高 了 0.025、0.027 2、0.037 8及0.135 9、0.136 6、0.150 1;当 SN为 4dB 时,传统算法已无法将语音信号成功分离,而 GA-FastICA 依然具有较好的分离效果,且相关系数为0.785 2。不同噪声环境下的实验测结果表明,当 SN 为12 dB、噪声类型为 Factory 及 Babble 噪声时,GA_FastICA 算法比 FastICA

41、 算法语音分离后的语音相关系数提高了0.021 2及0.030 4,在 8 dB 和4 dB条件下,GA_FastICA 分离后的语音相关系数同样高于 FastICA 算法。由此可见,本文提出 GA_Fas-tICA 算法在不同噪声环境下同样具有较好语音分离性能。参 考 文 献:1AKOU M,Al ADAIDEH K,SHADAIDEH A,et al MobileVoice ecognition Based for Smart Home Automation ControlJInternational Journal,2020,9(3):112 2CHEEY E C Some Experi

42、ments on the ecognition of Speechwith One and With Two EarsJ The Journal of the AcousticalSociety of America,1953,25(5):975 3LEE G W,KIM H K Multi-task Learning U-net for Single-chan-68哈尔滨理工大学学报第 27 卷nel Speech Enhancement and Mask-based Voice Activity DetectionJ Applied Sciences,2020,10(9):3230 4JI

43、N Y,TANG C,LIU Q,et al Multi-Head Self-Attention-BasedDeep Clustering for Single-Channel Speech SeparationJ IEEEAccess,2020,8:100013 5CHEN J J,MAO Q,QIN Y C,et al Latent Source-specificGenerative Factor Learning for Monaural Speech Separation UsingWeighted-factor Autoencoder(English)J Frontiers of I

44、nforma-tion Technology Electronic Engineering,2020,21(11):1639 6赵雨璞,吕虹,刘有军,等 通信侦察中盲源分离算法的分离性能研究J 电光与控制,2022,29(6):93ZHAO Yupu,LV Hong,LIU Youjun,et al Separation Perform-ance of Blind Source Separation Algorithms in Communication e-connaissanceJElectronics Optics Control,2022,29(6):93 7JUTTEN C Sour

45、ce Separation:From Dusk Till DawnC/In-ternational Workshop on Independent Component Analysis BlindSignal Separation Helsinki:Helsinki University of Technology,2000:15 8吕晓德,孙正豪,刘忠胜等 基于二阶统计量盲源分离算法的无源雷达同频干扰抑制研究J 电子与信息学报,2020,42(5):1288L Xiaode,SUN Zhenghao,LIU Zhongsheng,et al Study on theSuppression o

46、f Passive adar Homo-frequency Interference Basedon Second-order Statistical Blind Source Separation Algorithm J Journal of Electronics and Information Technology,2020,42(5):1288 9HYVAINEN A,CISTESCU,OJA E A Fast Algorithm forEstimating Overcomplete ICA Bases for Image WindowsC/Ijc-nn99 International

47、 Joint Conference on Neural Networks IEEEWashington,DC,USA,1999:894 10 AHMAD T,ALIAS N,GHANBAI M,et al Improved Fast ICAAlgorithm Using Eighth-Order Newton s MethodJ esearchJournal of Applied Science Engineering Technology,2013,6(10):1794 11 朱立娟,赵风海 一种改进的 FastICA 算法在语音信号盲源分离中的应用 J 电声技术,2019,43(5):64

48、ZHU Lijuan,ZHAO Fenghai An Improved FastICA Algorithm inthe Application of the Speech Signal Blind Source SeparationJ Audio Engineering,Lancet,2019,43(5):64 12 葛宛营,张天骐,范聪聪,等 噪声情况下采用稀疏非负矩阵分解与深度吸引子网络的人声分离算法J 声学学报,2021,46(1):55GE Wanying,ZHANG Tianqi,FAN Congcong,et al MonauralNoisy Speech Sparation Co

49、mbining Sparse Non-negative MatrixFactorization and Deep Attractor NetworkJActa Acustica,2021,46(1):55 13 LEPLAT V,GILLIS N,ANG A M S Blind Audio Source Separa-tion with Minimum-volume Beta-divergence NMFJ IEEETransactions on Signal Processing,2020,68:3400 14 SEKIGUCHI K,BANDO Y,NUGAHA A A,et al Fas

50、t Multi-channel Nonnegative Matrix Factorization with Directivity-awareJointly-diagonalizable Spatial Covariance Matrices for Blind SourceSeparation J IEEE/ACM Transactions on Audio,Speech,andLanguage Processing,2020,28:2610 15 LIN C Projected Gradient Methods for Nonnegative Matrix Factor-izationJ

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服