资源描述
C o m p u r E n g i n e e r i n g a n dA p p l i c a t i o n s 计算机工程与应用 一种听觉掩蔽效应和维纳滤波的语音增强算法 李 宁,蒋建 中,郭军利 LI Ni ng,J I ANG J i a n z h o ng,GUO J un l i 解放军信 息工程大学,郑 州 4 5 0 0 0 2 PLA I n f or m a t i o n En gi ne e r i ng Un i v e r s i t y,Zhe ng z ho u 45 00 02,Chi n a LI Ni ng J I ANG Ji a nz hong GUO Junl i Spe e c h e nha nc e m e nt a l g or i t hm ba s e d on audi t o r y m a s ki n g e f f e c t and W i e ne r 脚 一 t e r Co mp u t e r En g i n e e r i n g a n d Ap p l i c a t i o n s 2 0 1 1,4 7(2 9):1 6 1 1 6 3 Abs t r a c t:Th e no n s t a t i o na r y no i s e e s t i m a t i o n a l go r i t h m a nd t h e no i s e ma s ki ng pr o ba bi l i t y whi c h i s b as e d on a ud i t or y ma s k i n g a r e u s e d i n t h e W i e n e r fil t e r s p e e c h e n h a n c e me n t a l g o r i t h m Th i s p a p e r p r o p o s e s a m e t h o d b a s e d o n a u d i t o r y ma s k i n g e f-f e c t a n d t h e Wi e n e r fi l t e r s p e e c h e n h a n c e me n t a l g o r i t h m O b j e c t i v e me a s u r e d e mo n s t r a t e s t h a t t h e p r o p o s e d me t h o d n o t o n l y e nh a nc e s t he S NR b ut a l s o r e d uc e s t h e voi c e di s t o r t i on s i gn i fic a nt l y K e y wo r d s:s p e e c h e n h a n c e me n t;n o n s t a t i o n a ry n o i s e e s t i m a t i o n;a u d it o r y ma s k i n g e f f e c t;m a s k i n g p r o b a b i l i t y;W i e n e r fil t e r 摘要:将非平稳噪声估计算法以及基于听觉掩蔽效应得到的噪声被掩蔽概率应用于维纳滤波语音增强中,提 出了一种听觉掩 蔽效应和维纳滤波的语音增强方法。几种噪声背景下对语音增强的客观测试表明,提 出的算法相比较于传统的维纳滤波语音增 强算法而言不但可以提 高语音信噪比,而且可以明显减少语音失真。关键词:语音增强;非平稳噪声估计;听觉掩蔽效应;被掩蔽概率;维纳滤波 DO I:1 0 3 7 7 8 j i s s n 1 0 0 2 8 3 3 1 2 0 1 1 2 9 0 4 6 文章编 号:1 0 0 2 8 3 3 1(2 0 1 1)2 9 0 1 6 1 0 3 文献标识码:A 中网分类号:T P 3 l 1 l 引言 语音增强就是运用某种算法来降低受到噪声干扰而失真 的语音信号,提高其信号质量。对于长期受到噪声困扰的人 们来说,例如长期在噪声工厂上班的工人、在坦克、潜艇等工 作人员等,好的语音增强算法可以明显地降低他们的疲劳度,提高他们的工作效率。语音增强算法可以明显地去除噪声,因此也可以称作语音去噪。一般来说,语音和噪声在单通道 的情况最为普遍,也最难解决。因为很多语音增强系统需要 实时性处理,因此算法的复杂度和实时性是需要考虑的重点。维纳滤波语音增强算法一直是语音增强的主要算法之 一,相比较谱减法而言,它增强后的语音信号是通过最小均方 误差优化而来的,并且算法的复杂度比较低,适合于实时的语 音增强系统中。长期以来一直受到人们的重视。但是传统的 维纳滤波一般会产生比较严重的“音乐噪声”,文献 2 6】分别 用维纳型滤波的不同改进方式抑制残留“音乐噪声”一定程度 上都取得了一些效果,但是依然没有在抑制背景噪声和减小 语音失真之间取得很好的折中。其中T s o u k a l a s 提出了一种基 于听觉掩蔽效应和维纳型函数语音增强算法来抑制“音乐噪 声”。,但是发现由于过度强调背景噪声的滤除,造成语音信 号极大失真,而且该算法噪声适用于平稳噪声情况下,在非平 稳噪声环境下,该算法将失效。本文在此算法的基础上进行 了改进,首先将非平稳噪声估计算法引入其 中,然后基于听觉 掩蔽效应,将噪声被掩蔽概率应用于算法中,仿真表明,本文 的算法在性能上有较大提高,明显减小了语音失真。2 维纳滤波语音增强算法 由于语音信号是长时非平稳、短时平稳的典型信号,因此处 理时一般选择加窗短时傅里叶变换,文中选取的窗为汉明窗,窗 长为2 0 ms,各相邻帧之间有半数样点重叠。加窗分帧后的语 音信号可以认为是平稳的,从而可以对每一帧进行维纳滤波。设()为带噪语音,(n)为噪声,()为纯净语音,r(co)、D(CO)、()分别是y(n)、d(n)和(n)的傅里叶变换。则维纳 滤 波 器 的 传 递 函 数 为)l x x 1 O g k),其 中 P (co )、P t)分别为纯净语音和噪声的功率谱,P (co )不 能直接得到,只能通过粗估计得到,P (c o )也是通过噪声估 计算法得到,该方法得到的增强语音残留的“音乐噪声”现象 严重。T s o u k a l a s 将听觉掩蔽门限和维纳型函数引入语音增强 中来抑制“音乐噪声”,它的算法主要步骤如下:(1)对带噪语音分帧加窗后进行傅里叶变换,得到带噪语 音功率谱 P ,),并且保存其相位。(2)假设前六帧信号为噪声信号,以此进行平稳噪声估计 然后进行谱减得到纯净晤音能量谱的一个粗估计 户 (c o )。(3)利用上一步得到的 户 (co )计算出初步听觉掩蔽门限(f),其中 1 i B,B=1 8。当语音最高频率为4 0 0 0 H z 时。该听觉掩蔽门限的计算方法是利用 J o h n s t o n 模型计算得到。将()代入公式 n(,一”一、2 ,)(f 1:D 川()+三 (1)一 (f)作者简介:李宁(1 9 8 4 一),硕士,主要研究方向为语音信号处理;蒋建中(1 9 6 4 一),副教授,硕士生导师;郭军利(1 9 7 4 一),副教授。E-m a i l:1 9 1 3 3 3 1 4 3 q q c o m 收稿 日期:2 0 1 0-0 6 0 1;修回 日期:2 0 1 0 0 8 0 1 1 6 2 2 0 1 1 4 7(2 9)C o m p u t e r E n g i n e e r i n ga n d A p p l i c a t i o n s 算机工程与应用 运行迭代算法 户 (”(f)蒜户 (”“)(2)得到对听觉掩蔽门限 r(f)更好的估计,其中,=3 为最有效的 迭代次数。(4)根据公式 户 c =器P c s 和=(Db(州)“l )(4)并且利用第三步得到的()对带噪语音功率谱 J D (u )进行修 正,其 中 v(i)=1。(5)计算第四步得到的语音幅度谱估计的反傅里叶变换,并用第一步保存的相位得到增强后的语音。以上算法主要存在以下两个问题:(1)由于它认为噪声是 平稳噪声,认为所有的噪声估计可以通过前六帧的简单估计 得到,导致谱减后得到的听觉掩蔽门限误差比较大。(2)在进 行维纳型函数滤除背景噪声时只是一味地修正听觉掩蔽门 限,导致语音信号失真严重,尤其是信噪比比较低时导致该算 法失效。详见该算法与本文算法的仿真对比。3 听觉掩蔽效应和改进型维纳滤波的语音增强算法 针对以上存在的两个问题,本文首先采用文献【7 付 苗 述的 非平稳噪声估计算法,该算法无需进行语音端点检测并且计 算量较小,适合非平稳噪声下的噪声估计算法。此外将噪声 被掩蔽概率引入本文算法中,从而减小T s o u k a l a s 提出的算法 的失真。语音增强的 目的是将所有噪声谱分量抑制于听觉掩 蔽门限之下,使之不可闻,同时减小语音的失真量,提高语音 的听觉质量。当然同时达到以上两点,这几乎是不可能的,更 多的是在抑制噪声和减小语音失真度之 日 J 寻求一种折 中。对 于信噪比比较低的语音信号来说,不能一味地抑制噪声,这样 会使语音造成极大失真,导致传递的语音信息丧失。因此保 留一些被掩蔽的噪声,可以明显减小语音失真度。设()为带噪语音,(,2)为噪声,x(n)为纯净语音,y(n)=X(,?)+()。用语音增强算法对()进行处理,要求在y(n)中 尽可能恢复(n)。本文在维纳滤波语音算法的基础上提出一 种基于听觉掩蔽效应和改进型维纳滤波的语音增强算法,具 体结构框图如图 1。图 1 听觉 掩蔽 效应和改进型维 纳滤 波的语音增强 算法流程 图 实现步骤如下:(1)对带噪语音分帧加窗并计算短时傅里叶变换,得到带 噪语音的幅度潜和相位谱,保存相位潜。(2)利用带噪语音的短时谱估计得到噪声估计参数。(3)利用估计的噪声参数和谱减法粗估计语音的短时谱,此处应 防止 过减的 出现。(4)粗估计听觉掩蔽门限。(5)根据噪声估计参数和第四步的听觉掩蔽门限计算噪 声被掩 蔽概 率。(6)根据噪声估计参数和第五步的噪声被掩蔽概率,利用 维纳滤波进行噪声的滤除得到浯音的更近似估计。(7)利用第六步的语音近似估计再次进行听觉掩蔽门限 的估计,并重新计算噪声被掩蔽概率,然后重新进行维纳滤 波,如此迭代数次得到语音幅度谱的精确估计。(8)利用第一步得到的相位谱和第七步得到的幅度谱进 行傅里叶反变换后重叠相加得到增强后的语音信号。下面将重点阐述一下有关参数的具体计算过程。3 1 非平稳噪声估 汁算法 该算法是利用估计的后验信噪比作为门限。当前的后验 信噪比比设定的门限小时,表明语音不存在,此时更新噪声 谱,反之,表明语音存在,噪声谱更新停止。如果 舭 时 0 一 l,(A,k)=a b d(一1,k)+(1 一 a Y(2,七)l(5)否则(,:b d(一1,k)(6)其 中 Y(2,k)表示带噪语音第 帧的第 k 频点处的幅度谱,(,k)表示噪声的第川贞的第 k 频点处的幅度谱,代表平滑 因子,代表后验信噪比的门限。文中参数 d=0 8 5,=1 5。3 2 噪声被掩蔽概率的汁算 计算完噪声估计后需要进行谱减法进行语音潜的粗估计,为了避免失真,这里不进行过相减,墨 (,k)=m a x (,k)一 D(,尼),s,其 中 (,k)表示带噪浯音第 川贞的第 k频点处 的功率谱,(,i)表示纯净语音在第 川贞的第 k频点处的功 率谱的估计,(,k)表示噪声在第 帧的第 k 频点处的功率 谱的估计,s是一个非常小的正数,文中取 O 0 0 1。然后利用 J o h n s t o n 模型计算听觉掩蔽门限(,k)。为了在加强噪声抑制和减少语音的失真之间取得一个比 较好的折中,考虑建立一个双侧假设模型,其中 表示噪声 被浯音信号掩蔽,H,表示噪声未被语音信号掩蔽。在 Hn 的 情况下,噪声被语音信号掩蔽,此时可以直接将带噪语音的功 率谱(,k)直接作为增强语音的功率谱估计输出,这样可以 有效地减小语音失真。即 f ,(,Ho】=(,2,k)(7)在 H。情况下,噪声未被语音信号掩蔽,此时用维纳滤波 语音增强算法进行噪声滤除,相比较谱减法而言,可以进行最 小均方意义上的优化,相比较于其他传统语音增强算法计算 量又比较小,有利于实时性处理的要求。,后):墨 :f R 1(,后)+D(,k)其中 H(2,k)表示语音信号在第 川贞的第 k频点处的维纳滤 波的增益。所 以 李宁,蒋建中,郭军利:一种听觉掩蔽效应和维纳滤波的语音增强算法 2 0 1 1,4 7(2 9)1 6 3 研(,(,七),H1 =(,七)(,k)(9)噪声的掩蔽概率是噪声和掩蔽门限的函数,对每一个语音 潜分量的估计均使用噪声掩蔽概率对以上两种情况加权得到(A,k)=E【(,(,七),H 0 【H o I T(2,),(A,足)】+(,(,),Hl】【。i(,七),(,后)】(1 0)其中 p H l(,七),(,七)】表示噪声处于 条件下,已知噪 声功率谱和听觉掩蔽门限时的掩蔽概率,设,尼):p【Ho p T(2,),x(五,七)】:1 一 p H 1 T(2,七),x(,七)(1 1)!J!f】根据公式(7)(1 1)得到语音功率谱的优化估计(,k)=,k)+1 一 p O t,七)H(2,七)J (,七):G(2,七)(,庀)(1 2)其中 G(2,):,)+1 一 ,)r H(,)(1 3)这一优化估计既考虑了传统维纳滤波语音增强算法的优 点,也将听觉掩蔽效应考虑在内,有效地减小了语音失真。没噪声满足均值为 0,方差为(,k)的复高斯分布,由文 献 1 0 可知 p(2,k)=I-e x p(一 )其中听觉掩蔽门限 T(2,k)和噪声方差(,k)分别估计得到。经过优化后得到的语音增强功率谱重新计算听觉掩蔽门 限(五,k)后得到 (,k),H(2,k)仍 由公式(8)得到,由 (,k)和 H(,k)得到 G u)(,k),因此:(_,七)=G ”,)(且,七)(1 5)其中 为迭代次数,经过实验沦证(从计算量和滤除效果衡量 得到的结果),=6最合适。4 实验仿真分析 仿真 中纯净语音信号来 自NO I Z E US数据库时长 2 2 4 S,采样频率为8 0 0 0 Hz,噪声信号分别选用来自No i s e x 9 2 数据库的 白噪声、粉噪声和HF 噪声。测 5 d B、0 d B和 一5 d B三种情况。帧长度为 1 6 0(2 0ms),采用汉明窗,帧间重叠 5 0。为了方便 将T s o u k a l a s 提出的算法称为方法一,本文算法称为方法二。客观评价常用整体信噪比(S NR)、分段信噪比(S e g S NR)和对数倒谱距离(L CD),公式如下:(胛)S N R=1 0 l o g 1 0 _)(1 6)()一 式中(为纯净语音信号,;()为增强后的语音信号,M为一 帧的点频数 S 2()一 7 式中()为纯净语音信号,()为增强后的语音信号。M为 帧数,为每一帧的点频数。(c,0 J n【1l0u)J2 c (k)-c )】2 (1 8)其中 C x(幻表示参考信号倒谱系数,C A(七)表示增强信号倒谱系 数,P为语音线性预测模型的阶数。(c,C )越小表明增强 语音的失真越小,质量越好。由于本文算法保留了被掩蔽的部分噪声所以分段信噪比 未能提高,因此客观上只讨论整体信噪比和对数倒谱距离。表 1 两种算法的整体信噪 比改 善比较表 输 入B 磊 5 5 5 7 6 3 0 5 5 5 5 9 5 4 0 4 5 3 3 0 6 41 8 5 5 4 7 6 8 0 3 4 0 7 7 5 4 5 5 7 1 0 5 2 6 51 9 3 2 6 7 6 9 48 辰 2 婀种 饽法的对数倒 谱距离比较表,2,S N R a B 丽=-H F I1 5 2 1 7 8 2 05 6 2 1 5 0 l 8 98 1 9 72 0 1 53 5 0 2 1 9 8 2 1 49 2 1 90 1 973 2 1 3 4 6 l 7 29 5 2 2 4 5 1 9 9 6 2 2 3 8 2 0 5 l 2 2 2 8 0 l 8 5 4 从上述两个表中可以得出结论算法二在整体信噪比和对 数倒谱距离上要明显优于算法一。从图2 可以看出算法一在低信噪比的非平稳噪声下(一5 d B 粉噪声)几乎失效,主观听辨后也感觉失真过大,已基本听不 出信息。趔 望 迥 馨 0 趔O 馨一0 0 采样点数 1 0 网 2 带噪语音(一5 d B粉噪声)、疗法 和 方法 二时域 结果比较图 从图3 可以看出尽管本文算法有一些背景噪声残留(被掩 蔽的噪声),但是相比较于算法一保留了很多语音分量,主观 听辨后效果也明显好于算法一。分 _ 0 l 0 1 5 2 0 1 mD s s 2 5 1 0 1 5 2 0 2 5 T e mp s s 0 0 5 1 0 1 5 2 0 2 5 Te m p s s 图3 带 噪语音(0 d B白噪 声)、方法一和 方法 二频域结 果比较 图(下转 2 4 8 页)2 4 8 2 0 1 1,4 7(2 9)C o m p u t e r E n g i n e e r i n g a n d A p p l i c a t i o n s 计算机工程与应用 双向搜索规划出的路径耗时比单向搜索规划出的路径长 4 9 4 4,程序运行时间节省了2 9 0 3 8。实际应用中可根据不 同的情况,不同的要求选择某一种规划方式。当要规划的路 径很长,或时间精度要求不严格时,可选择双向方式。反之,则采用单向方式。在算法中选择下一个要走的栅格时可加入各种地形因素 的判断,如图3。图3 考虑 水系的影响 另外,根据代价函数的设计原理,可实现任意一条路径的 路程与耗时的测量。如图4,为鼠标拖动得到的一条路径,测 得其路程为3 6 6 8 8 公里,耗时 1 9 3 1 5 小时。图 4 任意路 径的测 量 4 结束语 以上结果,经军事指挥人员确认,与人工图上作业结果一 致,具有实际可用性。可实现军事行动路线规划的自动化实现。本文解决的虽然是一个满足军事辅助决策需要的路径规 划问题,代价函数的设计根据也主要是军事地形学,但该方法 也可用于普通GI S 系统中无路情况下的路径规划,使之像在道 路网上进行的路径规划一样,得出真实的行进路程和所用时 问。也可将 G I S 中已有的道路网路径规划与无路时的路径规 划结合起来,形成一个完整的路径规划系统。野外行军的实际影响因素还有居民地,水系(包括水深、水宽、流速),植被(群落类型、粗度、密度、高度、树种、植物特 性),土质,天气及部队本身。要想使路径规划的结果进一步 符合实际,获取数据和其影响行军的数量关系是关键。现有 的地图数据只有水系分布,居民地分布,地表植被分类的信 息,进一步的工作包括获取更多的数据,综合判断各种因素对 行军的影响,使路径规划的功能更加符合军队的实际需求。参 考文献:【l】梁晓辉,吴威,赵沁平 大规模真实地形数据中的全局路径规划方 法基于遗传算法的研究【J】计算机研究与发展,2 0 0 2,3 9(3):3 O 1 3 0 6 【2 2 秦昆,关泽群,李德仁,等 基于栅格数据的最佳路径分析方法研究 J 1 国土资源遥感,2 0 0 2(2):3 8 4 1 3 3 高春晓,刘玉树 三维地形中基-)J n 权框架四叉树的路径规划【J 北 京理 工大学学报,2 0 0 2,2 2(1):5 6 5 9 4 田明星 路径规划在车辆导航系统中的应用研究【D】北京:北京交 通大学,2 0 0 9 5 H e i n e m a n G T,P o l l i c e G,S e l k o w s 算法技术手册【M】北京:机械 工业 出版 社,2 0 1 O 6】总参谋部 军事地形学【M】北京:解放军出版社,1 9 9 3 7 17 L u g e r G 人工智能:复杂问题求解的结构和策略【M】北京:机械 工业 出版社,2 0 0 6 8 武雪玲,任福,李清泉基于S T L 的A 路径规划算法设计与实验【J】测绘与空问地理信息,2 0 0 6(4):2 2 3 1 【9 1汪毅 基于路径规划的A+成品油运输监控技术研究与实现【D 1 大 庆:大庆石油学院,2 0 0 9 (A z 接 1 6 3 页)5 结论 提出了一种基于听觉掩蔽效应和改进型维纳滤波算法。通过和传统的维纳滤波语音增强算法相比发现其不仅提高了 整体信噪比,而且明显减小了语音失真。其次在非平稳噪声、低信噪比情况下传统维纳滤波语音增强算法失效时本算法仍 然 有 效。参考文献:【1】L o i z o u P C S p e e c h e n h a n c e me n t t h e o r y a n d p r a c t i c e M Bo c a Ra t o n Lo n d o n Ne w Yo r k:CRC P r e s s 【2】T s o u k a l a s D E,Mo u r j o p o u l o s J N,K o k k o n a k i s G S p e e c h e n。h a n c e me n t b a s e d o n a u d i b l e n o i s e s u p p r e s s i o n J I E E E T r a n s o n S p e e c h Au d i o P r o c e s s,1 9 9 7,5(6):4 9 7 5 1 4 【3】T s o u k a l as D E,P a r a s k e v a s M,Mo u r j o p o u l o s J N S p e e c h e l l h a n c e me n t u s i n g p s y c h o a c o u s t i c c r i t e r i a C P r o c I E E E I n t Co nf Ac o u s t S pe e c h S i g n a l P r o c e s s,1 9 9 3:3 5 9。3 6 2 【4】S r i n i v a s a n S,S a mu e l s s o n J,Kl e ij n B S p e e c h e nha n c e me n t u s i n g a p r i o r i i n f o r ma t i o n C P r o c Eu r o s p e e c h,2 0 0 3:1 4 0 5 1 4 0 8 5 1 S r i n i v a s a n S,S a mu e l s s o n J,Kl e i j n B C o d e b o o k d r i v e n s h o r t-t e r m p r e d i c t o r p a r a me t e r e s t i ma t i o n f o r s p e e c h e n h a n c e me n t J I E E E T r ans o n S p e e c h P r o c e s s,2 0 0 6,1 4(1):1 6 3 1 7 6 【6】6 李楠 一种小波变换与维纳滤波结合的语音抗噪研究 J】语音技 术,2 0 0 7,3 1(5):4 6 4 8 【7】Hir s c h H,E h r l i c h e r C No i s e e s t i ma ti o n t e c h n i q u e s f o r r o b u s t s p e e c h r e c o g n i t i o n C P r o c I E E E I n t C o n f Ac o u s t S p e e c h s i g n P r o c e s s,1 9 9 5:1 5 3-l 5 6 【8】J o h n s t o n J DT r a n s f o rm c o d i n g o f a u d i o s i g n a l u s i n g p e r c e p t u a l n o i s e c r i t e r i a J 1 E E E J o n S e l e c t Ar e a s C o mmu n,1 9 8 8,6(2):3 1 4 3 2 3 【9】卜 凡亮,王为民,戴启军,等 基于噪声被掩蔽概率的优化语音增强 方法f J】电子与信息学报,2 0 0 5,2 7(5):7 5 3 7 5 6 (1 O】赵晓群,黄小珊 改进的基于人耳掩蔽效应谱减语音增强算法【J l _ 通信学报,2 0 0 8,2 9(9):7 3 _ 8 O ;:。1
展开阅读全文