1、上海电力学院 本科毕业设计(论文)专业译文原文题目:DFT-based frequency estimation under harmonic interference译文题目:谐波干扰下基于DFT的频率估计学生姓名:学 号:指导教师:院 系:电气工程学院专业年级:电气工程及其自动化2016届 2017年 1 月 3 日 谐波干扰下基于DFT的频率估计Anbal Ferreira和Ricardo Sousa摘要:在本文中,我们介绍了自然信号正弦声波频率的精确估计,例如歌声、嗓音或乐曲。这些信号本质上都是谐波,并且通常混有一定的噪声。以Cramr-Rao的无偏频率估计器的下限为参考,我们对比了一
2、些基于DFT的频率估计器的性能,这些估计器是非迭代的,并且使用了矩形窗或汉宁窗。测试环境模拟谐波干涉,在测试中还是用了两个新的基于反正切窗函数的频率估计器。结果表明,不同频率估计器的相对性能可以表示为性噪比的函数。1引言很多信号处理问题都需要估算正弦声波的频率、振幅和相位参数,特别是涉及讲话或者音频编码、用于MIDI转录的PCM和实时精确歌曲分析的情况。振幅和相位的估算通常取决于频率的估算,因此,本文仅关注频率参数。讲话或者唱歌的波谱通常由一些正弦声波组成,这些正弦声波大体上遵循谐波的形式。当存在干扰信号时,包括噪声或其他正弦声波,单个正弦声波的精确频率估算通常使用离散信号的离散傅里叶变换(D
3、FT)和从DFT谱图中提取信号来实施。由于DFT谱图大部分在频率上都是离散的,并且受到DFT自然频率分辨率的限制(2/N,其中N是DFT的大小),因此正弦声波频率的精确估算涉及到使用一些DFT谱图(或者是DFT谱图的片段)样本进行插入计算。在过去的40年中,研究者们提出了很多DFT插入算法。测试环境的较大差异使得相对性能的评估变得非常困难。例如,在DFT之前,可能使用不同的窗函数对信号进行了计算,这对DFT的频率选择性有很大的影响,并且会产生泄漏效应。测试正弦声波可能是复杂的正弦声波(例如顺向波)或者真实的正弦声波。DFT插入的程序可能是迭代的,也可能不是迭代的。例如对于歌声信号,一个更加真实
4、的测试场景必然涉及到一些干扰正弦声波,因为这些信号具有谐波的特征。既然我们对歌声的谐波结构中单个正弦声波的实时和精确分析很感兴趣,这种歌声中可能包含100个或者更多的正弦声波,因此我们主要关注频率估计算法为:避免出现迭代程序,并且计算简单;避免计算数据向量长度更大的DFT;当不仅存在噪声,而存在干扰正弦声波时,将对噪声的估算精确度和稳定性最大化。为了评价其性能,对于不同的估算错误我们采用了Cramr-Rao下限作为参考,此估算错误获得时具有无偏的最大可能(ML)估计器。本文的结构如下。在第二部分,我们叙述了存在的问题,确定了CRLB和测试的条件。在第三部分中,我们对测试中使用的不同窗之间的关系
5、进行了定义和分类。在第四和第五部分中,我们给出了研究中估算得到并在矩形或汉宁窗中使用的参考非迭代频率估计器。在第六部分中,我们给出了两个新的反正切窗函数估计器,并在单个文章的进行了叙述,这些估计器也包含在我们的对比研究中。第七部分讨论了不同频率估计器的相对性能,第八部分对本文进行了总结。2存在的问题为了简单但不失一般性,我们使用x代表任意频率的正弦信号,此信号受到了高斯噪声r(n)的破坏。通过公式=2/N(l+)得到了正弦声波的频率,其中l和分别代表DFT元素大小中的整数部分(0lN/2)和小数(0.01.0,或者取决于插入规则-0.520),因此可以通过忽略泄漏并使用下列公式得到频率的估计值
6、:Jain等认为性能中的损失是由“谐波干涉”太小引起的。Quinn提出了一个频率估计器,这个估计器使用了本地最大峰值(k=l)每一个上的DFT波谱线,以此来提升对噪声的稳定性。令L=,其中,以及,其中=,频率估计可以通过下面的公式得到:其中,Quinn给出了单个真实正弦声波小于CRLB的倍时这些估计器的渐进方差。Macleod开发了一个三样本频率插入程序,这个程序涉及到DFT谱图中的一个峰值样本和两个相邻的样本。为了提升其性能,有必要在频率估计器中使用DFT相位和振幅的信息,并第一次计算了、和,从而得出:最后计算得到:据报道,相关的平均方差(在复杂的正弦声波的情况下)是CRLB的1.32倍左右
7、。Jacobsen最近使用矩形窗提出了非常简单、高效的DFT频率估计器。在以前的两种情况下,使用谱图峰值中心的三个DFT样本,并根据下面的公式可以得到频率的估计值:研究者认为这个简单的估计值对于非常低的性噪比来说出人意料的精确,通过其有能力消除统计上偏差可以从在一定程度上解释这种现象。5以汉宁窗为基础的估计器我们选择了五个非迭代、基于DFT的频率估计器,并以报道的简单化与性能以及少量初步仿真为基础来假定汉宁窗。Grandke认为由于“谐波干涉”引起的泄漏是一个具有矩形基础频率插入值的问题,并且认为使用汉宁窗的频率估计器(不存在较长的泄漏)为:在使用相同的条件时(使用20DFT 二进制将三个真实
8、的正弦声波分离),Grandke给出的DFT频率估计器比Jain的结果要精确很多。对于谐波干涉,Grandke还预测比汉宁窗多很多的复杂窗可能会包围现有的限制条件,因为这些声调都被充分的隔开了。除了频率估计器使用了前面一节中提到的矩形窗,Macleod还提出了一种使用汉宁窗的频率估计器,这种估计器具有“充分的泄漏抵抗性”。通过计算第一、和,可以使用下面的公式估算得到频率:当考虑单个复杂正弦声波的估算时,本估计器的平均方差大约是CRLB的2.13倍。一个非常简单、流行并且经常使用的DFT频率估计就是抛物线插入。抛物线插入涉及到的抛物线要和对数刻度上分析窗频率反应振幅的主波瓣相匹配。由于主波瓣的顶
9、部存在一个凸出的形状,X-Y平面上的模型可以由公式计算得到,其中未知参数分别为水平位移(x0)、垂直位移(y0)和凸面参数(m)。因此,需要三个方程才能计算。使用代表正弦声波的未知振幅,而中只有是未知的。使用可以得到三个方程、 和,使用下面的式子计算出:抛物线插入需要所有可能的,以及适应分析窗频率反应主波瓣内部的三条DFT直线。因此,这表明如果对矩形或者正弦窗使用抛物线插入,那么抛物线插入是无效的。当对汉宁窗使用抛物线插入时,最大的绝对估计误差是二进制宽度的1.6%,这是相对较差的情况,并且是由抛物线插入的窗不可知性导致的。可靠地估计需要两个正弦声波之间的频率分离至少在4条DFT频率线(或者8
10、/N)上。如果在频率插入的初级阶段使用补零操作,那么二次插入的性能可能会有所提升。与Quinn在第四部分中提出的频率估计器类似,Quinn最近还提出了一种在汉宁窗中使用的新的估计器。定义,其中,以及,其中,频率的估算方程为:其中由于主要来自特定的性噪比,因此报道的真实正弦声波的性能结果没有太大的意义。除了第四部分中Jacobsen提出的频率插入程序外,研究者还在同一篇文章中提出了两个使用汉宁窗的频率插入法,包括:然而性能的结果却是单个音调以及较小的性噪比范围内(-2dB至10dB)。6基于反正切窗函数的插入法在对比文章中,我们给出了两个基于反正切窗函数的DFT频率估计器,这两个估计器适用于矩形
11、窗和正弦窗。第一个估计器使用了和,两个最大的DFT谱线,因为两条DFT线和矩形窗频率回应的主波瓣是匹配的:对于复杂的正弦声波和不存在噪声的情况是非常精确的。然而,对于真是的正弦声波,此频率插入的精确度取决于l和,并独立于正弦声波的振幅和相位。对l的依赖性可以通过较小的l进行确定,在l为20或更小时,泄漏会非常明显,并且会引入系统系估计误差。第二个估计器使用了三个最大的DFT二进制,因为这三个DFT二进制和正弦窗频率回应的主波瓣是匹配的。考虑下面的公式:其中,是本地最大值,这表明精确的频率可以估算为;而当精确的频率被估算为时,。因此,的估算必须在0.0至0.5之间。在第一种情况下,当0.0时,其
12、中为优化的参数,可以通过使用公式得到改进的估计精确值,进而得到:当,时,可以通过使用公式得到改进的估计精确值,进而得到:极小极大场景中优化的估计误差可以确定为r、G和F。在第二种情况下,可以在重新确定和之后获得同样的表达方式。由文献18可知,与二进制宽度相关的最大绝对估计误差通常小于0.1%。7仿真本节中我们评价了基于矩形窗的频率估计器的相对性能,此估计器在第四部分中有所描述,并且包含反正切窗函数估计器和第五部分中给出了基于汉宁窗的频率估计器的相对性能,还包含结合公式(20)和(21)得到的反正切窗函数估计器。A基于矩形窗的插入的性能得到的基于DFT的频率估计器的仿真分别记为Jain79、Qu
13、inn97、Macleod98、反正切窗函数和Jacobsen79,并且和公式(9)、(10)、(11)、(18)和(12)是相关的。图1给出了使用二进制宽度标准化之后每一个频率估计器引起的误差方差的平方根。可以得到的结论是可以确定三个区域,这三个区域中特定的估计器给出了获得CRLB的优势:1)对于性噪比处于-10dB至0dB之间的区域,Jain70和反正切窗函数的估计器相对于其余估计器来说具有很小的优势;2)对于性噪比处于0dB至10dB之间的区域,Macleod98的估计器相性能出了边缘相对优势;3)对于性噪比大于10dB的区域,Jacobsen07没有竞争对手。总之,尽管在中等(例如10
14、dB附近)和较高的性噪比时,所有的频率估计器都性能在RMSE附近或者比二进制宽度的0.02%还要好,这对于研究的目的是可以接受的,由于在非常低的性噪比时性能很差,因此需要Quinn97应该避免,而在较高的性噪比时具有很好的性能,因此最好选择Jacobsen97估计器。结果表明Jacobsen97估计器不仅能够消除“统计偏差”,而且能够稳定谐波干扰。最后的评论考虑了Jain79和反正切窗函数估计器之间非常类似的性能,以及相对于剩余基于矩形窗的估计器来说较差的整体性能。一种可信的解释为这些估计器只是用了来自两个DFT二进制的振幅信息,而剩余的三个估计器使用了来自三个DFT二进制的振幅信息和相位信息
15、。图1 以性噪比为根据时五种基于矩形窗的频率估计器的RMSE(占标准化二进制宽度的%)。以CRLB为参考。图2除了目标声波之外,当干扰声波为10二进制左右时且以性噪比为根据时六种汉宁/正弦窗基频率估计器的RMSE(占标准化二进制宽度的%)。以CRLB为参考。B基于汉宁/正弦窗的插入的性能对于基于DFT的频率插入获得的仿真可以分别确定为Grandke83、Macleod98、Quadratic、Quinn06、反正切窗函数和Jacobsen79,并且和公式(13)、(14)、(15)、(16)、(20-21)和(17)是一致的。由每个频率估计器导致的与标准化误差方差有关的结果见图2,这些结果表明
16、,对于性噪比为15dB或者更大时,Quadratic估计器的性能是第一个需要饱和的,其次是性噪比为30dB或者更大时Jacobsen07估计器的性能,然后是性噪比为40dB左右时反正切窗函数S估计器的性能。剩余三个估计器在与CRLB具有几乎相同的距离时具有类似的趋势。然而,非常有趣的是,与其余估计器相比,反正切窗函数S估计器性能出了边缘优势,这是因为当性噪比在0-30dB之间时,标准化的RMSE能够达到更好的CRLB。为了更好的理解不同正弦声波(可能是谐波正弦声波)之间的贴近程度如何影响其性能的,使用5二进制代替10二进制将目标正弦声波周围的两个正弦声波分开。最新测试环境的仿真见图3。图3反映
17、了由于干扰声波对目标声波的贴近性而对RMSE性能的影响,具有很好的教育意义。实际上,所有频率估计器的性能饱和都处在10dB 性噪比至30dB 性噪比 之间。然而,可以确定的是,当性噪比处于0dB至20dB之间时,反正切窗函数S估计器与剩余的频率估计器相比保持着边缘优势,这是由于其RMSE能够得到更好的CRLB导致的。这个事实可能与窗的选择性有关。图4代表经过汉宁或正弦窗处理后结果信号的短时间傅里叶谱图。可以看出,在这种情况下,不同的正弦声波之间具有更好的分离。另一方面,正弦窗比汉宁窗具有更好的选择性。图3除了目标声波之外,当干扰声波为5二进制左右时且以性噪比为根据时六种基于汉宁/正弦窗的频率估
18、计器的RMSE(占标准化二进制宽度的%)。以CRLB为参考。图4 目标声波和除了目标之外另两种频率为5.3二进制的干扰声波的短时间傅里叶谱图(l+l=20.5),N=512总之,图3表明,对于较宽的性噪比以及正弦声波具有非常贴近的空间时,Grandke83、反正切窗函数S、Macleod98和Quinn06频率估计器是可以接受的选择。8结论本文中对比了几种非迭代DFT频率估计器的性能,这些估计器使用了矩形或汉宁窗,其中还包括两个使用矩形和正弦窗的基于新型反正切窗函数的频率估计器。由于存在噪声或者感染声波,因此在测试环境中将其考虑为最可能的具有自然声调的场景,比如歌声。结果表明在非常低的性噪比的
19、环境下,基于矩形窗函数的插入比基于汉宁窗函数的插入要性能得更好。这正好与中等和较高的性噪比相反,其性能出的优势超过了振幅的顺序。还可以总结出的是正弦声波的干扰会从三个方面降低所有估计器的性能:更加偏离CRLB、在较高的性噪比时通过渐近线趋势来限制其性能、当声波干扰更强时,不同估计器的性能变得更加和谐,特别是使用汉宁窗时。最后来讨论抛物线插入。当使用汉宁窗时,这是一种非常流行的频率估算方法,并且结果表明其性能在所有使用这种窗的测试估计器中时最差的,这可以用抛物线插入的窗口不可执行来简单的解释。然而,如果实施了频率插入的第一阶段,例如补零,那么抛物线的插入就会对结果有所改善。补零是一种通过将0加入到数据向量中并计算DFT中更大的N来插入信息的技术。然而,由于补零会增加计算的复杂性,因此我们在本文中没有考虑这种方法。13
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100