1、225第40 卷第6 期2023年6 月真机计仿算文章编号:1 0 0 6-9348(2 0 2 3)0 6-0 2 2 5-0 4基于电脑声卡的TDOA声源定位仿真系统万若楠,孙小广1,张亦勋,刘朝山2*(1.广州城市理工学院电子信息工程学院,广东广州51 0 8 0 0;2.火箭军工程大学,陕西西安7 1 0 0 2 5)摘要:声源定位是一种典型的被动式目标定向、定位技术,有着广泛的应用前景。利用4麦克风阵列、电脑声卡、MATLAB的数据采集、处理工具箱构成高性价比的声源定向定位仿真系统。将成对的麦克风采集两通道声音信号送至电脑声卡;由已训练好的分类器识别出目标声音信号,再对两通道的目标信
2、号采用广义互相关函数时延估计算法,解算出目标的方位角、俯仰角,并分析声源点距离对方位角误差、麦克风阵列臂长对俯仰角误差的影响。最后利用51 单片机控制的二轴自由度平台对声源目标进行激光瞄准演示。关键词:声音信号;声卡;声源定位;麦克风阵列中图分类号:TP391.9文献标识码:BTDOA Sound Source Location Simulation SystemBased on Computer Sound CardWAN Ruo-nan,SUN Xiao-guang,ZHANG Yi-xun,LIU Chao-shan?2*(1.College of Electronic Informat
3、ion Engineering,Guangzhou City Institute of Technology,Guangzhou Guangdong 510800,China;2.Rocket Army Engineering University,Xian Shaanxi 710025,China)ABSTRACT:Sound source location is a typical passive target orientation and location technology,which has becomea new research hotspot.A cost-effectiv
4、e sound source directional positioning simulation system was constructed usinga 4-microphone array,computer sound card,and MATLAB data acquisition and processing toolbox.First,twochannels of sound were picked up by pairs of microphones and sended to the computer sound card;Secondly,the tar-get sound
5、 signal was recognized by trained classifier,then the azimuth angle and pitch angle of the target signal werecalculated by using the Generalized Cross Correlation-Phase Transform(GCC-PHAT),also the effects of soundsource distance on azimuth angle error and microphone array arm length on pitch angle
6、error were analyzed,respec-tively.Finally,a two-axis freedom platform controlled by 51 microcontroller was used to demonstrate the laser targe-ting of the sound source target.KEYWORDS:Sound signal;Sound card;Sound source orientation positioning;Microphone array1引言声源定位是一种典型的被动式目标定位技术,仅需要接收来自定位目标的相关特征
7、参数如声音信号到达麦克风阵列的入射角、时间差就可以完成目标定位,具有极强的隐蔽性。因此,作为典型被动式目标定位、跟踪技术越来越成为新的研究热点,在军事、工业、民用等领域都有广泛应用。如鸣笛抓拍系统1-3,通过麦克风阵列完成音频采集,运用声收稿日期:2 0 2 1-1 1-2 8 修回日期:2 0 2 1-1 2-0 9源定位技术对鸣笛车辆进行定位,最后运用高清摄像头完成抓拍功能。利用声源定位获取声源信息,可以使得视频会议中的麦克风自动跟踪说话人,获得更加精确的采集语音,实现语音增强4;可以进一步提高智能机器人的声音定位能力、语音交互能力5.6 。利用声源定位获取声源信息,可对闯人一些禁区如核电
8、站、军事基地等“黑飞”的四旋翼无人机定向定位以及实施有效拦截7 。目前主要采用的声源定位算法有三种:基于波束形成(BeamForming)的定位算法、高分辨率谱估计(high resolution spectral estimation)的定位算法,以及到达时延差(TimeDifferenceof Arrival:T D O A)技术定位226算法8 。Matlab2020a相控阵系统工具箱提供了对应的算法,其中TDOA定位算法相对较简单,是实际应用最广泛的一种定位方法。2TDOA的定向定位模型在基于TDOA的声源定位场景中,声源s(t),环境中仅存在噪声,麦克风1、2 接收到的混合声音信号可
9、以被数学建模为9xi(t)=s(t)+ni(t)(1)x2(t)=as(t-T12)+n2(t)(2)其中x(t)与x2(t)为麦克风接收到的混合声音信号,s(t)为声源信号,为麦克风2 接收到的声音信号的能量相较于阵列中心的衰减系数,T12为声音信号到达麦克风的传播时间差,ni(t)与n2(t)为均值为0、方差为1 的高斯白噪声。声源s(t)与噪声n,(t)、n(t)相互独立。2.1基于GCC-PHAT的时延估计算法在声源定位系统中,麦克风阵列的每个单元所接收到的目标信号x(t),(i=1,2,3,4)源于同一个声源,显然,不同通道信号(t)之间具有较强的相关性。通过计算每两通道信号之间的相
10、关函数Rx(),确定出两通道麦克风接收信号之间的时延1 0 Rxx(T)=E(xi(t)x2(t-T)(3)将方程(1)、(2)代人方程(3),考虑到声源s(t)与噪声ni(t)、n z(t)互不相关,最后化简为Rx,(T)=,R,(T-Ti2)(4)由相关函数的性质可知,当两个麦克风之间的时延T12=T-T2时,R1*(T)取最大值。为抑制噪声和混响干扰,采用广义互相关相位变换方法(Generalized Cross CorrelationPhase Transformation,GCC-PHAT)。在频域内引人P12()对互功率谱进行PHAT加权,可锐化R*()的峰值,提高计算的精度。依据
11、互相关函数和互功率谱的关系RG2,(o)eiTda=Xi(w)X,(w)eiorda180(5)最后利用傅里叶逆变换,可得广义互相关函数R,Rx*2P12(w)X,(w)X,(w)ej da(6)针对不同的应用环境,可选择不同的加权函数1 1,1 2 2.2空间四元麦克风阵列定位算法如图1 所示,将四元麦克风放置在St,S2,S3,S4四个点的位置上,组成空间四面体的麦克风阵列,并建立对应的三维直角坐标系。为便于计算,四个麦克风阵列的坐标分别为S,(d,d,h),S,(-d,d,o),Ss(-d,-d,h),S(d,-d,o),将声源点记为P,坐标设为(x,y,z,),则其到坐标原点的距离为T
12、。=+y+z。依据声源点与麦克风间的坐标关系(如图1 所ZP(Xs,Ys,Zs)S3S2S4PX图1空间四元麦克风阵列d=cTMic1Mic2图2声音信号传播延时与距离关系示)以及声达时间差关系(如图2 所示),可以建立如下方程组1 3(x,-d)+(y。-d)+(z,-h)=di=ri(x,+d)+(y,-d)2+z=(d,+t21c)=2(x,+d)2+(y,+d)+(z,-h)2=(dj+tgc)=r(x,-d)*+(y.+d)+z=(d,+tac)=r(7)将上述方程组展开,有x?+y?+z?-2dx,-2dys-2hz,+h?+2d=dj=rix?+y?+2+2dx,-2dy.+2d
13、?=di+di+2d,d21=f2(8)x:+y:+2+2dx,+2dy,-2hz.+2d+h?=dj+dgi+2d,d3=rsx?+y+2;-2dx,+2dy,+2d=d+da,+2d,d4r=r用方程组(8)中的后三个方程分别减去第一个方程,并考虑r;-r,=di,当d,r,时,有r,+r,2 r o,因此有2274dx,+2hz,-h2 2rod24dx,+4dy,2rod31(9)(4dy,+2hz,-h 2rod41基于方程组(9)可以求得声源点P的位置坐标(x,y,.)与T。和d,关系的表达式ro(dz1+d31-d4l)4dTo(ds+da1-d2,)(10)4dro(da1-d
14、s1+dal)+h22h根据上述声源点的坐标关系,可推导出方位角和俯仰角d31+dt-d21?arctand21+d.1-da1(11)三arcsin222SS3系统硬件设计系统硬件主要由声波信号采集、处理系统、指向执行系统等组成。3.1基于电脑声卡的采样系统设计在空间直角坐标系中放置四个驻极体麦克风,分别位于四面体的四个顶点上,其中麦克风1(0.1 4m,0.1 4m,0.28m)、麦克风2(-0.1 4m,0.14m0)、麦克风3(-0.1 4m,-0.14m,0.2 8 m)、麦克风4(0.1 4m,-0.1 4m,0)。声音信号经麦克风采集、信号调理单元放大,放大倍数为1 0 0 倍左
15、右(可调)。最后,输人电脑声卡,采样频率设为44.1 kHz。由于电脑声卡是双通道,每次只能采集两个麦克风的信号。为降低成本,在采集声音信号时采用继电器控制麦克风的工作,其中麦克风1 持续工作,另三个由继电器控制分别依次工作,依据方程组(7),可以测得四麦克风2、3、4与麦克风1 之间三组时延,解算出声源的位置。显然,本仿真系统对静止、低速运动声源的定位具有很好的性价比。3.2声源跟踪单元为了控制两轴自由度平台转动,采用ULN2803来驱动28BYJ48型的5V步进电机,达到精确控制角度的目的。控制信号通过驱动芯片与光耦连接,可以隔离掉电机的起止电流对于单片机的影响,从而提高系统稳定性。4系统
16、软件设计为了提高效率、更好控制硬件设备,采用MATLAB软件进行了原理性仿真验证。具体仿真流程见图3。4.1信号预处理模块由于采集到的信号具有噪声,因此需要进行过滤步骤。采用MATLAB中的smooth平滑函数和带通滤波器可以实现开始输人参数声音信号采集声音识别模块信号预处理模块时延估计解算声源定位解算驱动激光指向电脑单片机通讯图3程序流程图对声音信号的滤波。4.2敏感声音识别模块倒谱参数(Mel Frequency Cepstral Coefficents:MFCCs)是一种在自动语音以及说话人识别中使用最为普遍的特征,从Mel标度频率域中提取出来,这种特征具有更好的鲁棒性1 4,1 5。本
17、文直接采用Matlab2020a音频工具箱(AudioToolbox)提供的数据集(Data Set);特征提取(FeatureExtrac-tion);分类器训练(Training a Classifier);分类器测试(Testingthe Classifier)及其相关的支持函数(Supporting Functions),实现声音信号的识别。4.3声源定位算法仿真与分析考虑到影响定向精度的因素主要有声源点的距离、基阵的尺寸以及时延估计误差等,文章主要从以上几个方面对定向精度进行了分析。图4是通过MATLAB软件仿真得到的时延估计图,由图中可以看到三个峰值,分别对应了三个时延值,将峰值与
18、程序所设定的数值进行比较,基本是一致的,即仿真系统成功识别出声源信息。10.80.6互0.40.20-0.2-0.4-2-1.5-1-0.500.511.52时间/us图4GCC-PHAT时延估计图图5是声源点分别在x、y、z 三个方向上距离变化时对方位角测量误差的影响,仿真中俯仰角取值为35.3方位角取值为45,声阵臂长定为0.1 4m,时延估计误差为1 5us,仿真取点间隔设置为0.0 5m。由图5可见,在4到1 0 m的范围内,三个方向上声源点距离对方位角误差的影响不大,整体误差在1 左右。声源点在x方向改变距离时,得到方位角误差的平均值和标准差228下转第2 49页)0.80.70.6
19、0.50.40.30.20.10-0.1-0.245678910声源点x方向距离/m图5a)声源点x方向距离对方位角误差的影响0.40.20-0.2-0.4-0.6-0.8145678910声源点y方向距离/m图5(b)声源点y方向距离对方位角误差的影响0.50.40.30.20.10-0.1-0.2-0.3-0.4-0.545678910声源点方向距离/m图5(c)声源点z方向距离对方位角误差的影响分别为:0.31 41 4和0.1 97 45;声源点在y方向改变距离时,得到方位角误差的平均值和标准差分别为:-0.31 934和0.22537;声源点在z方向改变距离时,得到方位角误差的平均值
20、和标准差分别为:-0.0 0 6 8 0 和0.2 0 8 6 4;由这些数据可见,在x方向上改变声源点距离时,测量值与预测值较相符合,y方向上的误差相对大一些,同时方位角对z方向声源点距离改变最为不敏感。8765432-1-200.10.20.30.40.50.60.70.80.91麦克风阵列臂长/m图6麦克风阵列臂长h对俯仰角误差的影响图6 为麦克风阵列臂长h对俯仰角测量误差的影响,在仿真计算时俯仰角选取为35.3,方位角选取为45,声阵臂长取值为0.1 4m,仿真取点间隔设置为0.0 1 m。由图6 可见,麦克风的阵列臂长h对俯仰角精度的测量有较大影响。当麦克风阵列臂长h在0 到0.1
21、m的范围内时,俯仰角的仿真误差比较大接近8,当麦克风阵列臂长h在0.1 到1 m的范围内变化时,俯仰角仿真误差明显减小,整体误差在2 左右。仿真结果进一步表明,当麦克风阵列臂长h超过1 m时,俯仰角精度也明显低于0.1 到1 m时的精度范围。总的来说,适当的麦克风阵列臂长h的取值范围对俯仰角估计精度有明显效果。5结论本文借助MATLAB信号处理工具箱、相控阵系统工具箱,实现有限集合的声音信号识别,并由GCC-PHAT算法确定声波的时延,成功实现了声源定位定向仿真,并分析了对定向精度测量的影响因素,得到了比较理想的结果。本文提供的声源定向定位方法最大优势是实验硬件简单,信号处理、分析算法丰富且易
22、于实现,为开发、评估声源定向定位算法和教学提供了新的仿真平台。参考文献:【1 吴晶.鸣笛抓拍系统现场校准方法的研究与探讨J品牌与标准化,2 0 2 0,(6):7 1-7 2.2袁芳,闫建伟,张勇等。汽车鸣笛声实时抓拍的理论研究和系统实现J.电声技术,2 0 1 8,42(1 1):1 3-1 5,2 1.3张瑞,史故臣,梁远等.基于MEMS声传感器阵列的车辆鸣笛声抓拍系统设计与实现J.传感技术学报,2 0 2 0,33(4):6 1 2-620.4闵新宇,王清理,冉云飞.基于麦克风阵列的语音增强算法J.计算机工程与设计,2 0 2 0,41(4):1 0 7 4-1 0 7 9.5胡郁,严峻
23、.智能语音交互技术及其标准化J.信息技术与标准化,2 0 1 5,(4):1 4-1 7.6朱全胜,刘烧,李卫东.EMS人机界面及其交互技术研究J.电力自动化设备,2 0 0 7,(8):7 7-8 1.7S H,Scanlon M V.Detection and localization with an acoustic arrayon a small robotic platform in urban environments,technical reportADA410432R.A d e l p h i,U SA:U.S.A r m y Re s e a r c hLaboratory
24、,2003.8赵玉民.战场监视地面传感器系统技术与应用M.北京:北京理工大学出版社,2 0 1 1,51-98.9胡广书.数字信号处理M.北京:清华大学出版社,2 0 0 3:34-38.10Brandstein M.S.A pitch-based approach to timedelay estimationof reverberant speech C.Proceedings of IEEE Workshop on Ap-plications of Signal Processing to Audio and Acoustics.1997:6-9.11Knapp C H,Carter G
25、 C.The generalized correlation method forestimation of time dela J.IEEE Transactions on Acoustics,Speech,and Signal Processing,1976,24(4):320-327.249上接第2 2 8 页)参考文献:1魏辉.基于电子通信工程中的设备抗干扰方法分析一评现代电子通信:系统方法J.现代雷达,2 0 2 1,43(9):119.2刘文亚,王翔,赵尚弘,等.同频干扰下混合MUD-RF/FSO航空中继通信系统性能分析J.电子学报,2 0 2 1,49(10):196 0-196
26、8.3戴翠琴,宋清洋,郭磊.基于卫星协作的空间信息传输技术研究综述J.重庆邮电大学学报(自然科学版),2 0 2 0,32(2):217-226.4张亮,王国宏,张翔宇,等.基于分数阶字典的间歇采样转发干扰自适应抑制算法J.系统工程与电子技术,2 0 2 0,42(7:1439-1448.5陈威,张吉建,谢文冲,等.机载相控阵雷达灵巧干扰信号模型及抑制方法研究J.系统工程与电子技术,2 0 2 1,43(2):343-350.6李勇斌,王彬,邵高平,等.一种基于RCGAN的水声通信信号降噪方法J.电子学报,2 0 2 2,50(1):54-6 2.7付林军,王凤随,刘正男.改进自适应CEEMD
27、方法在心电信号去噪中的应用J.电子测量与仪器学报,2 0 2 0,34(4):50-57.8黄隽逸,王红星,陆发平,等.高斯白噪声对PSWFs信号时频分布影响研究J.中国电子科学研究院学报,2 0 2 0,15(11):1042-1049.9杨章静,王文博,黄璞,等。基于潜子空间去噪的子空间学习图像分类方法J.计算机科学与探索,2 0 2 1,15(12):2 37 4-2389.10黄金,吴庆良,陈钒.基于CEEMDAN-WPT联合去噪的灾后求救信号能量分布特征研究J.南京理工大学学报,2 0 2 0,44(2):194-201.11岳文静,瞿耀庭,陈志.基于信号能量分布拟合优度的长短时记忆
28、网络频谱感知算法研究J.信号处理,2 0 2 0,36(7):1065-1074.12魏文亮,茅玉龙.一种改进加权函数的GCC时延估计方法研究J.计算机仿真,2 0 2 1,38(5):16-2 0,8 4.13 Huang G,Li C,Gao Y,et al.Five-element planar cross array pas-sive locationbased on mutual information C.Signal Processing,IEEE.2006.14Zieger C,Omologo M.Acoustic event classification using a di
29、strib-uted microphone network with a CMM/SVM combined algorithmC.Ninth Annual Conference of the International Speech Com-munication Association.2008.15Phan H,MaaB M,Mazur R,et al.Random regression forests for a-coustic event detection and classification J.IEEE/ACM Trans-actions on Audio,Speech,and L
30、anguage Processing,2014,23(1):20-31.12余长庚,刘凯.基于小波变换与Otsu阈值去噪的脐橙识别方法J.华南农业大学学报,2 0 2 0,41(5):10 9-114.13李启飞,温玮,韩蕾蕾,等.变尺度正交基函数分解对异常信号的探测方法J.探测与控制学报,2 0 2 0,42(1):10 4-10 9.14王梓璇,王圃,王颖,等.基于小波分解及遗传BPNN耦合模型的地表水As浓度预测研究J.环境科学学报,2 0 2 1,41(7):2942-2950.15陈鹏,贾志考,苏琪雅,等.海杂波反射系数模型及雷达回波信号计算方法J.现代防御技术,2 0 2 0,48
31、(3):8 1-8 5.16罗章凯,裴忠民,熊伟,等。一种基于正交向量的极化相关衰减效应消除方法J.电波科学学报,2 0 2 2,37(2):342-348,356.17霍晓磊,赵宏志,刘颖,等.基于干扰信号带外分量卷积反演的邻道干扰抑制J.电子与信息学报,2 0 2 0,42(10):2 437-2444.18卢丹,白天霖.利用信号重构的全球导航卫星系统欺骗干扰抑制方法J.电子与信息学报,2 0 2 0,42(5):12 6 8-12 7 3.19 刘兰军,周亚涛,陈家林,等.海洋电场信号程控增益超低噪声采集系统设计J.电子技术应用,2 0 2 2,48(2):91-95,100.20余陆斌
32、,杜启亮,田联房.基于自适应权值裁剪的Adaboost快速训练算法J.电子与信息学报,2 0 2 0,42(11):2 7 42-2 7 48.作者简介张烨(198 3-),男(汉族),河南武陟人,硕士,副教授,研究方向:结构健康监测、信号处理及应用。肖启阳(198 7-),男(汉族),河南确山人,博士,副教授,研究方向:无损检测、光电测量、信号处理,作者简介万若楠(198 3-),女(汉族),湖北省潜江市人,硕士研究生,讲师,主要研究领域为声测定位技术。刘朝山(196 5-),男(汉族),湖北省荆州人,博士,副教授,主要研究领域为导航、控制与制导(通讯作者)。孙小广(198 3-),男(汉族),湖南省武冈市人,硕士研究生,讲师,主要研究领域为超声技术与应用。张亦勋(1994-),男(汉族),广东省广州市人,硕士研究生,助理研究员,主要研究领域为无线电通信。