收藏 分销(赏)

基于神经网络的声学参数预测方法研究.pdf

上传人:自信****多点 文档编号:2400508 上传时间:2024-05-29 格式:PDF 页数:5 大小:1.17MB
下载 相关 举报
基于神经网络的声学参数预测方法研究.pdf_第1页
第1页 / 共5页
基于神经网络的声学参数预测方法研究.pdf_第2页
第2页 / 共5页
基于神经网络的声学参数预测方法研究.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、引用格式:引用格式:万宇鹏,周远波,文捷,等.基于神经网络的声学参数预测方法研究J.中国测试,2024,50(2):167-171.WANYupeng,ZHOUYuanbo,WENJie,etal.ResearchofacousticparameterpredictionmethodbasedonneuralnetworkJ.ChinaMeasurement&Test,2024,50(2):167-171.DOI:10.11857/j.issn.1674-5124.2023030032基于神经网络的声学参数预测方法研究万宇鹏1,周远波2,文捷1,陈政1,赵晶1(1.中国测试技术研究院声学研究所

2、,四川成都610021;2.四川海岩声学科技有限公司,四川成都610599)摘要:为更加准确高效地预测建筑声学客观音质参数,该文基于机器学习的室内中频混响时间和语言传输指数的神经网络预测方法。将基于机器学习的神经网络技术与计算机声学模拟仿真技术相结合,提取 800 个厅堂建筑的10 个典型特征参数和 3 个目标参数,利用 Odeon 声学仿真平台,针对不同音质参数指标建立多个数值矩阵训练样本数据库,采用机器学习理论对混响时间、语言传输指数等指标进行 BP 神经网络数据拟合训练。对训练结果的均方误差、误差分布及回归系数进行评估,结果显示混响时间参数的训练均方误差小于 0.05s,语言传输指数参数

3、的训练均方误差小于 1.5104,所有目标参数的回归系数 R 值均优于 0.95。评估结果表明,该神经网络具备良好的预测准确性、数据泛化性和应用适用性。经实例验证,依托该神经网络编译和封装的应用程序可以实现对目标参数的快速评价,减少人力物力,提高工作效率。关键词:机器学习;神经网络;声学设计;参数预测;混响时间;语言清晰度中图分类号:TU112;TB9文献标志码:A文章编号:16745124(2024)02016705Research of acoustic parameter prediction methodbased on neural networkWANYupeng1,ZHOUYua

4、nbo2,WENJie1,CHENZheng1,ZHAOJing1(1.InstituteofAcoustics,NationalInstituteofMeasurementandTestingTechnology,Chengdu610000,China;2.SichuanHaiyanAcousticTechnologyCo.,Ltd.,Chengdu610599,China)Abstract:Inordertopredicttheobjectivesoundqualityparametersofarchitecturalacousticsmoreaccuratelyandefficientl

5、y,thispaperstudiestheneuralnetworkpredictionmethodofindoormid-frequencyreverberationtimeandspeechtransmissionindexbasedonmachinelearning.Inthisstudy,theneuralnetworktechnologybasedonmachinelearningandcomputeracousticsimulationtechnologywerecombinedtoextract10typicalcharacteristicparametersand3target

6、parametersof800hallbuildings.ByusingOdeonacousticsimulationplatform,multiplenumericalmatrixtrainingsampledatabaseswereestablishedfordifferentparametersofsound quality.Using machine learning theory,BP neural network data fitting training is conducted forreverberationtime,speechtransmissionindexandoth

7、erindicators.Themeansquareerror,errordistributionandregressioncoefficientofthetrainingresultsareevaluated.Theresultsshowthatthetrainingmeansquareerror of reverberation time parameter is less than 0.05 s,and the training mean square error of speech收稿日期:2023-03-10;收到修改稿日期:2023-05-21基金项目:2023 年度重要技术标准研

8、究项目(ZYBZ2023-5)作者简介:万宇鹏(1985-),男,四川成都市人,高级工程师,硕士,主要从事计量测试领域相关工作。通信作者:赵晶(1974-),女,江苏启东市人,高级工程师,硕士,主要从事计量测试领域相关工作。第50卷第2期中国测试Vol.50No.22024年2月CHINAMEASUREMENT&TESTFebruary,2024transmissionindexparameterislessthan1.5104,theregressioncoefficientRvaluesofalltargetparametersarebetterthan0.95.Theevaluation

9、resultsindicatethat,theneuralnetworkhasgoodpredictionaccuracy,datageneralizationandapplicationapplicability.Theapplicationprogramcompiledandpackagedbasedontheneuralnetworkcanrealizetherapidevaluationoftargetparameters,reducemanpowerandmaterialresources,andimproveworkefficiency.Keywords:machine learn

10、ing;neural network;acoustic design;parameter prediction;reverberation time;speechintelligibility0 引言声学作为一门广泛的学科,涵盖了听觉与声音的生理、心理、物理和工程等方面,而厅堂建筑是目前承载交流功能的主要建筑形式之一,其声环境质量不仅直接影响人与人之间沟通质量,同时对人们的身心健康发展也起到重要作用。目前,针对建筑声学客观音质参数的预测,主要采用公式法预测1(赛宾公式、伊琳-努特生公式、Arau-Puchades 公式等)和计算机辅助预测两种。但是,传统的公式法预测和计算机辅助预测在实际工作中

11、均存在一定局限性,例如公式法预测的使用虽然简单方便,但是因扩散均匀性、各向同向性、声场漫反射性等不同限制条件,其准确性和适用性已不能满足当下设计和工程的实际需求;而计算机辅助预测方法(如几何声学法、射线跟踪法、有限元法等)虽然能够提供较高的预测准确性和适用性,但是其也存在平台采购成本高、专业技术要求高、建模复杂度高、成果周期长等诸多现实问题。因此,目前需要采取一种成本较低、效率较高、精度较高的预测方法来处理相关工作。近年来,澳大利亚的 Joseph 等人使用神经网络技术对混响时间进行了研究2;马来西亚的 Fathin等人、日本的 Toru 等人使用神经网络技术对教室内的混响时间进行了研究3-4

12、;伊朗的 Mohsen 等人对工业车间的噪声预测进行了研究5;英国的Kendrick 等人对音乐信号中的混响时间参数进行了研究6。由此可见,随着机器学习的新进展7-11,使得采用神经网络处理声学客观音质参数预测任务成为可能。1 原理概述自从抽象的 MP 单层感知机神经元模型发表以来12,神经网络逐渐发展成为一种较为成熟的机器学习算法。其本质是通过参数与激活函数来拟合特征与目标之间的真实函数关系,以此来得到输入变量和输出变量之间的复杂关系。理论证明,两层神经网络可以无限逼近任意连续函数,面对复杂的非线性分类任务,两层神经网络可以得到令人满意的结果13。Rumelhar 和 Hinton 等人提出

13、了一种按照误差逆向传播算法训练的反向传播(Backpropagation)多层前馈神经网络14,解决了两层神经网络所需要的复杂计算量问题15。图 1 是一个神经网络结构的示例。Yx1f1f2f3fmx2xnyInput layerHidden layerOutputlayerOutput图 1 神经网络结构示意图因为神经网络具有良好的预测精度和高效的学习能力,可以处理包括自然语言处理 NLP、计算机视觉 CV、数据拟合 FF 等工作,已广泛应用于金融、医学、工业、新一代网络技术、大数据、软件与信息服务等领域。2 研究方案及数据处理本研究采用以下技术方案。首先对目标建筑的室内特征参数和目标音质参

14、数进行提取,建立起室内特征参数与目标音质参数之间的关系模型;其次,通过声学仿真平台对关系模型进行仿真模拟,建立音质参数的数值矩阵训练样本数据库;然后搭建训练神经网络对该模型进行数据拟合训练,以实现对目标参数的预测;最后对训练结果的均方误差、误差分布及回归系数进行评估,确定该神经网络在室内音质参数预测中的效果。2.1 数据收集和预处理因建筑的形式和风格具有极大的开放性,为便于研究顺利进行,本文选取较为常规的鞋盒型厅堂168中国测试2024年2月建筑进行数据收集,旨在能够覆盖教室、会议室、多功能厅等生活中接触面较广的建筑形式。建筑尺度选择覆盖范围为长度 8.019.9m,宽度 7.014.9m,高

15、度 2.84.4m。所选建筑尺度能够覆盖大部分工作生活中的常见声环境。在控制背景噪声的情况下,建筑室内与混响时间、语言清晰度高度相关的特征主要是各界面的吸声系数,因此对目标建筑的室内特征参数主要针对各界面进行提取,选择了建筑的长、宽、高几何尺寸,以及前后墙、左右墙、天花面、地面、门廊、窗户以及其他等室内界面的吸声量,共计 10 项建筑参数作为典型特征值。特征值主要考察各界面的吸声系数,具体的声学参数采用声学手册中典型材料16参数进行赋值。建筑参数典型特征值统计表如表 1 所示。表 1 建筑参数典型特征值统计表(以 500 Hz 混响时间模型为例)项目最大值最小值平均值标准差长/m19.908.

16、0014.034.12宽/m14.907.0010.882.51高/m4.402.803.680.56A前后墙/m283.900.3017.2421.23A左右墙/m2122.400.3022.4729.01A天花面/m2158.600.6024.0332.28A地面/m289.000.6013.9116.48A门廊/m24.600.000.770.77A窗户/m227.800.102.573.57A其他/m26.700.101.101.06数据收集采用 OdeonCombined 模拟平台进行。参数选择 500Hz 混响时间、1000Hz 混响时间和语言传输指数 STI 等 3 项具有代表性

17、的指标作为目标参数。数据预处理中,为了确定总体训练规模,建立了 11 组共计 800 个计算机仿真模型,每组模型均根据厅堂建筑预设的实际情况进行环境参数设定:温度设定 20、本底噪声设定 NR25、相对湿度设定 50%、声源点设定、听音点设定、典型材料设定等。这 800 个建筑模型的数据集,其变量值主要是特征参数数值的不同,获得的方法主要是改变建筑的几何尺寸和室内陈设的布置,通过不同特征的面积乘以对应频率吸声系数得到不同频率下的吸声量。基于此,针对 3 项目标参数分别采得供神经网络训练的样本数据 800 个,共计 2400 个。为了获得较可靠的混响时间和语言传输指数预测结果,本研究还对训练数据

18、进行了统计分析,排除了干扰系数较大的极值和奇异值,以尽量减少异常值对结果的影响。2.2 神经网络模型数据收集和预处理完成后,对于每个目标参数的训练模型,本文评估了不同的网络结构和参数设置,确定了比较合适的模型。2.2.1网络结构与算法神经网络通常由一个输入层、一个或多个隐藏层和一个输出层组成。本研究的输入层由与房间相关的上述 10 项特征参数组成;输出层由 1 个节点组成,用于预测某项特定目标参数。输入层接收训练特征数值矩阵 A8001,输出层产生对目标参数的预测数值矩阵 B11。研究通过 Matlab 平台,采用基于机器学习的神经网络对每组目标参数的数据集进行拟合训练。因为数据量不大,所以训

19、练网络采用了 1 层 10 个节点的输入层,1 层 14 个节点的隐藏层,1 层单节点的输出层的结构。神经网络选用多层感知机(MLP)的 BP 反向传播监督学习算法对预处理后的数据进行拟合,以探索预测问题中的复杂关系,可根据期望输出与网络实际输出的差值来调整网络中节点之间的连接权重。该算法不断重复,直到连接的权重得到优化,使网络能够较准确地预测给定建筑室内的混响时间和语言传输指数。2.2.2训练参数与评价标准使用网格搜索和交叉验证等方法确定隐藏层数量和节点数量等重要参数的最优组合,以提高预测精度。训练数据集的划分采用随机分配法,将数据划分为 70%训练值、15%验证值、15%测试值,使用非线性

20、最小二乘算法(LM 算法)训练拟合数据。对每次训练的拟合数据效果进行评估,训练效果不好的权重被舍去,训练效果较好的权重被保存待复核验证。针对每个参数经过至少 1000 次的训练效果统计,得到可用于实际预测工作的神经元权重和神经网络算法。本文使用了均方误差 MSE、回归系数、误差分布判定等常用的评价指标,来评估每个模型在混响时间和语言传输指数预测中的性能。根据评价结果,本文确定了最优的模型,并对该模型的应用前景进行了探讨。3 训练结果通过多次训练,得到最终的训练网络详情如表 2所示。回归系数训练结果如图 2 所示。第50卷第2期万宇鹏,等:基于神经网络的声学参数预测方法研究169表 2 训练网络

21、详情训练参数均方误差MSE(训练值)回归系数R(总体)RT(500Hz)/s2.276391029.9564101RT(1000Hz)/s1.053971029.9569101STI5.411331059.9808101均方误差分布训练结果如图 3 所示。可以看出,误差分布呈现明显的正态分布形状。可以看出,目标参数训练结果的 R 值均优于0.95,混响时间参数的训练均方误差小于 0.05s,语言传输指数参数的训练均方误差小于 1.5104,各项均方误差直方图显示了数据波动及分布情况,分布均呈正态分布,正态曲线基本对称,无离群值。结果显示预测模型的拟合效果较好,预测数据与实际数据的相关性较强,预

22、测值与实际值存在较高的正相关性,表明该机器学习的神经网络具有较好的准确性和适用性。12DataFit108642246Target/s(a)500 Hz 混响时间(b)1 000 Hz 混响时间(c)语言传输指数81012DataFit108642246Target/s810DataFit0.30.40.50.60.70.80.90.40.6Target/s0.8Output/sOutput/sOutput/sR=0.995 64R=0.998 08R=0.995 69图 2 训练网络的回归系数 R 值250250200150100500300TrainingValidationTestZer

23、o error2001501005000.849 40.749 10.648 70.548 40.448 10.347 70.247 40.147 10.046 720.053 620.1540.254 30.354 60.4550.555 30.655 60.7560.856 30.956 61.0571.0870.995 70.904 80.813 80.722 90.6320.5410.450 10.359 20.268 20.177 30.086 370.004 5650.095 50.186 40.277 40.368 30.459 20.550 20.641 11501005002

24、000.0360.031 820.027 630.023 440.019 250.015 070.010 880.006 690.002 50.001 6850.005 8720.010 060.014 250.018 430.022 620.026 810.0310.035 180.039 37 0.043 56TrainingValidationTestZero errorTrainingValidationTestZero errorInstances/个Instances/个Instances/个Error/sError/sError/s(a)500 Hz 混响时间(b)1 000 H

25、z 混响时间(c)语言传输指数图 3 训练均方误差分布结果4 应用程序的编译和封装为提高该研究的应用价值,将前文训练好的预测神经网络进行编译和封装,开发了可以安装在云端或本地端的 APP 应用程序,方便用户在使用时直接输入建筑基础几何数据和特征数据,即可快速、高效对厅堂建筑的中频混响时间和语言清晰度指标等客观参数进行预测。程序开发界面如图 4 所示。5 实验验证程序经训练、编译、封装、开发完成后,在日常校检工作的案例库中随机选取了 3 个建筑空间:1间极少装修的普通教室(长 10m,宽 7m,高 3.2m),1 间中等装修的会议室(长12.5m,宽8.5m,高3.4m),1 间丰富装修的多功能

26、厅(长 14.5m,宽 10.8m,高4.1m),对该 APP 应用程序的预测性能进行了预测和实测的对比验证,验证结果如表 3 所示。可见,该厅堂建筑声学客观参数预测 APP应用程序可以对常规厅堂建筑的中频混响时间和语图 4 应用程序开发界面170中国测试2024年2月言清晰度指标等客观参数进行初步预测和评价,可一定程度上替代专业、复杂、昂贵、耗时的计算机仿真模拟实验,减少人力物力,提高工作效率。6 结束语总体而言,本研究表明经数据集训练后的该神经网络具备泛化性,能够快速准确地预测限定条件下建筑室内的中频混响时间和语言传输指数。借助该网络开展相关预测工作,不需要昂贵的现场测试设备、模拟仿真软件

27、和专业劳动力,是一种成本效益较高的解决方案;另外,该神经网络可以对项目建设前期声学设计中的快速决策提供支持。但由于该模型的训练量非常有限,尚不具备通用代表性,可能导致神经网络预测结果的不准确性。此外,因为机器学习神经网络算法中神经元之间的权重和连接不容易理解,无法完全消除预测误差,因此对预测结果的评估和准确性验证是必要的。相关研究在提高模型的准确性、减少训练所需的数据量、降低模型的计算复杂度等方面,仍有很大的改进空间。在未来的工作中,可以优化神经网络架构和训练方法,进一步提高预测精度。此外,神经网络在声学中的应用可以扩展到其他领域,如音质预测、降噪和房间声学优化等,这些领域为声学人工智能领域的

28、进一步研究和发展提供了机会。参考文献 朱相栋.观演建筑声学设计进展研究 D.北京:清华大学,2012.ZHU X D.Research on acoustic design development ofperformancebuildingD.Beijing:TsinghuaUniversity,2012.1JOSEPHN,FERGUSF.Thepredictionofreverberationtimeusing neural network analysisJ.Applied Acoustics,1999,58(3):305-325.2FATHIN L Z,ABD K M,SHARIFAH

29、S.Prediction ofclassroomreverberationtimeusingneuralnetworkJ.JournalofPhysicsConferenceSeries,2018,995(1):012028.3MUSLI N Y,TORU O,REIJI T,et al.Investigation thecapabilityofneuralnetworkinpredictingreverberationtimeon classroomJ.International Journal of SustainableConstructionEngineering&Technology

30、,2011,19(1):19-31.4MOHSENA,ROSTAMG,HASSANK,etal.Developmentof a noise prediction model based on advanced fuzzyapproaches in typical industrial workroomsJ.Journal ofResearchinHealthSciences,2014,14(2):157-162.5PKENDRICK,TJCOX,JCHAMBERS,etal.Reverberationtimeparameterextractionfrommusicsignalsusingmac

31、hinelearning techniquesJ.IEEE International Conference onAcoustics,2006,5:880-891.6孙志军,薛磊,许阳明,等.深度学习研究综述 J.计算机应用研究,2012,29(8):2806-2810.SUN Z J,XUE L,XU Y M,et al.Overview of deeplearningJ.ApplicationResearchofComputers,2012,29(8):2806-2810.7刘文芳,韩军,刘艳锋,等.基于机器学习的金属近表面缺陷超声检测方法 J.中国测试,2022,48(1):46-52.

32、LIU W F,HAN J,LIU Y F,et al.Research on ultrasonicdetection method of metal near-surface defect based onmachinelearningJ.ChinaMeasurement&Test,2022,48(1):46-52.8吴建,王红军.基于卷积神经网络的农作物植株干旱检测J.中国测试,2022,48(4):102-109.WUJ,WANGHJ.DroughtdetectionofcropplantsbasedonconvolutionalneuralnetworkJ.ChinaMeasureme

33、nt&Test,2022,48(4):102-109.9关健,王敏.基于深度神经网络和多元损失的说话人识别J.电子测量技术,2019,42(5):39-43.GUAN J,WANG M.Speaker verification based on deeplearningandbeyondtripletlossJ.ElectronicMeasurementTechnology,2019,42(5):39-43.10盛兆亮,高军伟.基于区域统计和 BP 神经网络的车牌识别J.电子测量技术,2019,42(8):78-82.SHENGZL,GAOJW.Licenseplaterecognitionb

34、asedonregional statistics and BP neural networkJ.ElectronicMeasurementTechnology,2019,42(8):78-82.11徐洪学,汪安祺,杜英魁,等.深度学习的基本模型及其应用研究 J.长春师范大学学报,2020,39(12):47-53.XUHX,WANGAQ,DUYK,etal.Thebasicmodelofdeep learning and its applicationJ.Journal of ChangchunNormalUniversity,2020,39(12):47-53.12杨金喜,高洁,孔伯骏,等

35、.基于多模型长短时记忆神经网络的电力负荷预测方法研究 J.机电信息,2018,30:30-31.YANGJX,GAOJ,KONGBJ,etal.Researchonpowerloadforecasting method based on multi-model short-durationmemory neural networkJ.Mechanical and ElectricalInformation,2018,30:30-31.13SIMONH.NeuralNetworks:AComprehensiveFoundation(Second Edition)M.New Jersey:Pren

36、tice HallInternational,1998:161-173.14宋光慧.基于迁移学习与深度卷积特征的图像标注方法研究 D.杭州:浙江大学,2016.SONG G H.Image annotation method based on transferlearning and deep convolutional featureD.Hangzhou:ZhejiangUniversity,2016.15马大猷,沈.声学手册 M.修订版.北京:科学出版社,2004:606612.MADY,SHENH.AcousticmanualM.Revisededition.Beijing:SCIENCEPRESS,2004:606612.16(编辑:徐柳)表 3 预测和实测的对比验证情况项目RT预测值/sRT实测值/sSTI预测值STI实测值普通教室1.41.30.540.52会议室0.670.590.790.74多功能厅0.430.330.810.80第50卷第2期万宇鹏,等:基于神经网络的声学参数预测方法研究171

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服