1、研究综述力展2023年6 月进学第53 卷第2 期面向流体力学的多范式融合研究展望张伟伟1,2,*王旭1寇家庆1西北工业大学航空学院,西安7 10 0 7 22西北工业大学流体力学智能化国际联合研究所,西安7 10 0 7 23亚琛工业大学空气动力学所,德国亚琛52 0 6 2摘要实验观测、理论研究以及数值模拟是包括流体力学在内很多学科的基本研究范式.21世纪以来,大数据驱动下的人工智能成为引领新一轮科技革命和产业变革的重要驱动力,也被称为数据密集型科学研究范式,即第四范式.同样,数据驱动的机器学习方法也成为流体力学的新兴方向,并助推智能流体力学方向的发展.然而,与面向社会依赖“互联网十大数据
2、的数据密集型范式相比,流体力学智能化研究有其特有的背景.例如有限工程样本中产生的海量流动数据,与流动状态、几何边界条件的高维度以及复杂流动固有的高维、跨尺度、随机、非线性特征相比,数据驱动的流体力学研究面临着大数据小样本问题.经典流体力学虽然有三大研究范式,但融合度很低,工程设计师通常只能对不同来源的数据进行拼凑使用或简单修正.多源数据融合一定程度上可缓解单一样本量来源少、建模难,以及低精度样本利用不充分等困境,但仍未能实现基本范式中的理论模型或者专家知识和经验的充分利用.因此,在人工智能技术支撑的第四范式架构下,有机融合实验、理论模型以及数值模拟三大手段,发展“数据十知识”双驱动的流体力学多
3、范式融合方法,成为解决重大实际工程研制问题的迫切需求,也是新时代流体力学学科内涵、特色发展的迫切需求.关键词数据驱动,人工智能,流体力学,智能流体力学,多范式融合中图分类号:V211文献标识码:ADOI:10.6052/1000-0992-22-050收稿日期:2 0 2 2-12-19;录用日期:2 0 2 3-0 3-16;在线出版日期:2 0 2 3-0 4-17E-mail:引用方式:张伟伟,王旭,寇家庆.面向流体力学的多范式融合研究展望.力学进展,2 0 2 3,53(2):433-46 7Zhang W W,Wang X,Kou J Q.Prospects of multi-par
4、adigm fusion methods for fluid mechanics re-search.Advances in Mechanics,2023,53(2):433-4672 0 2 3力学进展版权所有力434展学进20233年第53 卷1引言范式(paradigm)的概念是美国著名科学史学者托马斯库恩(ThomasKuhn 1962)提出的,并在其科学革命的结构(The Structureof Scientific Revolutions)(196 2)著作中系统进行了阐述.库恩指出:“按既定的用法,范式就是一种公认的模型或模式.”本质上讲,范式是一种理论体系和框架,是开展科学研究
5、、建立科学体系、运用科学思想的坐标、参照系与基本方式.牛津百科全书对范式的定义是:“一种科学学派或学科的哲学或理论框架,在这个框架内来制定理论、规律、概念以及所进行的相关实验”对自然现象或科学实验进行观察,通过分析、比较和分类,最后进行概括和归纳的模式,称为第一科学范式.例如,在长期天文观测和分析的基础上,哥白尼提出了日心说,开普勒和伽利略通过进一步的观测和分析证明了日心说的正确性,就属于典型的第一科学范式.孟德尔通过豌豆实验发现了遗传规律、遗传因子的分离规律及遗传因子的自由组合规律,从而成为现代遗传学之父.豌豆杂交实验也是运用第一科学范式开辟研究新方向的典型案例.科学研究的第二范式是在观测现
6、象的基础上,提出猜想并建立一般性的数学模型,再通过实验观测对这一理论模型的正确性进行验证.由Galilei(1914)和Newton(1999)开创的经典物理学,以及2 0 世纪以相对论和量子力学为代表的现代物理学都是第二范式科学框架内的研究成果.他们具有高度的概括性和严谨的逻辑性,是在特定假设下的普遍规律的描述.由于第二范式下的科学问题描述需要依赖代数或微分方程组,复杂问题(如Navier-Stokes(N-S)方程表征的流动)的理论解往往难以获得.随着计算机和计算数学的发展,通过计算机模拟复杂现象的第三科学范式应运而生,计算流体力学、结构有限元以及分子动力学模拟都属于这一研究范式(Ande
7、rson&Wendt 1995,Hartmann&Katz 2004,Rapaport DC&Rapa-portDCR2004).第三范式下发展的各种仿真软件在加速工程研制进程、减少试验成本以及自然灾害的预报等方面发挥了重要作用.还有一些系统由于其固有的复杂性,人们尚未找到其背后的准确数学描述,如生命科学、社会学、经济学、生态环境等等,也包括流体力学中诸如湍流等经典自然科学问题,利用传感器、互联网以及海量存储技术的数据库,结合相关数学算法去研究和预测复杂系统成为2 1世纪以来新的研究范式.图灵奖得主、关系型数据库的鼻祖吉姆格雷2 0 0 7 年1月给世人留下的最后一次演讲“科学方法的革命”,提
8、出将科学研究分为四个范式,依次为实验归纳,模型推演,仿真模拟和数据密集型科学发现(Data-IntensiveScientific Discovery),其中数据密集型科学发现即第四研究范式(Heyetal.2009).基于大数据的机器学习研究,放弃了对因果关系的渴求,而更追求相关关系,即只需知其然,无需知其所以然,这一新的范式颠覆了人类科学研究的思维惯例.2流体力学发展研究范式的简要回顾流体力学学科的出现首先开始于人类在长期的生活和生产实践中的不断探索,通过对复杂流体现象的认识和总结不断地深入,最终形成了流体力学这门学科,早在公元前三百多年,亚里斯多德就已指出古代人用风帆或浆驶船在原理上属于
9、固体与流体之间的相互作用力问题.阿基435张伟伟,王旭,学的多范式融合研究展望皮家大口流体力第2 期米德在公元前二百多年创立了液体平衡理论,奠定了流体静力学的基础.达芬奇和伽利略开展了对运动物体流体阻力的研究(图1),这些基于第一范式所开展的流体力学的研究一直持续到十八世纪值得一提的是,十七世纪哈根等人对阻力的研究和牛顿的经典动力学基本定律及方程的建立,为十八世纪流体力学的创立准备了条件(高高1998).进入十八世纪,流体力学理论快速发展并不断完善。伯努利于十八世纪初发表的流体动力学一书揭开了流体力学理论研究的序幕,数学物理学家欧拉则在该世纪中叶建立了理想不可压缩流体运动的基本方程组,奠定了连
10、续介质流体力学分析的基础.在此之后,理论流体力学研究快速发展,拉格朗日、达朗伯、拉普拉斯等大数学家的卓有成效的工作推动了人们对流体力学本质的认识,基于第二范式的理论流体动力学研究开始进入全面的发展时期(李家春1995).时间进入十九世纪,纳维首先通过在理想流体力学基本方程中增加黏性力项,并由斯托克斯最后得到被称为N-S方程的黏性流体力学基本方程.N-S方程的提出,完善了黏性流体力学的基本框架,成为流体力学领域著名的理论指导方程(Constantin&Foias2020).随后,著名物理学家雷诺在试验条件下发现了黏性流动存在层流、流两种流态,随后推导出雷诺平均N-S(R e y n-olds-A
11、veraged Navier-Stokes,RANS)方程.1904年,普朗特提出著名的边界层理论,结束了长达一个多世纪的流体力学第一、第二范式之争(图2)(Anderson2005).普朗特指出对于高雷诺数的流动,壁面附近存在边界层现象,在该区域中N-S方程可简化为边界层方程,从而求出近似解析解或数值解.边界层理论的提出使得精确地分析在一些很重要实际问题中所出现的黏性流动成为可能.边界层理论的重大意义在于,在人们还不能求解完整的N-S方程以前,解决了流体力学的阻力问题,使人类的飞行至少提前了半个世纪(Schlichting&Gersten 2016,李家春1995).边界层理论是在普朗特丰富
12、的试验研究与高超的理论研究基础上提出的,这是第一范式和第二范式相结合的一次伟大尝试,至此流体力学理论研究与试验技术再次统一,开启了近代流体力学研究的新篇章.紧接着,泰勒研究了激波与端流的扩散形式,以相关性分析和谱分析方法对自已提出的各向同性流理论进行验证与分析.著名航空航天大师冯卡门在普朗特的研究基础上进一步发展,以试验辅助理论分析的手段,提出卡门涡街、流相似性原理等流体力学重要理论(VonKar-man1948,1940).在航空工程方面,他又提出包括机翼的升力面理论、亚声速流近似理论、跨声速相似理论、超声速流细长体理论等一系列重要的理论研究,这些指导性的理论极大地促进了流体力学在航空航天领
13、域的发展与应用.对于这一时期的流体力学发展模式可以概括为,单个范式的力学系统的发展陷入工程应用的瓶颈,需要这一时期的研究者们从总效的角度进行统一安排.由于这一风格的影响,流体力学又回到了生产实践,解决了人类为实现飞行的理想所面临的关键技术问题.同时也推动了流体力学自身的发展,使黏性流动和可压缩流动的理论得到了完善,为2 0 世纪下半叶现代流体力学的发展奠定了基础(李家春1995).随着计算科学的兴起与计算机技术的提升,围绕N-S方程求解出现了有限差分、有限体积、有限元和谱方法等,建立了计算流体力学完整的理论体系,即稳定性理沦、数值误差耗散、色散原理、网格生成和自适应技术、迭代和加速收敛方法等(
14、Hirt&Nichols1981,Klossetal.2012).边界层内外流动(Anderson 2005)图2力436展进学20233年第53 卷图1达芬奇对水流现象的描墓边界层机翼到达二十世纪末期,计算流体力学已经发展成为解决工程流动问题、分析物理现象和发掘流动机理的重要研究手段之一.然而,围绕流模拟等世纪难题所开展的研究依然还未能抵达终点,围绕试验或模拟手段如何开展复杂环境下端流研究又成为摆在流体力学研究者面前的难题,迄今为止,以实验科学、理论科学、计算科学为代表的三大科学研究范式在各自领域都极大地促进了流体力学的蓬勃发展.进入二十一世纪,特别是随着大数据时代的到来,流体力学进入了以数
15、据驱动和人工智能为典型代表的第四范式,数据密集型科学研究范式将为流体力学新理论、新方法、新模型的提出注入新的活力(张伟伟等2 0 2 1,Sekaretal.2019,Fukamietal.2019,Moin&Mahesh 1998,Monaghan 2012,Chen&Doolen 1998).另一方面,第四范式也将为传统范式之间搭建桥梁,为开展流体力学多范式融合研究提供不可多得的舞台与机遇.3楼数据驱动的流体力学第四研究范式及其不足3.1研究背景与目的流体力学是一门经典的工程科学,然而由于流、转换等问题的复杂性,仍有很多基础性和工程应用问题待解决.大数据支撑下的人工智能成为引领新一轮科技革
16、命和产业变革的重要驱动力.在流体力学领域,随着计算流体力学和超级计算机的发展,数值模拟能力得以迅速发展;437张伟伟,王旭,设家上流体力乡的多范式融合研究展望第2 期先进的测量设备与流动显示技术也使得流场精细化测量的水平大幅提升.可以说,流体力学数值仿真和试验所产生的数据是天生的大数据,如何通过人工智能来有效利用这些数据,促进人工智能向流体力学数值计算和数据处理延伸,构建理论、计算和实验间的纽带,缓解甚至替代理论/方法层面对人脑的依赖,促成了智能流体力学这一新的研究方向.智能流体力学旨在通过人工智能方法建立或完善流体力学理论、模型和方法,推动流体力学机理研究和工程应用的智能化.研究方向包括流体
17、力学方程、模型和算法的智能构建,流动信息特征提取、流动结构识别与多源数据融合方法的智能化,以及数据驱动的多学科智能设计、多物理场耦合建模与流动智能控制等方面.下一小节将做简要介绍,详细的介绍可参见文献(张伟伟等2 0 2 1).3.2现有研究现状流体力学计算或试验中所产生的大数据是第四范式科学研究的宝贵财富,如何通过深度神经网络、随机森林、强化学习等机器学习方法来利用这些数据,缓解甚至替代理论和方法层面对人脑的依赖,挖掘新的知识,正是第四研究范式要解决的关键问题.目前为止,数据驱动的第四范式下,流体力学研究主要涵盖流场预测的机器学习、流模型的机器学习、流场特征提取的机器学习、流动控制的机器学习
18、以及气动力建模与代理模型等(张伟伟等2 0 2 1).3.2.1流场预测的机器学习方法采用机器学习方法对样本数据进行学习,构建神经网络映射关系代替原始的偏微分方程,能够快速、高效获得流场分布解,这一手段也被称为机器学习的流场预测.目前,这种研究主要分为两大类,一类是有样本数据驱动的监督学习神经网络方法.Sekar等(2 0 19)提出通过卷积神经网络(Convolution neural network,CNN)对翼型进行参数化,构建以翼型参数、雷诺数、攻角等为输入,流场分布为输出的深度神经网络映射模型,在二维定常层流流场建模中取得了很好的效果,如图3所示.Fukami等(2 0 19)则采用
19、CNN网络实现了高精度流场重构.Hu等(2 0 2 2)提出一种新的卷积算子,改进传统CNN神经网络进行流场预测,并实现了对不同网格密度问题的泛化.另一类是无需样本,物理驱动的神经网络建模方法.这类方法不需要带标签的流场样本数据,直接将物理方程和边界条件融入神经网络的损失函数中,是一种有别于传统计算流体力学(Computational FluidDynamics,CFD)方法的数值模拟新方法.物理信息神经网络(Physics In-formed NeuralNetwork,PINN)是一种典型的神经网络模型,通过将物理系统的控制偏微分方程以及相应的初始和边界条件作为惩罚项加入到损失函数,PIN
20、N可以灵活地处理涉及偏微分方程的一系列正问题和反问题,例如偏微分方程求解、参数反演、控制优化等,可以实现多种研究范式的融合,得到了广泛应用(Raissietal.2019a).此外,ZhuY等(2 0 19)和Geneva等(2 0 2 0)采用卷积编码一解码神经网络模型对流场信息进行了重构,这是将流场以图像数据的形式作为初始解输入给卷积网络,实现无数据预测.Karumuri等(2 0 2 0)同样基于无样本数据方法,采用深度全连接残差网络求解了二维椭圆型随机偏微分方程.Sun等(2 0 2 0)将这种方法推广到求解参数化的Navier-Stokes方程中,采用深度神经网络对真实的血管流动进行
21、了模拟.Wei等(2 0 19)提出了一种基于深度强化学习技术的流场求解方法(DeepReinforcementLearning solver,D R L力438展学进20233年第53 卷a0.40.48b0.40.480.360.360.20.20.240.2400.1200.1200-0.2-0.20.12-0.12-0.4-0.24-0.4-0.24-0.500.51.01.52.0-0.500.51.01.52.0XXC0.41.08d0.41.080.900.900.20.720.20.720.540.54000.360.36-0.20.18-0.20.1800-0.4-0.4-0
22、.18-0.18-0.500.51.01.52.0-0.500.51.01.52.0XX图3NACA63415翼型流场压力分布和速度分布结果与CFD样本数据结果对比(Re=1900,=7)(a、b:压力场;c、d:速度场;左:CFD样本数据;右:神经网络模型预测结果)(Sekaretal.2019)solver),将控制方程、边界条件和初始条件均引入到网络的损失函数中,实现了从离散求解域的初始随机分布场收敛到稳定的最终解3.2.2流模型的机器学习方法流模型是为了封闭N-S方程中的雷诺应力项而额外补充的方程,主要目的是构建时均流动、空间位置(常用的有壁面距离)与雷诺应力张量或流涡黏之间的数学关系
23、式.随着人工智能时代的到来,数据驱动的机器学习方法在流研究领域蓬勃发展,已经成为流体力学近年来研究的热点.首先机器学习端流建模方法开始于对经典微分方程型流模型的改善,称之为数据驱动的灰箱模型.研究者通过高精度数据来减小RANS模型计算的偏差,或者使之能够用于分离流的计算.其研究思路大致有两种,包括对经典微分方程型端流模型的改善,以及直接构建数据驱动的黑箱模型.经典模型的改善方面,一种思路是通过改变模型的控制方程形式,如乘以修正系数或给方程增加源项.例如,Tracey等(2 0 15)针对二维及三维流动,构建了替代Spalart-All-maras(SA)模型控制方程中源项的神经网络模型;Zha
24、ng等(2 0 15)、Duraisamy等(2 0 15)和Singh等(2 0 17 a)针对修正系数分布或附加源项建立数据驱动模型,改善了原RANS模型的计算精度.张亦知等(2 0 2 0)发展了物理知识约束的湍流模型数据驱动修正方法,并用于槽道湍流的计算模拟.另一种思路是在RANS模型基础上构造偏差函数,然后将RANS模型和偏差函数的计算结果叠加作为最终的雷诺应力值.例如,Wang等(2 0 17)针对RANS模型计算结果和高分辨率数据之间的雷诺应力偏差进行建模,提高了原有模型的准确性,与直接数值模拟(Direct nu-mericalsimulation,DNS)求解的对比结果如图4
25、所示.随着深度学习方法的发展,一些黑箱模型也开始初出现以替代经典微分形式的流模型.Ling等(2 0 16)和Kutz(2017)基于Pope推导的439第2 期张伟伟,王旭,面向流体力学的多范式融合研究展望一基准模型一预测结果-DNS3.02.52.0工1.51.00.500246810/H;20Try/U+/H图4机器学习端流模型预测周期山算例壁面瑞流剪切应力分布(Wangetal.2017)基张量和不变量构建了雷诺应力各向异性的张量基神经网络模型(TensorBasis Neural Network,TBNN).该模型可以刻画二次流中的旋涡结构和波形壁中的分离现象.ZhuL等(2 0 1
26、9)采用径向基函数(RadialBasis Function,R BF)神经网络,发展了直接构建纯数据驱动的流黑箱代数模型,并成功实现了模型与N-S方程之间的耦合求解.此外,还有许多先进的机器学习方法也开始被应用于模型化大涡模拟(LargeEddySimulation,LES)中的湍流相关变量和用于描述和量化传统流模型计算结果的不确定度(Xieetal.2019,Zhouetal.2019,Ed e li n g e t a l.2 0 14,C h-eung&Olive2011,Xi a o e t a l.2 0 17).机器学习在端流建模领域的应用可参考图5.3.2.3流场特征提取的机器
27、学习方法流场特征提取方法能够准确分析复杂流体的动力学特征,从海量的流动数据中提取主要信息更容易理解流动行为,进而建立数据驱动的流动演化模型.机器学习的非线性特征提取可以通过神经网络直接学习,即构建一个自编码器实现流动快照的自映射.这种方法的降维是通过神经网络隐含层中仅采用少量神经元而实现的.这种思路最早由Milano和Koumoutsakos用于近壁面湍流的建模中(Milano&Koumoutsakos2002).近年来随着深度学习的发展,基于深度神经网络的特征提取和降维方法再次得到关注并开始用于流体力学问题(Murataetal.2020).Huang等(2 0 19)利用深度神经网络构建了
28、数据驱动的火焰演化过程预测模型,通过二维流场得到了三维结构.Omata等(2 0 19)通过深度神经网络发展了针对非定常流动的降阶方法,实现了非定常流场的空间结构随时间变化的预测.Fukami等(2 0 2 0)研究了基于卷积神经网络的分层自编码器方法在流场降阶中的应用,利用该方法可以有效地将流流场映射到潜在的低维空间.Cai等(蔡声泽等2 0 19,Cai S2019)通过神经网络研究了PIV(Pa r t i c l e Ima g e Ve l o c i me t r y)数据中的粒子运动预测方法.Li等(2 0 2 0)利用机器学习方法获取了具备湍流区域划分的流场特征检测器,并在圆柱
29、绕流中取得较好的特征识别效果(图6 所示).3.2.4流动控制的机器学习方法主动流动控制(ActiveFlowControl,A FC),特别是闭环控制,是一个极具挑战性和实际意义的问题,应用在许多领域(任峰等2 0 2 1).随着第四范式的发展,在神经网络模型控制方面,Lee等(1997)开创了神经网络在端流闭环控制的探索.Kawthar-Ali等(1996)开发了一种神经网力440展20233年第5 3 卷进学获取数据集不确定度改善或替换重构LES分析RANS模型亚格子模型特征构建标度率数据预处理与选取量纲分析建立模型确定模型框架数据后处理优化模型参数雷诺应力约束模型预测耦合求解器?是否稳
30、定性及收敛性分析模型评估图5机器学习应用于端流建模的主要研究方向及流程(张伟伟等2 0 2 1)at=OD/Ubt=1.0D/Uc t=2.0D/Udt=3.0D/Uet=4.0D/Uft=5.0D/Ug t=6.0D/Uh t=7.0D/U图6不同流场快照下机器学习方法的端流区域识别结果对比(LiBetal.2020)络控制器,用于抑制俯仰翼型前缘周期性发展的动态失速涡.近期,Ren等(2 0 2 0)基于径向基函数神经网络,提出一种数据驱动的跨声速翼型抖振自适应控制方法,结果表明,这种控制方法可以在很大的流动范围内完全抑制跨声速抖振载荷.Duriez等(2 0 14,2 0 17)和Gau
31、tier等(2 0 15)最先将遗传编程方法(图7 所示)用于实验中的后台阶流动的控制,使再循环区域缩小了8 0%,并且在一定范围内增加或减少雷诺数.近些年来,随着强化学习(Reinforcement Learning,R L)的不断发展,强化学习已成为越来越多领域中解决问题的基本模式.Rabault等(2 0 19)利用最新的深度强化学习方法,即近端策略优化(PPO),实现了圆柱流动减阻的闭环控制.Ren等(2 0 2 1)还441第2 期张伟伟,王旭式融合研究展望动态系统Jda=F(a,b)dts=G(a)S控制律b=K(s)S1遗传编程JiJi.JNelitismbi=Ki(s)Jibi
32、+1=Ki+(s)b2=K3(s)J2tournamentcrossoverb2+1=K3+1(sreplicationbl=Ki(s)-JimutationbR:=KA:(s)-JK:bt=Kt(s)generation jgeneration j+1图7基于遗传编程的无模型智能化控制设计思路各(Duriez et al.2017)提出采用闭环控制系统实现钝体流动控制,并借助深度强化学习实现流动自适应控制,成功将流向和展向载荷消除,流场控制结果如图8 所示3.2.5气动力建模与代理模型的机器学习方法气动力建模与代理模型构建是第四范式应用的成功范例,也是目前机器学习方法在流体力学研究中应用最为
33、广泛的方向.非定常气动力建模是气动弹性力学研究的重要内容和关键技术经典模型诸如基于线化势流理论的Wagner模型、Theodorsen模型等,能够快速预测气动力,但精度较差;数据驱动的气动力模型通常基于模态坐标,获取强迫运动的模态位移-广义气动力数据,利用系统辨识方法训练一个能够描述从运动状态到广义非定常气动力的动态模型,如Vol-terra级数和差分动力学模型(Silva1993,Co w a n e t a l.2 0 0 1).为了模拟大振幅运动下气动力的非线性非定常特性,进一步发展了BP(Ba c k Pr o p a g a t i o n)神经网络、RBF回归神经网络、分层模型、混
34、合模型、支持向量机等方法(王超等2 0 19,Zhangetal.2012,Kou&Zhang2017a,Kou&Zhang2019,何磊等2 0 19,Kou&Zhang2018).为了提高非线性模型在不同流动或外形力442展学进2023年第53 卷1.50-1.5051015a无控制1.50-1.5051015b深度强化学习控制图8层流状态下圆柱流动控制结果(Renetal.2021)参数下的泛化能力,提出了变马赫数模型,如递归神经网络、多核神经网络、模糊神经网络、长短时记忆网络(Long Short-Term Memory neural network,LSTM)等(Kou&Zhang2
35、018,Kou&Zhang 2017b,Winter&Breitsamter 2016,LiK et al.2019,LiW et al.2020).为了适应模态振型的变化,提出了适用于任意振型的气动力模型(WangZetal.2018a).所发展的降阶模型,特别是动态线性模型十分便于复杂流固耦合动力学机理的研究,如跨声速抖振锁频机理与控制率的设计(Gaoetal.2017a,2 0 17 b).可见,非定常气动力建模不仅仅是流体力学的工作,同时也很大程度上推动了气动弹性力学的发展.定常气动力代理模型现在则广泛应用于气动优化问题,凭借大数据特性通过抽样方法建立在设计空间内与CFD等效的近似代理
36、模型,然后通过全局优化算法调用该近似的代理模型进行气动外形优化设计.目前,各种各样的代理模型应用于气动形状优化,例如,Kriging模型、神经网络、多项式响应面、支持向量机、本征正交分解等(Jouhaud etal.2007,Wang H et al.2010,Han Z H et al.2012,Jahangirian&Shahrokhi 2011,熊俊涛等2006,Andrs et al.2012,Iuliano&Quagliarella 2013,DuanYet al.2012).随着深度学习的快速发展,越来越多的机器学习方法开始应用于气动优化领域,为代理模型构建提供了新的思路。3.3第
37、四范式的不足数据驱动的流体力学研究若脱离学科的内涵和特点,直接照搬数据密集型研究范式,将会存在明显的不足(赵凯琳等2 0 2 1.例如,瑞流机器学习方面,在时均流动特征对雷诺应力的映射中,一个脱离流动物理属性的神经网络特征选择和架构设计,即使在学习集中表现不错,但在模型泛化性和耦合计算中暴露的问题常常会让初学者对此方向丧失信心.在复杂流场的重构方面,照搬机器学习中常用的针对图像处理的卷积神经网络,在笛卡尔均匀网格上开展流动建模工作,因为像素型均匀网格势必会造成边界几何信息的缺失,很难准确表征近壁区流场细节和物面载荷分布特征,从而失去了重要的工程应用价值.将不同时刻的非定常流动切片按图像来处理,
38、却不关注流动的时滞记忆效应,或者在空间分布特征构建中,采用长短时记忆网络来进行空间切片443张伟伟,王旭,式融合研究展望上第2 期信息的关联,此类工作都是典型脱离流动物理特征的示例.在流动主动控制方面,当控制手段确定的情况下,是否有必要采用强化学习这种适用于决策模型复杂但优劣容易评判的学习方法,其用于控制律的寻优代价,相比于传统控制或无模型自适应控制要高1 2 个数量级以上.因此,将第四范式引入流体力学的研究中,若脱离流体力学知识,脱离研究对象的实际需求以及传统方法的短板,盲目开展跟风式研究,既缺乏理论意义,也没有工程应用价值.4面向流体力学的多范式融合思考4.1多范式融合研究的定义实际上第四
39、范式的成功是高度依赖密集型数据集和强大的机器学习算力的,由于工程实际中的复杂流动研究常常面临着小样本学习的困境.在这种情况下,少量数据支撑下的模型的泛化性是纯数据驱动流体力学模型的最大短板,脱离物理支撑的黑箱模型通常泛化性较低,不具备应用价值.另一方面,模型的性能对研究者的模型架构设计经验依赖性很强,通常知其然,而不知其所以然,缺乏信任性和解释性.因此,数据驱动的流体力学面临着这样的困境,即在缺乏工程流动大数据集的情况下,如何提高模型的泛化性、鲁棒性和工程应用价值,以及实现这一目标的理论依据及其可解释性,而不是试凑获得的经验.针对上面的困境,我们不难发现,如何将实验科学、理论科学以及数值科学三
40、个范式与第四科学范式有机结合,发展“数据十知识”的双驱动模式,成为解决小样本学习、轻量化学习以及提高模型泛化性和鲁棒性的重要思路.当单一来源的数据不足以支撑模型的构建时,包括计算和实验、分布信息和集中测力信息等多种来源异构的信息如何有效综合利用,即多源异构数据的融合是解决上述困境的一个途径.另一方面,流体力学积累的理论成果和工程模型等知识如何有机融入机器学习架构,去弥补深度学习模型因样本稀疏造成的过拟合问题.因此,如何将实验观测数据、理论和工程模型以及数值方法等多种数据来源、多种研究途径和第四科学范式高度融合,发展“数据十知识”双驱动的多范式融合理论与方法,成为解决单纯数据驱动的流体力学研究面
41、临困境的明确方向。4.2经典研究范式的融合实践在多范式融合的思路下,我们梳理了流体力学学科发展中的一些典型案例(图9所示),既包括传统研究范式的结合,也包括以第四范式为主体的框架下多种研究范式的结合,典型的一些范式融合案例如下:+:流的发现、RANS方程以及经典雷诺应力封闭模型的构建是典型实验和理论分析有机结合的研究范式.18 8 3年雷诺通过圆管实验发现了流动中存在层流和端流两种不同状态,并采用时间平均方法建立了不可压雷诺平均Navier-Stokes方程,打开了流体力学中端流研究的大门,但对于方程中出现的雷诺应力项,没有给出使其封闭的湍流模式,无法对方程进行求解.直到192 5年,普朗特结
42、合理论推导、量纲分析以及实验测量等手段提出了基于混合长理论的代数型流模型,首次解决了雷诺应力项的封闭问题,为端流研究从理论分析到数值计算奠定了基石力444展进学20233年第53 卷经典研究范式融合试验科学01第一范式+数据密集型科04学第四范式第四范式主导的研究范式融合+理论科学计算科学0203+(3+第二范式第三范式2+3+(4图9多范式融合的研究脉络在端流模型方面,传统的RANS方法可以分为两大类,一类是基于涡黏假设的一阶矩模型,另一类是雷诺应力模型.一阶矩模型包括零方程代数模型,如Cebeci-Smith(CS)模型和Baldwin-Lomax(BL)模型,以及基于偏微分方程形式的一方
43、程/两方程模型,包括代表性的SA模型、k-c模型、k-o模型以及Menter的SST两方程模型等(Baldwin&Lomax1978,Sp a l a r t&A l l m a r a s1992,Jones&Launder 1972,Shih et al.1995,Jones&Launder 1973,Wilcox&Traci 1976,Robinsonetal.1995,M e n t e r 1994,M e n t e r&R u m s e y 1994).传统的一阶矩流模型虽然在工程领域得到了广泛应用,但仅在小攻角、附着流主导的流动中有较准确的预测能力;而对于大攻角、分离流以及漩
44、涡主导的流动,计算精度往往并不可靠.相对于一阶矩流封闭模式,二阶矩模式则直接建立精确的雷诺应力输运方程,具有较高的端流计算精度(Battenetal.1999,Chaouat2006).然而,该模型需要对雷诺应力的六个分量分别建立输运方程,而且N-S方程的非线性导致在输运方程中又会出现更高阶的应力项需要进行封闭,因此,计算量很大,而且二阶矩的雷诺应力模型鲁棒性比一阶矩模型更差,目前并没有被广泛应用于解决航空航天工程问题,仍然处于不断发展、改进之中。现今,工程中广泛采用的经典偏微分方程形式的流模型,是在理论推导的基础上,通过少量实验来标定模型中的一些待定参数的半经验半理论流模型,是典型的第一范式
45、和第二范式融合而来的模型.经过流体力学研究者的不懈努力,传统的流封闭模式在应用层面取得了巨大的成就,但对于RANS方程中雷诺应力的准确模化这一核心难题,至今并未得到很好的解决.+/:数据同化指的是通过一系列算法,实现数值计算(或理论预测)数据与试验数据的一致性,是典型的第一范式(实验)与第二(理论)/第三范式(计算)的融合(Kutz 2013).若要考虑到CFD本身是建立在理论方程和模型架构基础上的数值求解,基于CFD的数据同化也可以理解为前三个范式融合的典范.其过程是利用有限且稀疏的试验数据,通过修正CFD计算中物理模型参数或者边界条件,使计算预测数据在逼近试验测量数据(如升力,阻力,压力测
46、量数据)、提升精准度的同时,使得试验条件下难以测量的数据(如复杂的流动组合参数)在计算环445第2 期张伟伟,王旭,面向流体力学的多范式融合研究展望设家大境中得到高可信度重构.借助于数据同化手段,研究中可以实现数值方法或模型的有效修正,在不增加测量成本的同时重构整个试验流场,更好地挖掘流场蕴含的物理信息:因此,数据同化成为复杂流动机器学习数据来源的新模式.目前数据同化的典型方法包括卡尔曼滤波、伴随方法等无模型的算法以及本征正交分解(Proper Orthogonal Decomposition,PO D)等基于数据特征提取的降维优化方法,应用在定常流场重构及涡黏场重构,端流模型参数估计,以及非
47、定常流场重构等问题(Kato et al.2015,Deng et al.2018,Mons et al.2017,Venturi&Karniadakis 2004)其中,Kato等(Kato et al.2015)考虑了风洞实验中马赫数、攻角以及数值模拟中湍流模型选择的不确定性,使用数据同化方法重新估计了攻角、马赫数和流黏度,得到的结果消除了标准计算结果与实验结果之间的差异.Mons等(Monsetal.2017)使用变分数据同化(VariationalDataAssimilation,VD A)方法处理低雷诺数圆柱绕流问题,根据有限PIV测量修正圆柱转速及初始条件.Deng等(Denget
48、al.2018)利用基于EnKF的数据同化方法,通过优化RANS模型中的常数,从局部测量数据中恢复了全局流场.Renganathan等(2 0 2 0)考虑了翼型与机翼的CFD压力分布与风洞试验测量值的不确定融合,建立贝叶斯框架下的气动力真实值的不确定估计.Mif-sud等(2 0 19)通过GappyPOD结合风洞试验和CFD计算数据构建了针对二维翼型和三维翼身组合体的数据融合模型,利用正则化方法提升了模型的预测精度.赵旋等(2 0 2 2)提出了通过压缩感知算法和POD基于翼型表面稀疏测量点数据重构翼型表面完整压力分布的方法,重构流程如图10 所示.Sun等(2 0 18)开发了一种快速风
49、场重建方法,提出了一种传感器布局优化求解过程的方法,基于传感器获得的有限的实验测量数据,通过本征正交分解技术对风场进行逆过程快速重构.+:计算流体力学(CFD)通过计算机和数值方法来求解流体力学的控制方程,对流体力学问题进行模拟和分析,是一种典型的第二范式(理论推导)与第三范式(数值方法)相结合的研究手段.结合物理守恒律和流的简化处理手段,研究者发展了三种典型的模拟方法,包括直接数值模拟(DNS)、大涡模拟(LES)、雷诺时均模拟(Baldwin&Lomax1978,Pi o me l l i 1999,Alfonsi2009).为求解上述方程,研究者提出了不同的数值格式,如有限差分,有限体积
50、,有限元等.计算流体力学对揭示复杂流动的物理机理和工程优化设计提供了模拟手段,逐渐成为航空航天、船舶海洋、能源化工等领域的重要工具.由于传统CFD依赖流体连续介质假设,受经典力学框架的理论约束,从粒子和统计力学角度出发,研究者相继发展了粒子法、格子玻尔兹曼等方法,从粒子和介观尺度对流体力学进行模拟(Monaghan2012,Ch e n D o o l e n 1998).尽管取得了一定进展,上述方法在工程应用上的复杂几何外形和高雷诺数问题仍存在一定挑战.4.3第四范式主导下的多范式融合现状+:在第一范式下产生的海量数据一直以来都是流体力学研究的重要支撑,随着第四范式数据密集型科学的快速发展,