收藏 分销(赏)

物理信息编码解码卷积长短期记忆网络求解时变偏微分方程.pdf

上传人:自信****多点 文档编号:3538190 上传时间:2024-07-09 格式:PDF 页数:9 大小:2.08MB
下载 相关 举报
物理信息编码解码卷积长短期记忆网络求解时变偏微分方程.pdf_第1页
第1页 / 共9页
物理信息编码解码卷积长短期记忆网络求解时变偏微分方程.pdf_第2页
第2页 / 共9页
物理信息编码解码卷积长短期记忆网络求解时变偏微分方程.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Advances in Applied Mathematics 应用数学进展应用数学进展,2024,13(2),714-722 Published Online February 2024 in Hans.https:/www.hanspub.org/journal/aam https:/doi.org/10.12677/aam.2024.132069 文章引用文章引用:辛江涛,贾宏恩,牛瑞萍.物理信息编码解码卷积长短期记忆网络求解时变偏微分方程J.应用数学进展,2024,13(2):714-722.DOI:10.12677/aam.2024.132069 物理信息编码解码物理信息编码解码卷积

2、长短期记忆网络卷积长短期记忆网络 求解求解时变偏微分方程时变偏微分方程 辛江涛,贾宏恩,牛瑞萍辛江涛,贾宏恩,牛瑞萍*太原理工大学数学学院,山西 太原 收稿日期:2024年1月28日;录用日期:2024年2月22日;发布日期:2024年2月29日 摘摘 要要 本文基于本文基于ConvLSTM,构建了一种编码,构建了一种编码解码的物理信息深度学习网络框架解码的物理信息深度学习网络框架(PIED-Net),用于求解含时,用于求解含时域的偏微分方程。首先,域的偏微分方程。首先,PIED-Net基于基于卷积网络提取卷积网络提取图像信息中不同层次的空间特征,并使用转置卷积图像信息中不同层次的空间特征,并

3、使用转置卷积对对提取的提取的特征进行表达特征进行表达,实现从,实现从图像中图像中学习学习物理物理约束约束的空间信息。为了保证时域信息的连续性,的空间信息。为了保证时域信息的连续性,PIED-Net采用采用ConvLSTM模块,有效地捕捉输入序列的时序模块,有效地捕捉输入序列的时序关系关系,提高在预测时间步骤中网络的精度提高在预测时间步骤中网络的精度。其次,控。其次,控制方程、边界和初始条件制方程、边界和初始条件被用来构建损失函数,并利用被用来构建损失函数,并利用有限差分方法来有限差分方法来计算各阶导数计算各阶导数,进一步提高网络,进一步提高网络的准确性和稳定性。最后,的准确性和稳定性。最后,将

4、将所提出的所提出的PIED-Net网络框架网络框架用来用来求解求解2D Burgers方程和方程和2Dflowmixing方方程。数值实验结果表明,该网络框架程。数值实验结果表明,该网络框架在求解含时域的偏微分方程方面具有出色的精度和运算效率。这为在求解含时域的偏微分方程方面具有出色的精度和运算效率。这为利用深度学习方法解决物理问题提供了一种新的途径。利用深度学习方法解决物理问题提供了一种新的途径。关键词关键词 卷积,转置卷积,卷积,转置卷积,ConvLSTM,物理信息网络,有限差分,物理信息网络,有限差分 Physics-Informed Encoder-Decoder Network Ba

5、sed on ConvLSTM for Solving Time-Dependent Partial Differential Equations Jiangtao Xin,Hongen Jia,Ruiping Niu*School of Mathematics,Taiyuan University of Technology,Taiyuan Shanxi Received:Jan.28th,2024;accepted:Feb.22nd,2024;published:Feb.29th,2024 *通讯作者。辛江涛 等 DOI:10.12677/aam.2024.132069 715 应用数学进

6、展 Abstract This article presents PIED-Net,a deep learning network framework based on ConvLSTM,for solving time-domain partial differential equations.First,convolutional networks are used to extract spatial features at different levels from image data and transpose convolutions are used to represent

7、these features,enabling the learning of spatial information constrained by physics.ConvLSTM modules are utilized to effectively capture the temporal relationships of neighboring sequences to maintain temporal continuity,and enhance the accuracy of the network in predicting time steps.Besides,governi

8、ng equations,boundary and initial conditions are employed to construct the loss function,and the finite difference method is employed to calculate derivatives of various orders,further en-hancing the accuracy and stability of the network.Finally,the proposed PIED-Net framework is ap-plied to solve 2

9、D Burgers and 2D flow mixing equations,respectively.Numerical experimental re-sults demonstrate that this network framework exhibits outstanding accuracy and computational efficiency in solving time-dependent partial differential equations,presenting a new deep-learning approach for physical problem

10、s.Keywords Convolution,Transposed Convolution,ConvLSTM,Physics Informed Network,Finite Difference Copyright 2024 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 正如 Raiss

11、i 等人1所述,将神经网络与物理定律相结合,实现物理驱动的偏微分方程求解,这一创新的方法为解决实际工程中复杂问题提供了全新的途径。Zang 等人2利用弱形式将高维线性和非线性偏微分方程转化为算子范数最小化问题,并通过原始和对抗网络的交替更新来逼近最优网络参数,这种方法在解决高维 PDE 问题时,具有快速、稳定和无网格的特点。Weinan 等人3提出深度 Ritz 方法,用于数值解决变分问题,该方法具有自然的非线性性和自适应性,并且在高维情况下具有很好的适用性。Sirignano等人4提出了一种名为深度Galerkin方法(DGM)的算法,通过深度神经网络逼近高维PDE的解,并在无网格的情况下成

12、功解决了自由边界 PDE 和其他高维 PDE 问题。Lyu 等人5提出深度混合残差(MIM)算法,将高阶 PDE 重写为一阶系统,并使用 PDE 残差作为最小二乘损失函数。Sun 6在他的研究中采用深度算子神经网络(DeepONet),并借鉴 PINN 的思想,基于物理信息约束提高训练的效率和灵活性。Cao 等人7提出了一种改进的自适应 PINN 方法,将长时域分解为短时域,并采集不同初始条件下的数值解进行训练,解决了复杂非线性系统的预测和长时间范围稳定预测,并通过构建自适应权重进一步提高预测精度。然而,这些研究大多基于全连接或其改进的网络结构,没有考虑样本点间的空间关系。因此,研究人员开始关

13、注如何利用卷积网络结构来引入空间信息,从而提高深度学习网络求解偏微分方程的精度和稳定性。Long 等人8提出了一种新型的深度神经网络 PDE-Net 2.0,通过结合数值逼近和符号算子,利用观察到的动态数据来发现由偏微分方程控制的隐藏信息,并在建模潜在机制方面提供了灵活性和表达能力。Mo 等人9提出了一种深度卷积编码器解码器神经网络方法,通过图像到图像的回归策略,有Open AccessOpen Access辛江涛 等 DOI:10.12677/aam.2024.132069 716 应用数学进展 效量化不确定问题,克服了维度灾难挑战。Zhu 等人10提出了一种基于贝叶斯方法的卷积神经网络,通

14、过将基于 Stein 方法的变分梯度下降算法扩展到深度卷积网络中,实现对数百万个不确定网络参数的近似贝叶斯推断,在论文11中通过将控制方程纳入损失函数中,实现了在小数据情况下对 PDE 系统进行代理建模和不确定性量化,同时满足问题约束。Gao 等人12提出了一种新颖的物理约束 CNN 学习架构,通过引入椭圆坐标映射实现不规则域上参数化 PDE 问题的解决,相较于全连接神经网络(FC-NN)的PINN,在效率和准确性上表现出明显的优势。Geneva 等人13提出了一种基于物理约束的深度学习方法,通过自回归稠密编码器解码器卷积神经网络,在计算成本较低的情况下解决和建模非线性动力系统,并实现了对预测

15、量的不确定性量化。此外,鉴于 LSTM 处理序列问题时的优异表现,研究人员提出 ConvLSTM,通过结合卷积和 LSTM(长短期记忆)的特性,能够更高效地建模时空依赖关系。Shi 等人14将降水预测问题转化为一个时空序列预测问题,通过引入卷积结构来扩展全连接 LSTM,提出了 ConvLSTM 模型,证明了 ConvLSTM 在捕捉时空相关性方面表现更优。Rao 等人15开发了一种名为 PeRCNN 的新型深度学习架构,通过强制编码已知的物理知识,实现对非线性时空动力系统的数据驱动建模,在数据噪声和稀缺性方面表现出显著的鲁棒性和泛化能力。Ren 等人16提出了一种基于物理信息的卷积循环学习架

16、构,用于低维空间特征提取和时间演化,通过将 I/BCs 硬编码到网络中来强制满足周期边界填充,将损失函数定义为聚合离散化 PDE残差来进行学习。Mavi 等人17提出了一种无监督卷积神经网络架构,采用非局部交互作用解决偏微分方程问题,其中将非局部周期性动态算子固定为卷积核用于导数的计算,提高了其预测能力,具有优越的训练性能和外推能力。因此,本文提出一种物理信息编码解码卷积长短期记忆网络来求解偏微分方程。该网络采用物理信息约束构建损失函数,降低网络对于样本数量和质量的依赖。此外,在空间上,基于卷积神经网络(CNN)构建编码器和解码器,因此保留了样本点之间的空间信息,能够更精确地捕捉不同层次的物理

17、信息。时间上,采用 ConvLSTM 更好地刻画时间步进过程中不同时刻的解的相互依赖关系,并且有效防止梯度消失和梯度爆炸,保证网络可以进行长时间预测。2.网络架构网络架构 首先,本文基于编码/解码技术构建了一个分别包含三个卷积核的编码器和解码器来捕获空间中的场信息,如图 1 所示。其中:1)编码器将输入图像转化为低维度的表示,提取出输入图像中的不同层次特征,降低数据的维度和冗余,其采用卷积神经网络 Conv2D 作为基础,卷积操作使用相同的权重参数对输入的不同位置进行处理,减少了需要学习的参数数量。此外,因其只关注输入中的局部区域,可以捕捉到输入数据的空间局部特征,提高了模型的表达能力;2)解

18、码器将编码器生成的低维度表示转化为原始数据的高维度表示,其采用转置卷积 Conv2DTranspose 作为基本结构,实现对数据的还原和重建,使得模型能够生成更高分辨率的输出。编码器和解码器的计算过程可以表示成:()1Conv2D=iiuu (1)()21Conv2Diiuu=(2)()32Conv2Diiuu=(3)()()1321Conv2DTransposeiiiuuu+=+(4)()()21111Conv2DTransposeiiiuuu+=+(5)辛江涛 等 DOI:10.12677/aam.2024.132069 717 应用数学进展 ()()32111Conv2DTranspos

19、eiiiiuuuu+=+(6)其中,kiu为输入数据经过 k(k=1,2,3)个卷积后的结果,1kiu+为数据经过 k 个转置卷积后的结果,为 ReLU 激活函数。Figure 1.The encoder-decoder network structure 图图 1.编码器解码器网络结构 其次,在上述编码器解码器结构基础上,在每一个卷积核后增加一个 ConvLSTM 来捕捉时间序列中相邻时间解的依赖关系,如图 2 所示。ConvLSTM 结合了卷积操作,能够对空间特征进行有效地学习和提取。与传统 LSTM 相比,ConvLSTM 利用卷积操作的参数共享性质,减少了需要学习的参数数量,提高了模型

20、的效率和泛化能力。ConvLSTM 的计算公式为:()11txithitcitiiWWWb=+(7)()11txfthftcftffWWWb=+(8)()11tanhttxcthtcttcfWibW=+(9)()1txoothcottooWWbW=+(10)()tanhttto=(11)Figure 2.The PIED-Net architecture 图图 2.PIED-Net 的结构 辛江涛 等 DOI:10.12677/aam.2024.132069 718 应用数学进展 图 2 是 PIED-Net 的网络结构,其中 ConvLSTM 模块被引入能够更好地预测序列问题,深度捕捉不同时

21、刻下解之间的关系,这种设计保留了底层信息,有助于网络实现长期预测。具体来说,ConvLSTM模块可以有效地捕获时间序列数据中的长期依赖关系,使得模型能够更好地理解时间序列中的动态变化和趋势。最后,利用自回归方法获取一系列预测值,进而计算网络损失并进行反向调参,以提高模型的准确性和稳定性。3.基于有限差分的卷积核基于有限差分的卷积核 由于卷积操作本身是一个非线性运算,且每个神经元只与局部感受域内的神经元相连,无法像全连接神经网络那样在反向传播中直接获得场变量对空间和时间的梯度。因此,利用有限差分方法计算偏微分方程中的场变量对空间和时间的各阶偏导数。在本文中,基于有限差分方法,推导不同阶偏导数的计

22、算公式(12)(21)及其相对应的卷积核(22)。泰勒展开式的一般形式如下:()()()()()()()()()()22210000002=+fxf xf xfxxxxxOxx (12)由此可得0 xxk=+、0 xk、02xk+、02xk四个点的泰勒展开式:()()()()()()()()()2310023400026fxfxf xkf xfxkkkO k+=+(13)()()()()()()()()()2310023400026fxfxf xkf xfxkkkO k=+(14)()()()()()()()()()2310023400048226fxfxf xkf xfxkkkO k+=+(

23、15)()()()()()()()()()2310023400048226fxfxf xkf xfxkkkO k=+(16)将方程(13)与(14)相减,方程(15)与(16)相减可得:()()()()()()310300023fxf xkf xkkfxk+=+(17)()()()()()()310300082243fxf xkf xkkfxk+=+(18)因此,得到一阶导数的四阶差分格式为:()()()()()()100000288212f xkf xkf xkf xkfxk+=(19)同理,可得二阶导数的四阶差分格式为:()()()()()()()200000022163016212f x

24、kf xkf xf xkf xkfxk+=(20)对于时间项,利用中心差分格式来近似其一阶导数:()()()()1002f ttf ttftt+=(21)由于将控制域划分为均匀网格,因此基于上述差分格式,将卷积网络中卷积核的参数替换为相对应的差分格式,可以得到卷积核的具体公式为:辛江涛 等 DOI:10.12677/aam.2024.132069 719 应用数学进展 ()211000000001212420000000033111441,000005123312240000000033110000000012120000000000122101233120000000000uuxhhuy=1

25、111,022uhtt=(22)4.数值实验与结果数值实验与结果 4.1.对比网络对比网络 在本节中,将本文提出的网络应用到求解 2D Burgers 方程和 2D flow-mixing 方程。为了更好地说明网络的精度和性能,将与 Raissi 等人1提出的 PINN 结果进行对比。在网络参数方面,本文提出的网络(PIED-Net)与对比网络采用完全相同的参数设置,具体为:学习率为 103,以控制网络在训练过程中的权重更新速度;全连接网络层数为3,100,100,100,2,以增强网络的表达能力;采用拉丁超立方采样方法,在问题域和边界上分别选择 20,000 个点,以确保样本可以涵盖整个问题

26、域;采用正切激活函数以引入非线性因素;使用 Adam 优化器作为梯度下降优化算法,以确保高效的收敛和训练稳定性。4.2.2D Burgers 方程方程 2D Burgers 方程在多个学科和领域中都有广泛的应用。在流体力学中,它被用来研究湍流流动、激波形成和传播,以及流体中的非线性行为。在天气和气候模拟中,2D Burgers 方程可以用来描述大气运动和气候系统中的非线性现象。本文对具有 Dirichlet 边界条件的 2D Burgers 方程进行了研究,方程定义为:22221Re+=+uuuuuuvtxyxy (23)22221Revvvvvuvtxyxy+=+(24)其中,u 是流体的平

27、均速度,v 是流体的湍流速度,t 是时间,x,y 是空间的横、纵坐标,Re 是雷诺数。该方程的非线性项反映了流体流动中的非线性效应,而扩散项则描述了流体的扩散过程。设置t=0.002 s,Re=200。分别利用 PINN 和 PIED-Net 求解该问题,向后预测 100 步,不同时刻的 u、v 误差分布图绘制在图 3 中。根据图中的数据,可以清楚地看出本文提出网络预测更精确,绝对误差最大不超过 1%,即使在 100 步时。而与之相比,PINN 的误差则分布在整个问题域中。辛江涛 等 DOI:10.12677/aam.2024.132069 720 应用数学进展 Figure 3.Absolu

28、te error plots of predicted and exact solutions for both networks 图图 3.两个网络的预测解与精确解的绝对误差图 4.3.2D Flow Mixing 方程方程 2D flow-mixing 方程描述了液体或气体在二维平面上的流动和混合过程,通常用于模拟和分析化工反应器、环境污染扩散、地下水运移等现象。这种方程可以被应用于计算流体力学、化学反应等多个领域,有助于优化工艺设计、预测污染扩散路径以及改善资源利用效率。本节求解一个具有 Dirichlet 边界条件的 2D flow-mixing 问题,其问题域为:1,2x,1,2y,

29、0,0.2t。该问题的控制方程定义为:0uuuabtxy+=(25)其中,系数 a、b 的计算公式描述为:()max,ttvya x yvr=(26)辛江涛 等 DOI:10.12677/aam.2024.132069 721 应用数学进展 ()max,ttvxb x yvr=(27)()()2sechtanhtvrr=(28)22rxy=+(29)式中max0.385tv=。PIED-Net 的预测解与真实解的绝对误差绘制在图 4 中,同时,对比网络 PINN 的结果也在图中列出。可以看出,本文提出的网络预测性能要优于对比网络,其误差比对比网络低 1 个数量级。对比结果表明本网络在对 2Df

30、low-mixing 方程进行求解时能够给出更精确的解,网络的预测性能更为优秀。Figure 4.Absolute error plots of predicted and exact solutions for both networks 图图 4.两个网络的预测解与精确解的绝对误差图 5.结论结论 本论文基于编码解码结构和 ConvLSTM 构建一个深度学习物理驱动模型,用于预测带时域的偏微分方程的动态演变。其中,编码解码结构的作用是将输入数据转化为潜在表示,以提取关键特征并去除冗余信息,同时通过逆向操作将编码后的潜在表示解码为原始输入的重建或生成结果。进一步地,引入了 ConvLSTM

31、模块,使得网络可以学习到时间序列数据中的时序依赖关系,并能够捕捉到长期的时间依赖关系。此外,通过使用有限差分卷积核来处理导数项,这种处理方式能够更好地捕捉到数据中的导数信息,从而进一步提高了模型的准确性和泛化能力。通过以上的设计和结构,本文所提出的深度学习物理驱动模型能够有效地预测时变偏微分方程的动态演变,从而为物理建模和预测提供了一种新的方法。基金项目基金项目 山西省青年科学研究基金项目(No.20210302124159);国家自然科学基金项目(No.12102283)。参考文献参考文献 1 Raissi,M.,Perdikaris,P.and Karniadakis,G.(2019)Ph

32、ysics-Informed Neural Networks:A Deep Learning Frame-辛江涛 等 DOI:10.12677/aam.2024.132069 722 应用数学进展 work for Solving Forward and Inverse Problems Involving Nonlinear Partial Differential Equations.Journal of Com-putational Physics,378,686-707.https:/doi.org/10.1016/j.jcp.2018.10.045 2 Zang,Y.,Bao,G.,

33、Ye,X.and Zhou,H.M.(2020)Weak Adversarial Networks for High-Dimensional Partial Differen-tial Equations.Journal of Computational Physics,411,Article ID:109409.https:/doi.org/10.1016/j.jcp.2020.109409 3 Weinan,E.and Yu,B.(2018)The Deep Ritz Method:A Deep Learning-Based Numerical Algorithm for Solving

34、Vari-ational Problems.Communications in Mathematics and Statistics,6,1-12.https:/doi.org/10.1007/s40304-018-0127-z 4 Sirignano,J.and Spiliopoulos,K.(2018)DGM:A Deep Learning Algorithm for Solving Partial Differential Equations.Journal of Computational Physics,375,1339-1364.https:/doi.org/10.1016/j.j

35、cp.2018.08.029 5 Lyu,L.,Zhang,Z.,Chen,M.,et al.(2022)MIM:A Deep Mixed Residual Method for Solving High-Order Partial Dif-ferential Equations.Journal of Computational Physics,452,Article ID:110930.https:/doi.org/10.1016/j.jcp.2021.110930 6 孙靖威.基于深度学习求解偏微分方程的研究D:硕士学位论文.天津:天津师范大学,2023.7 曹瑞,刘燕斌,裔扬.基于物理信

36、息机器学习的复杂系统长时间演化分析J/OL.控制理论与应用:1-10.http:/ Long,Z.,Lu,Y.and Dong,B.(2019)PDE-Net 2.0:Learning PDEs from Data with a Numeric-Symbolic Hybrid Deep Network.Journal of Computational Physics,399,Article ID:108925.https:/doi.org/10.1016/j.jcp.2019.108925 9 Mo,S.,Zhu,Y.,Zabaras,N.,et al.(2019)Deep Convoluti

37、onal Encoder-Decoder Networks for Uncertainty Quantifica-tion of Dynamic Multiphase Flow in Heterogeneous Media.Water Resources Research,55,703-728.https:/doi.org/10.1029/2018WR023528 10 Zhu,Y.and Zabaras,N.(2018)Bayesian Deep Convolutional Encoder-Decoder Networks for Surrogate Modeling and Uncerta

38、inty Quantification.Journal of Computational Physics,366,415-447.https:/doi.org/10.1016/j.jcp.2018.04.018 11 Zhu,Y.,Zabaras,N.,Koutsourelakis,P.S.and Perdikaris,P.(2019)Physics-Constrained Deep Learning for High Dimen-sional Surrogate Modeling and Uncertainty Quantification without Labeled Data.Jour

39、nal of Computational Physics,394,56-81.https:/doi.org/10.1016/j.jcp.2019.05.024 12 Gao,H.,Sun,L.and Wang,J.X.(2021)PhyGeoNet:Physics-Informed Geometry-Adaptive Convolutional Neural Net-works for Solving Parameterized Steady-State PDEs on Irregular Domain.Journal of Computational Physics,428,Article

40、ID:110079.https:/doi.org/10.1016/j.jcp.2020.110079 13 Geneva,N.and Zabaras,N.(2020)Modeling the Dynamics of PDE Systems with Physics-Constrained Deep Au-to-Regressive Networks.Journal of Computational Physics,403,Article ID:109056.https:/doi.org/10.1016/j.jcp.2019.109056 14 Shi,X.,Chen,Z.,Wang,H.,et

41、 al.(2015)Convolutional LSTM Network:A Machine Learning Approach for Precipita-tion Nowcasting.Advances in Neural Information Processing Systems,28.15 Rao,C.,Sun,H.and Liu,Y.(2021)Hard Encoding of Physics for Learning Spatiotemporal Dynamics.arXiv:2105.00557.16 Ren,P.,Rao,C.,Liu,Y.,et al.(2022)PhyCR

42、Net:Physics-Informed Convolutional-Recurrent Network for Solving Spatiotemporal PDEs.Computer Methods in Applied Mechanics and Engineering,389,Article ID:114399.https:/doi.org/10.1016/j.cma.2021.114399 17 Mavi,A.,Bekar,A.C.,Haghighat,E.and Madenci,E.(2023)An Unsupervised Latent/Output Physics-Informed Con-volutional-LSTM Network for Solving Partial Differential Equations Using Peridynamic Differential Operator.Com-puter Methods in Applied Mechanics and Engineering,407,Article ID:115944.https:/doi.org/10.1016/j.cma.2023.115944

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服