1、SSA-SARIMA 组合模型的桥梁健康状态预测谌桢文袁 常军渊苏州科技大学 土木工程学院袁江苏 苏州 215011冤摘要院 为了预测桥梁未来状态袁考虑奇异谱分析渊SSA冤和季节性差分自回归滑动平均渊SARIMA冤模型的特点袁提出将二者结合以实现优势互补遥 利用 SSA 提取数据中的趋势项尧季节项及高频项曰采用 SSA 和 SARIMA 模型对每项分别进行预测袁以选出最优方案重组并验证该方法的有效性曰最后袁将该方法与 SSA 和 SARIMA 模型进行比较袁结果表明 SSA-SARIMA 的组合模型对预测结果的精度有明显的提高遥用该方法对实桥数据进行了处理分析袁取得了较好的效果遥关键词院 桥梁
2、健康监测曰SSA曰SARIMA曰时间序列分析曰组合模型预测中图分类号院 U446文献标识码院 A文章编号院 2096-3270渊2023冤04-0008-05桥梁健康监测系统用于实时掌握桥梁的健康状况遥 通过安装不同类型的传感器可以掌握桥梁的整体信息袁并通过适当的处理袁可用于传统的损伤识别和结构状况评估1-2遥 其中袁如何建立一个具有高精度的预测模型袁准确地对监测数据进行预测是结构状态评估的关键袁对于桥梁安全预警及后续管养工作具有重要意义遥 这些数据往往是含有等时间间隔的数据遥 因此袁时间序列分析理论为桥梁健康状况评估提供了可行的思路3-5遥 奇异谱分析渊SSA冤是一种时间序列分析工具袁被认为
3、是一种非常成功的数据预处理算法遥 SSA 可将给定的时间序列分解为有限个更简单和可识别的分量袁再将信号按需要进行重组6-8袁同时它对数据有良好的外推预测能力9-10遥 SARIMA 模型在 ARMA 模型的基础上能够有效地对数据中的季节项和趋势项进行处理袁避免了现在大多数只使用趋势或者季节性的组合模型的带来的繁琐袁在精度方面有着提高11-12遥 因此袁基于SSA 分解尧重构及外推预测能力和 SARIMA 模型袁通过工程实例的检验证明组合模型的预测能力比单一模型的预测能力有显著的提升遥1基本原理1.1奇异谱分析奇异谱分析最早由 Colebrook13在海洋学研究中提出并使用遥 SSA 是一种非参
4、数尧无模型的时间序列工具袁对于时间序列袁既不需要假设参数模型袁也不需要假设平稳性条件袁它可以通过奇异值分解渊SVD冤将时间序列分解为可分离的分量14遥在桥梁领域的实际运用中袁李小奇等15和戴建彪等16利用奇异谱分析袁分别提取应力监测数据及桥梁索塔 GPS 监测数据中的趋势成分和周期成分遥 SSA 包括时间序列的分解尧重构及预测遥渊1冤分解遥 原始的时间序列渊x1袁x2袁噎袁xN冤通过映射可以成为 K 个长度为 L 的向量袁定义由这些向量组成的矩阵为轨迹矩阵 XX=X1颐X2颐噎颐XK=渊Xij冤i袁j=1L袁K=X1X2X3噎XKX2X3X4噎XK+1X3X4X5噎XK+2噎噎噎噎噎XLXL+
5、1XL+2噎XK+N杉删山山山山山山山山山山山山山山山山山山山煽闪衫衫衫衫衫衫衫衫衫衫衫衫衫衫衫衫衫衫衫渊1冤要要要要要要要要要要要要要要要要要眼收稿日期演 圆园22原09-11眼作者简介演 谌桢文渊1997-冤袁男袁江西吉安人袁硕士研究生遥通信联系人院常军渊1973-冤袁男袁教授袁博士袁主要从事健康监测与振动控制研究袁Email院遥第 36 卷第 4 期苏州科技大学学报渊工程技术版冤灾燥造援 36晕燥援 4圆园23 年 12 月允燥怎则灶葬造 燥枣 Suzhou 哉灶蚤增藻则泽蚤贼赠 燥枣 杂糟蚤藻灶糟藻 葬灶凿 栽藻糟澡灶燥造燥早赠渊耘灶早蚤灶藻藻则蚤灶早 葬灶凿 栽藻糟澡灶燥造燥早赠 E
6、dition冤Dec援 圆园23第 4 期式中袁L 是选定的窗口长度袁N渊N2冤是时间序列长度袁K=N-L+1遥 对轨迹矩阵 X 进行奇异值分解渊SVD冤可提供 L 个特征值尧特征向量和主成分的集合遥 令 S=XXT袁用 姿1袁噎袁姿L表示 S 的特征值袁并假定它们按递减顺序排列袁因此 姿1逸噎逸姿L逸0遥 轨迹矩阵 X 的奇异值分解可以写为X=E1+E2+噎+Ed渊2冤其中袁Ei=姿i姨UiViT渊时间重组序列 RCi冤袁Ui为 S 对应特征值的标准正交向量袁Vi=XTUi/姿i姨渊i=1袁2袁噎袁d冤遥渊2冤重构遥 将初等矩阵 Ei的下标 i=1袁2袁噎袁d划分成子集 I1袁I2袁噎袁Im
7、袁计 I=i1袁i2袁噎袁ip为对应的下标袁则有XIp=Xi1+Xi2+噎+Xip渊3冤由渊2冤可知X=EI1+EI2+噎+EIm渊4冤将式渊4冤中的每个分组转化成对应长度为 N 的时间序列袁设 Y 为 L伊K 维矩阵袁其元素为 Yij渊1臆i臆L袁1臆j臆K冤遥 令 L*=min渊L袁K冤袁K*=max渊L袁K冤袁K=N-L+1袁则当 LK 时袁Y*ij=Yij袁否则袁Y*ij=Yji遥 对角平均按下面公式将矩阵 Y 转换成序列 g1袁g2袁噎袁gN遥gk=1kkm=1移y*m袁k-m+1渊1臆k臆L*冤1L*L*m=1移y*m袁k-m+1渊L*臆k臆K*冤渊5冤1N-K+1bm=a移y*m
8、袁k-m+1渊K*臆k臆N曰a=N-K*+1袁b=k-K*+1冤扇墒设设设设设设设设设设设缮设设设设设设设设设设设式渊5冤相当于在矩阵对角线 i+j=k+1 求平均院当 k=1 时袁g1=y11曰当 k=2 时袁g2=渊y12+y21冤/2袁以此类推遥如果矩阵 Y是时间序列渊h1袁h2袁噎袁hN冤的轨迹矩阵袁那么对所有 i 都有 gi=hi遥 将式渊5冤应用于式渊4冤中的 EIk渊k=1袁2袁噎袁m冤袁将形成一个重建序列 Z渊k冤=渊z1渊k冤袁噎袁zN渊k冤冤袁因此袁原始时间序列渊x1袁x2袁噎袁xN冤将被分解为 m 个时间序列xn=km=1移zn渊k冤渊n=1袁2袁噎袁N冤渊6冤渊3冤预测
9、遥 为了实现 SSA 预测袁时间序列应该满足线性递归公式渊LRF冤10遥 时间序列 QN=渊x1袁x2袁噎袁xN冤线性递归公式如下xN+1=a1xN+a2xN-1+噎aL-1xN-L+1渊7冤式中袁L 是选定的窗口长度袁只需要求出系数 a1袁噎袁ad袁记向量 R=渊a1袁噎袁ad冤T袁且有 R=11-v2rk=1移仔kUk袁其中令Uk表示为前 L-1 个向量 Ui渊i=1袁噎袁L冤所组成的向量袁v2=仔12+仔22+噎+仔r2袁仔k为向量 Ui最后一个分量遥 时间序列 QN+M=渊x1袁x2袁噎袁xN袁xN+1袁噎袁xN+M冤最终循环预测 M 步的递归预测公式可表示为Qi=gk渊k=1袁噎袁N
10、冤L-1j=1移ajxi-j渊i=N+1袁噎袁N+M冤扇墒设设设设设缮设设设设设渊8冤其中 gk表示为式渊5冤重构出来的序列遥1.2SARIMA 模型SARIMA 模型袁即季节性差分自回归滑动平均袁是 ARIMA 的发展袁并提高了 ARIMA 模型在季节性序列建模中的性能遥 具体内容可参考文献18遥2SSA-SARIMA 组合模型组合模型预测方法是现在较为热门的方法袁一般时间序列数据有三个特性袁分别为趋势尧周期和噪声遥谌桢文袁等院SSA-SARIMA 组合模型的桥梁健康状态预测92023苏州科技大学学报渊工程技术版冤单一预测模型很难同时对三种特性数据有较好的预测能力遥 因此袁采用组合模型成为了
11、提高预测精度的有效手段4,11,17袁组合模型建立如下院渊1冤利用 SSA 将原始信号分解为 L 个重组序列 RC曰渊2冤引入贡献率和相关矩阵来确定重组的 RC 信号组袁从而获得趋势尧周期和高频三个特征数据曰渊3冤利用 SSA 和 SARIMA 模型分别对三种特性数据进行预测曰渊4冤将预测结果通过评价指标袁比较两种模型对三种特征数据的预测效果袁并对特征数据拟合度较好的模型进行重组袁确定 SSA-SARIMA 组合模型曰渊5冤分别采用该组合模型尧SSA 和 SARIMA 模型对原始数据进行预测曰渊6冤采用均方误差渊MSE冤尧均方根误差渊RMSE冤尧平均绝对误差渊MAE冤尧平均绝对百分比误差渊MA
12、PE冤等评价指标对预测结果进行比较袁验证组合模型的有效性遥上述评价指标的目的是反映模型的预测值与实际值的相似度遥 预测值越接近实际值袁预测误差越小袁预测精度越高遥 在上述四个评价指标中袁MES 和 RMSE 可以代表结果的总体误差遥 该值越小袁预测结果整体误差越小遥 MAE 和 MAPE 值可以表示为拟合精度遥 该值越小袁说明预测结果精度越高袁信号损失越小遥3实例分析3.1数据选取采用文献18中案例验证组合模型的有效性遥 提取 2021 年 7 月 28 日至 8 月 28 日的实桥跨中位置加速度传感器数据袁由于样本量过大袁将每一小时的数据平均值袁进行样本量缩减遥 缩减之后样本量为 745 个
13、袁大大减少了运算量袁加速度数据如图 1 所示遥由图 1 可知袁加速度数据存在明显的趋势和季节性袁整体的加速度数据为非平稳数据遥由于数据集样本量为 745 个袁选取前 595 个数据为训练集袁用作训练模型袁后 150 个数据为测试集袁用作样本外预测袁其数据集划分如图 2 所示遥3.2SSA 分解与重构SSA 窗口的长度应尽量为周期的倍数袁 所以窗口长度为 48袁SSA 分解结果如图 3 所示遥由图 3 可知袁RC1 有着明显的趋势性袁RC2-RC3 有明显的周期性袁为了更准确地选取趋势项尧周期项和高频项袁引用贡献率和相关性进行辅助选取遥由图 4 特征值对应特征向量的贡献率可以得到袁 一共有 48
14、 个特征值袁第 1 个奇异值对应 RC 的贡献率最大袁其占主要成分袁第 4 个奇异值对应 RC 往后的贡献率接近 0遥 再由图 5 中 RC 相关性矩阵可知袁第 4 个和第 5 个 RC 相关性较强袁所以最终确定三个分量的划分为院第 1 个对应RC 作为趋势项袁第 2 至第 5 个 RC 确定为季节项袁第 6 至第 48 个 RC 为高频项袁组合结果如图 6 所示遥3.3选取最优模型奇异谱分析提取了原始数据的 3 个特性分量渊趋势尧季节尧高频冤分别利用单一模型对三种特性数据进行预测遥图 7 为各项预测结果袁下面引用MSE 和 MAPE 评价指标对模型的误差和精度进行评估袁 结果如表 1 所示遥
15、 由预测结果可以知道袁 对于趋势项而言袁SARIMA 模型的 MSE 和MAPE 值均较小袁说明其误差较小袁精度较高曰对于季节项而言袁SSA 模型的 MSE 和 MAPE 值均较小袁说明其误差较小袁精度较高曰对于高频项而言SSA 和 SARIMA 模型的 MSE 值均较小袁 说明两种模型预测误差均小袁但图 1加速度信号图 2训练集与测试集图 3SSA 前 6 项分解结果测试时间点测试时间点测试时间点训练集测试集10第 4 期是 SARIMA 模型的 MAPE 值较小袁说明其精度较高遥 所以袁最优组合模型选用 SSA 模型预测季节项袁由 SARIMA 模型预测趋势项和高频项遥3.4单一及组合模型
16、的预测结果将数据整合袁 利用原始加速度数据来验证组合模型的预测结果比单一模型的预测结果好遥如图 8 为原始加速度数据的模型预测结果对比图曰表 2 为 SSA 模型尧SARIMA 模型和 SSA-SARIMA 组合模型预测效果评价表遥从表 2 可以看出袁对于组合模型袁四个指标均小于单一模型袁说明组合模型的预测精度要优于其他两种单一预测模型遥4结语以某大桥健康监测系统采集的加速度数据为样本袁结合 SSA 和 SARIMA 模型袁研究了组合模型在桥梁健康预测分析中的应用遥 得出以下结论院渊1冤基于 SSA 的组合模型预测结果能够更为精确的拟合实际结果袁为桥梁传感器空缺数据的插补及预测桥梁未来健康状态
17、提供了一个可靠的预测模型遥渊2冤SSA 分析不仅可以将数据拆分成若干简单含有可识别信息的分量袁还可以进行重组提取数据中的趋势分量尧季节分量及周期分量袁这对于提取桥梁监测数据中的重要信息有着十分重要的帮助遥渊3冤SSA 模型和 SARIMA 模型两种单一模型对于趋势尧季节尧高频数据的预测能力总体来说较好遥 但对于桥梁数据而言袁高频项数据中往往存在很重要的信息袁两种模型对于高频项的误差精度较差袁会导致高频能量的丢失遥表 1各分项 SSA 和 SARIMA 预测结果表 2各模型预测效果评价图 8原始加速度数据各模型预测结果对比图 5RC 相关性矩阵图 6趋势项尧季节项尧高频项重组结果RCi第 i 个
18、特征值测试时间点测试时间点图 4特征值的贡献率数据 模型 MSE MAPE SSA 0.000 18 2.352 49 趋势项 SARIMA 0.000 01 0.636 47 SSA 0.000 22 97.224 85 季节项 SARIMA 0.000 25 597.385 70 SSA 0.000 07 278.495 08 高频项 SARIMA 0.000 07 168.587 23 模型 MSE RMSE MAE MAPE SSA 0.000 55 0.023 61 0.018 56 3.917 29 SARIMA 0.000 59 0.024 33 0.019 72 3.978 6
19、6 SSA-SARIMA 0.000 36 0.019 14 0.014 09 2.942 04 图 7趋势项尧季节项尧高频项预测结果测试时间点贡献率训练集测试集SSASARIMA趋势项季节项高频项真实值训练集真实值测试集SSASARIMASSA-ARIMA谌桢文袁等院SSA-SARIMA 组合模型的桥梁健康状态预测112023苏州科技大学学报渊工程技术版冤参考文献院1 吴桐袁唐亮袁周志祥.基于挠度曲率面积差的桥梁结构损伤识别方法J.工程科学与技术袁2021袁53渊6冤院165-174.2 李旭袁陈欣袁常军.波动理论结合 CEEMD-小波阈值识别噪声环境下的结构损伤J.苏州科技大学学报渊工程技
20、术版冤袁2020袁33渊4冤院33-40.3 陈国良袁林训根袁岳青袁等.基于时间序列分析的桥梁长期挠度分离与预测J.同济大学学报渊自然科学版冤袁2016袁44渊6冤院962-968.4 郇滢袁兰惠清袁林楠袁等.基于小波变换的 GM(1,1)-ARMA 组合预测模型对悬索管桥的应变预测J.应用科学学报袁2016袁34渊1冤院95-105.5 董家凡袁潘玉恒袁鲁维佳.基于时间序列分析和信息熵的结构损伤识别J.铁道科学与工程学报袁2022袁19渊7冤院2033-2041.6 闫超袁张小卫.奇异谱分析在地铁沉降监测中的应用J.测绘通报袁2021渊S2冤院173-176.7 林涛袁刘航鹏袁赵参参袁等.基
21、于 SSA-PSO-ANFIS 的短期风速预测研究J.太阳能学报袁2021袁42渊3冤院128-134.8 孔雯袁车权袁赵慧荣袁等.基于奇异谱分析与长短时记忆神经网络的电厂存煤量短期预测J.信息与控制袁2020袁49渊6冤院742-751.9 SHAHARUDIN S M,ISMAIL S,HASSAN N A,et al.Short-Term forecasting of daily confirmed COVID-19 cases in malaysia using RF-SSAModelJ.Frontiers in public health,2021渊9冤:1-14.10 HASSAN
22、I,HOSSEIN,KALANTARI,et al.An improved SSA forecasting result based on a filtered recurrent forecasting algorithm.J.ComptesRendus Mathematique,2017,355渊9冤:1026-1036.11 强添纲袁刘涛袁裴玉龙.地铁进站客流量 SARIMA 与 GA-BP 神经网络组合预测模型J.铁道运输与经济袁2021袁43渊12冤院134-142.12 杨振昊袁张俊波袁杨晨星袁等.基于 SARIMA 模型的我国水产品消费价格指数预测J.海洋湖沼通报袁2021袁43
23、渊2冤院131-138.13 VAUTARD R,YIOU P,GHIL M.Singular-spectrum analysis:A toolkit for short,noisy chaotic signalsJ.Physica D Nonlinear Phenomena,1992,58:95-126.14 UNNIKRISHNAN P,JOTHIPRAKASH V.Hybrid SSA-ARIMA-ANN model for forecasting daily rainfallJ.Water Resources Management,2020,34渊11冤:3609-3623.15 李小
24、奇袁岳顺袁岳东杰.基于奇异谱分析和蒙特卡洛方法的桥梁索塔变形 GPS 监测数据处理J.勘察科学技术袁2014渊4冤院24-27.16 戴建彪袁岳东杰袁汤同旭袁等.桥梁索塔 GPS 监测信号的小波分析J.测绘科学袁2019袁44渊9冤院151-157.17 朱利明袁卓静超袁邢世玲.基于 CEEMDAN-NAR-ARIMA 组合模型的桥梁结构健康监测应变预测J.科学技术与工程袁2020袁20渊4冤院1639-1644.18 谌桢文袁常军援 综合岭回归和 SA砸IMA 方法在桥梁健康监测数据分析中的应用咱J暂援 科学技术与工程袁2023袁23渊20冤院8846-8853援Bridge health
25、status prediction based on SSA-SARIMA combined modelCHEN Zhenwen,CHANG Jun渊College of Civil Engineering袁 SUST袁 Suzhou 215011,China冤Abstract:To predict the future state of bridges,considering the characteristics of Singular Spectrum Analysis渊SSA冤 and Seasonal Autoregressive Integrated Moving Average(
26、SARIMA)model,the paper proposed that SSAand SARIMA be combined to achieve complementary advantages.SSA is used to extract trend items,seasonalitems and high-frequency items in the data;SSA and SARIMA model are used to predict each item separately,soas to select the optimal scheme to reorganize and v
27、erify the effectiveness of the method.Finally,the method iscompared with the singular spectrum analysis and seasonal autoregressive integrated moving average model,theresults show that the combined model of Singular Spectrum Analysis and Seasonal Autoregressive IntegratedMoving Average models can significantly improve the accuracy of the prediction results.This method is used toprocess and analyze the real bridge data,and good results are obtained.Key words:bridge health monitoring;SSA;SARIMA;time series analysis;combined model forecasting渊责任编辑院秦中悦冤12