1、离子束科学技术及其应用基于机器学习的地球静止轨道质子能谱反演*陈建飞,周宏涛,方美华,吴康,宋定一(南京航空航天大学航天学院,南京211100)摘要:根据地面中子探测与宇宙线环境之间的关联性,在太阳活动平静期以地球静止环境业务卫星及全球各个中子探测站的探测数据构建数据集。基于极端梯度提升决策树(XGBoost)和人工神经网络建立了由地面中子探测数据反演宇宙线质子环境的模型。模型采用遗传算法求解模型的最优超参数并对神经网络的各个神经元参数进行训练,实现了宇宙线质子环境在太阳活动平静期的反演,模型训练的均方差 MSE 为 0.499,对测试集的平均反演误差分别为 26.9%,对比航天常用的辐射环境
2、模型误差通常在 200%以内,提高显著。同时使用包括支持向量回归、误差反向传播算法、长短期记忆在内的多种其他机器学习算法进行了对比,结果表明本文所建立的模型具有训练时间短、计算速度快、占用资源小的优点。关 键 词:宇宙线能谱;机器学习;中子探测;遗传算法;航天工程应用中图分类号:P353文献标志码:Adoi:10.11884/HPLPB202335.230149GeostationaryorbitalprotonenergyspectruminversionbasedonmachinelearningChenJianfei,ZhouHongtao,FangMeihua,WuKang,SongD
3、ingyi(Institute of Aerospace,Nanjing University of Aeronautics and Astronautics,Nanjing 211100,China)Abstract:Basedonthecorrelationbetweengroundneutrondetectionandthecosmicrayenvironment,adatasetwasconstructedusingthedetectiondataofgeostationaryoperationalenvironmentalsatellitesandvariousneutrondete
4、ction stations worldwide for the solar activity quiet period.Models for inverting the cosmic ray protonenvironmentfromgroundneutrondetectiondatawereestablishedbasedontheextremegradientboostdecisiontree(XGBoost)andartificialneuralnetwork.Theyusegeneticalgorithmtosolvetheoptimalhyperparameterandtraint
5、heparametersofeachneuronoftheneuralnetworktorealizetheinversionofthecosmicrayprotonenvironment.Themeansquareerrorofthemodeltrainingis0.499,andtheaverageinversionerrorofthetestsetis26.9%respectively.Comparedwiththeradiationenvironmentmodelcommonlyusedinaerospace,theerrorisusuallywithin200%,whichissig
6、nificantlyimproved.Multipleothermachinelearningalgorithms,includingsupportvectorregression,errorbackpropagationtraining,longshort-termmemorynetwork,werecomparedandtheresultsshowthatthemodelestablishedinthispaperhastheadvantagesofshorttrainingtime,fastcomputationspeed,andlowresourceconsumption.Key wo
7、rds:cosmic ray spectroscopy,machine learning,neutron detection,genetic algorithm,aerospaceengineeringapplications近地空间质子环境严重影响着人类航天活动,给地球近地轨道运行的航天器带来危险,使卫星载荷仪器上的敏感元件受到损伤,影响仪器乃至整颗卫星的使用寿命1-3。影响航天器的高能带电粒子除了被地磁场捕获的辐射带粒子外,主要的还有来自太阳的太阳宇宙线和来自银河系的银河宇宙线。因此,准确描述空间高能质子的分布情况,获取卫星轨道宇宙线质子能谱,对卫星的合理使用和我国的深空探测事业十分重要。
8、通过对宇宙线几十年的持续观测和研究,已经有一些模式对宇宙线的通量和空间分布情况进行描述4-5。如 20 世纪 90 年代初,*收稿日期:2023-05-29;修订日期:2023-09-16基金项目:国家自然科学基金项目(42241148)联系方式:陈建飞,。通信作者:方美华,fmh_。第35卷第10期强激光与粒子束Vol.35,No.102023年10月HIGHPOWERLASERANDPARTICLEBEAMSOct.,2023104002-1Badhwar 和 ONeill 基于 1951 年至 1992 年气球和卫星探测数据提出了 Badhwar-ONeill 银河宇宙线模型6;1998
9、 年,莫斯科州大学经过对宇宙线长达四十年的直接观测后提出了新的银河与太阳宇宙线模式,该模式描述了带电荷数为 128 的粒子在 1MeV1GeV 能量范围的通量情况7;2004 年 P.M.ONeill 利用要素/同位素成分高级探测器(ACE)的数据重新修正的 Badhwar-ONeill银河宇宙线模型等8。比较接近实用且目前仍被广泛采用的模式是Adams 模式,该模式总结了大量地面、气球和卫星的探测数据,非常全面地描述了不同能量的粒子在不同的太阳活动条件时的通量水平9-11。NicolaTomassetti 等进行了数据驱动的分析,在太阳周期的银河宇宙射线(GCR)通量的时间依赖性。利用 AM
10、S-02 和 PAMELA 的空间 GCR 观测数据,对 GCR 扩散平均自由程进行了全球统计推断,确定了 GCR 扩散平均自由程的刚性和时间依赖性,给出了 GCR 质子扩散平均自由程的结果,讨论了它们在粒子输运基本过程中的解释及其与日球等离子体动力学的关系12。虽然对于宇宙线的探测取得了很大的成功,但是目前应用最广泛的仍然是质子能谱的经验公式,其计算速度慢,平均误差在 200%以内,局部区域误差可达 450%13,部分结果仍需要结合实际卫星的探测结果进行优化,无法满足航天工程需求,所以本文基于机器学习算法以卫星实测数据为驱动进行宇宙线能谱反演研究,达到对宇宙线质子能谱的快速响应。1原理分析及
11、数据集建立从宇宙线研究早期,人们就开始广泛地研究宇宙线的时间变化。作为初级近似,海平面的宇宙线通量通常被当作常量,但多年观测资料的分析发现宇宙线的强度存在着涨落。这些涨落部分是周期性的,其余则是非周期性的。已经观测到的周期性变化有几小时变化、周日变化、27 天变化、年变化和 11 年变化等周期性特征,这些全部都是太阳活动的调制过程所造成的。非周期性变化也有起源于太阳的,如 Forbush 下降14。这是一种短期宇宙线通量全球性剧烈下降,下降幅度可达 10%50%,通常与太阳耀斑关系密切。宇宙线随地磁场的变化主要表现有纬度效应、经度效应、东西效应及辐射带的形成。初级宇宙线以及它在大气层中产生的大
12、多数次级粒子都是带电的,宇宙线带电粒子穿越地磁场到达近地轨道的过程中会受到地磁场的作用,因而轨道会发生偏转;同时当宇宙线进入大气层后,会与大气中各种分子碰撞,发生弹性和非弹性散射、康普顿散射、光电效应、轫致辐射等过程,并产生 子、中微子、电子、正电子、中子、质子等次级粒子。这些粒子能够到达地球表面,从而被地面探测器监测到15-16。基于此,本文建立以下三个数据集:地面中子数据集、太阳活动观测数据集、宇宙线探测数据集。r2=0.908 7地面中子探测数据来自中子探测数据库(NMDB),该网站提供了来自世界各地站点的中子探测器探测结果的访问。本文共选取了 59 个站点的数据,时间跨度由 1957
13、年至今。所有数据都经过了大气压力修正及各个站点的修正(建筑物的不同、探测器数量、探测器类型等)。图 1 给出了所有站点的磁纬度及其截止刚度的分布,可以看出站点主要分布在高磁纬度地区,且截止刚度与磁纬度的绝对值之间的相关系数,证明两者具有较强的负相关性。太阳黑子数据来自国际数据中心(WDC)从全世界约85 个观测点收集的太阳黑子数据并进行平均,时间跨度由1818 年至今;地磁活动指数Kp数据来自德国地球科学研究中心(GFZ),时间跨度由 1932 年至今。宇宙线中高能质子探测数据来自于美国国家环境信息(x1,y1),(xt,yt)中心提供的地球静止环境业务卫星(GOES)自 1974 年 7 月
14、以来的探测数据。该卫星位于地球静止(GEO)轨道,环境中的高能质子主要来自于磁层外,其搭载的空间环境探测器中的高能粒子传感器能够对质子、粒子及电子作出响应。本文根据探测数据的特点,首先对于数据集进行归一化处理,即xi=xixminxmaxxmin(1)xixmax=maxx1,xt xmin=minx1,xtxi式中:为待归一化的数据,。归一化后的分布在 0,1 区间,由于粒子通量的变化范围跨越多个数量级,对通量数值取对数,形成训练所需训练集。因此,本文构建的模型输入分别为:(1)地面中子计数率;(2)太阳黑子数:太阳黑子数观测历史长、数据量多,102030405060708090 10002
15、4681012141618 neutron detection stationcut-off rigidity/GVmagnetic dimension/()Fig.1Distributionofmagneticlatitudeandcutoffrigidityofallstations图1所有站点的磁纬度与其截止刚度的分布强激光与粒子束104002-2可以准确反映太阳活动变化。(3)地面探测站的磁纬度:磁纬度会影响不同能量的宇宙线粒子在不同地区的分布。(4)地磁活动指数 Kp:由各种情况导致的地磁扰动同样会对宇宙线粒子的地区分布产生影响。在航天工程领域,大多数计算与应用都是基于完整的粒子能谱
16、输出,但是 XGBoost 模型的输出只能是离散值,所以本文选择粒子能量作为模型的一个额外输入,粒子通量作为模型输出。通过不断改变输入能量,从而得到连续的输出通量,最终得到连续的粒子能谱。基于以上输入输出,本文的数据集由地面中子观测数据、太阳活动观测数据和宇宙线探测数据三个部分构成,数据集的总体情况如表 1 所示。2模型构建本节使用遗传算法来获得 XGBoost 的初始参数最优组合,具体步骤如下:C1设置初始种群的规模为 30,最大进化代数为 40,初始化每个个体的参数,组成父代子群。P1计算每个个体的适应度,使用转盘式选择法挑选出 15 个优势个体,组成精英子群。P1Q1在中随机两两结合,经
17、过交叉和变异操作产生 15 个后代,组成后代子群。C2精英子群与后代子群混合为新的父代子群,重复步骤。迭代结束后,选取种群中适应度最高的个体,该个体所代表的方案即为最佳方案。训练过程中,种群的最佳个体(即适应度最高)的模型参数方案的均方误差(MSE)随进化代数的变化以及进化结束后的最佳方案参数如图 2 所示。本文使用 MSE、均方根误差(RMSE)和平均相对误差(MRE)作为反演精度的总体衡量标准,计算公式为EMSE=1NNi=1(yiyi)2(2)ERMSE=vt1NNi=1(yiyi)2(3)EMRE=1NNi=1|yiyi|yi100%(4)式中:N 为样本总数。上文提到通量数据在进行归
18、一化处理时取 10 为底的对数,则以上衡量标准也是针对取对数后的输出。r2=0.837为了测试遗传算法对模型训练结果的改进,针对使用 XGBoost 默认参数、进化开始时最佳个体参数、进化结束后最佳个体参数这三种情况,分别使用上式计算 MSE、RMSE、MRE,结果如表 2 所示。默认参数方案的MSE 为 0.605,种群进化结束时最佳个体的 MSE 为 0.499,降低了 17.6%,决定系数,在测试集上的平均相对误差为 26.9%。作为对比,传统的辐射环境模型 AE8 和 AP8 的相对误差通常在 200%以内,某些区域甚至会达到 450%,表明模型在反演宇宙线环境上具有较好的精确度。表1
19、数据集概况Table1Datasetoverviewtotaldatavolumenumberofdatausedforthetrainingsetnumberofdatausedforthetestset84427007598430844270表2不同参数方案的各项指标Table2VariousindicatorsofdifferentparameterschemesindicatorsMSERMSEMRE/%defaultparameterscheme0.6050.77819.6initialparameterscheme0.6350.79725.5optimalparametersche
20、me0.4990.70617.60102030400.4960.5160.5360.5560.5760.5960.6160.636MSEn=63=0.396 23=0.235 16D=2S=0.502 31Sm=uniformiteration numberFig.2MSEofthemodelchangeswiththenumberofiterations图2模型的 MSE 随迭代次数的变化陈建飞,等:基于机器学习的地球静止轨道质子能谱反演104002-33结果及分析=0.1为了全面地比较本文所使用模型的反演效果,使用支持向量回归(SVR)、误差反向传播算法(BP)神经网络和长短期记忆(LST
21、M)神经网络同时建立对宇宙线的反演模型,并与 XGBoost 模型进行对比17。本文对 SVR 超参数设置为:核函数为高斯径向基函数,惩罚系数为 1103,;对 BP 神经网络的结构设置为:隐含层共 3 层,神经元个数分别为 64、32、16,激励函数为 ReLU,训练次数为 1000 次;对 LSTM 网络结构设置为:地面中子探测数据的输入变更为过去 24h 内的中子计数率(间隔为 1h),隐含层结构与其余参数与 BP 神经网络相同。表 3 给出了计算机电脑在处理器为 12thGenIntel(R)Core(TM)i9-12900KF,3187MHz 的条件下,这些模型的各项指标的对比,从表
22、中可以看出,本文所使用的 GA-XGBoost 模型的各项指标综合表现最优。原因有以下几个方面:(1)其平均相对误差 MRE 仅为 12.5%,在四种模型中表现为佳,说明该模型预测的数据集稳定性最高,与测试集的差距最小;(2)均方根误差 RMSE 为 0.706、均方误差 MSE0.499,比 SVR 支持向量机模型和 BP 神经网络模型精度高,但次于深度学习网络 LSTM 模型的 0.361/0.131,说明该模型的拟合程度较好,预测准确度也较高;(3)训练时间为 135s,远低于其他模型的训练时间,说明该模型占用最少的时间和资源成本,能更加灵活地应对突发事件,更加适用于航天工程应用。为了更
23、直观地分析各种算法的适用性,分别在太阳活动极小年和极大年选取两个时间点2010 年 7 月21 日与 2015 年 7 月 21 日,进行 GEO 轨道质子能谱反演,图 3 和图 4 给出了实际质子通量与模型反演质子通量的对比。从图 3 中可以看出,在太阳活动极小年,质子微分通量随着能量的增加先下降后上升,SVR 未能捕捉到这个特征,只表现出指数形式下降的整体趋势;BP 捕获到了部分特征,但是与测量值偏差较大,精度低;LSTM 和XGBoost 模型能完整地捕获能谱变化特征,都具有较高的反演精度。从图 4 中可以看出,在太阳活动极大年,质子微分通量也是随着能量的增加先下降后上升,但是下降点右移
24、,SVR 仍然无法捕捉到这个特征,只表现出指数形式下降的整体趋势;BP 捕获到了部分特征,但是整体向右偏移,与测量值偏差较大,精度低;LSTM 和 XGBoost 模型能完整地捕获能谱变化特征,具有较高的反演精度,且 XGBoost 模型与实测值符合更好。图 5 和图 6 给出了模型的预测通量与宇宙线模型 CREME96 的对比,从图中可以看出,模型预测值与宇宙线模型 CREME96 在高能部分符合得较好,在低能部分与 AP8 模型符合较好。因为在 GEO 轨道,卫星监测到的辐射质表3四种机器学习模型的指标对比Table3Comparisonofindicatorsforfourmachine
25、learningmodelsmodelMSERMSEMRE/%trainingtime/sGA-XGBoost0.4990.70612.5135SVR2.6321.622264.6620BP0.6410.80184.23625LSTM0.1310.36117.56390100101102103105104103102101100101102103actual valueestimateSVRBPLSTMenergy/MeVflux/(cm2s1 MeV1)Fig.3FluxescalculatedbyourmodelandSVR,BP,LSTMmodels,incomparisonwithfl
26、uxdatadetectedbyGOES10detectorinsolarminimum图3太阳活动极小年模型的预测值与探测值及其他算法的对比100101102103105104103102101100101102actual valueestimateSVRBPLSTMenergy/MeVflux/(cm2s1 MeV1)Fig.4FluxescalculatedbyourmodelandSVR,BP,LSTMmodels,incomparisonwithfluxdatadetectedbyGOES13detectorinsolarmaximum图4太阳活动极大年模型的预测值与探测值及其他算
27、法的对比强激光与粒子束104002-4子通量不仅包括宇宙线高能质子通量,还包括地球外辐射带中的低能质子通量,所以预测值/探测值都接近宇宙线质子通量与外辐射带质子通量之和。综上所述,本文建立的 GA-XBGoost 算法能够准确地绘制出 GEO 轨道的质子微分能谱,更加有助于设计和优化航天器的辐射防护系统,提前预知可能的辐射事件,并采取措施确保卫星正常运行的稳定性和可靠性。4结论在大数据时代,针对海量数据的机器学习是国内外研究的重点。本文针对主要的辐射环境研究目标宇宙线环境,分析了影响宇宙线的各个因素,包括地磁场、太阳活动等。本文使用极端梯度提升决策树(XGBoost)作为反演模型,使用遗传算法
28、对 XGBoost 的超参数进行了优化,基于 GOSE 探测数据、全球地面中子探测器的探测数据、太阳黑子数与地磁活动指数建立了训练集。构建的模型能较好地实现对平静时期同步轨道宇宙线环境的反演,MSE 为 0.499。然而,受限于探测数据,模型的反演结果无法准确延伸到 GeV 量级。随着辐射探测技术的发展,如果能够获得更多高能粒子的探测数据,并应用在模型的构建中,则能够扩充模型的结果,提高模型的精度。对于宇宙线的各个组成部分,考虑到现有的公开探测数据的体量和范围,本文仅选择了宇宙线质子作为研究对象,但是重离子在辐射环境对人体造成的辐射剂量中占据了较大的比例,如果能够收集到关于宇宙线重离子的探测数
29、据,就能扩大模型的应用范围,使模型更好地为航天员的生命安全服务。参考文献:CaoMeng,DengJiahao,HeWeifan,etal.Geant4simulationofenergydepositionratioandphysicalprocessesofCdZnTecrystalsirradiatedbyhighenergyparticlesJ.AppliedPhysicsA,2023,129:595.1LoffredoF,VardaciE,BiancoD,etal.ProtonsinteractionwithNomextarget:secondaryradiationfromaMon
30、teCarlosimulationwithGeant4J.AppliedSciences,2022,12:2643.2YeBing,CaiLi,WuZhaoxi,etal.InvestigationofradiationresponseforIII-VbinarycompoundsemiconductorsduetoprotonsusingGeant4J.NuclearInstrumentsandMethodsinPhysicsResearchSectionB:BeamInteractionswithMaterialsandAtoms,2022,529:38-48.3LotoaniuTM,Si
31、ngerHJ,RodriguezJV,etal.SpaceweatherconditionsduringtheGalaxy15spacecraftanomalyJ.SpaceWeather,2015,13(8):484-502.4Davis A J,Mewaldt R A,Binns W R,et al.The evolution of galactic cosmic ray element spectra from solar minimum to solar maximum:ACEmeasurementsC/Proceedingsofthe27thInternationalCosmicRa
32、yConference.2001:1.5BadhwarGD,ONeillPM.AnimprovedmodelofgalacticcosmicradiationforspaceexplorationmissionsC/Proceedingsofthe22ndInternationalCosmicRayConference.1991:643-646.6NymmikRA.Initialconditionsforradiationanalysis:ModelsofgalacticcosmicraysandsolarparticleeventsJ.AdvancesinSpaceResearch,2006
33、,38(6):1182-1190.7ONeillPM.Badhwar-ONeillgalacticcosmicraymodelupdatebasedonadvancedcompositionexplorer(ACE)energyspectrafrom1997topresentJ.AdvancesinSpaceResearch,2006,37(9):1727-1733.8AdamsJH.Cosmicrayeffectsonmicroelectronics.PartI:thenear-earthenvironmentR.Memorandum:NRLReport,1986,A506.9BelovA.
34、Largescalemodulation:viewfromtheearthJ.SpaceScienceReviews,2000,93(1):79-105.10100101102103105104103102101100101102103energy/MeVactual valueestimateCREME96AP8flux/(cm2s1 MeV1)Fig.5Calculatedfluxescomparisonamongourmodel,theCREME96model,andAP8modelinsolarminimum图5太阳活动极小年模型的预测值与 CREME96模型、AP8 模型的对比105
35、104103102101100101102100101102103actual valueestimateCREME96energy/MeVAP8flux/(cm2s1 MeV1)Fig.6Calculatedfluxescomparisonamongourmodel,theCREME96model,andAP8modelinsolarmaximum图6太阳活动极大年模型的预测值与 CREME96模型、AP8 模型的对比陈建飞,等:基于机器学习的地球静止轨道质子能谱反演104002-5都亨,叶宗海.低轨道航天器空间环境手册M.北京:国防工业出版社,1996.(DuHeng,YeZonghai.
36、LoworbitspacecraftspaceenvironmentmanualM.Beijing:NationalDefenseIndustryPress,1996.)11TomassettiN,BertucciB,DonniniF,etal.Datadrivenanalysisofcosmicraysintheheliosphere:diffusionofcosmicprotonsJ.RendicontiLincei.ScienzeFisicheeNaturali,2023,34(2):333-338.12VetteJI.TheAE-8trappedelectronmodelenviron
37、mentR.Greenbelt:UniversityofMichiganLibrary,1991.13vakyanSV,VoroninNA,NikolskyGA.ResponseofatmosphericpressureandairtemperaturetothesolareventsinOctober2003J.GeomagnetismandAeronomy,2015,55(8):1180-1185.14KudelaK,StoriniM,HoferMY,etal.CosmicraysinrelationtospaceweatherJ.SpaceScienceReviews,2000,93(1
38、):153-174.15Solanik M,Bobk P,Geni J.Geliosphere-parallel CPU and GPU based models of cosmic ray modulation in the heliosphereJ.Computer PhysicsCommunications,2023,291:108847.16罗昊鑫,姚宇翔,潘文武,等.基于神经网络的消色差旋转双棱镜反向解算J.强激光与粒子束,2023,35:071008.(Luo Haoxin,Yao Yuxiang,PanWenwu,etal.Inversecalculationofachromat
39、icRisleyprismbasedonneuralnetworkJ.HighPowerLaserandParticleBeams,2023,35:071008.)17简讯第九届高能量密度物理青年科学家论坛在北京成功召开2023 年 8 月 24 日至 27 日,第九届高能量密度物理青年科学家论坛在北京怀柔成功举办。本次论坛由中国物理学会高能量密度物理专业委员会和中国物理学会粒子加速器分会主办,北京大学、中国科学院物理研究所、中国科学院高能物理研究所承办,广东省新兴激光等离子体技术研究院、强激光与粒子束编辑部、MRE编辑部协办。会议吸引了来自全国 38 个高校和科研单位的 400 余人参加。开
40、幕式由大会承办单位北京大学物理学院马文君教授主持,并代表承办单位致词,马文君教授报告了大会的筹备情况;高能量密度物理专委会秘书长、中物院激光聚变中心副所长赵宗清研究员代表专委会致词。“高能量密度物理(HighEnergyDensityPhysics,HEDP)”是研究能量密度大于 1011J/m3的极端状态下物质特性和运动规律的新兴物理学前沿交叉学科,其研究对惯性约束聚变、加速器物理、实验室天体物理、极强场物理、国防等领域具有极其重要的意义。随着高能量高功率激光技术的突飞猛进,现在运行中的激光装置能输出最高能量达 105焦耳量级的纳秒激光脉冲,以及峰值功率达 1016W 量级的飞秒激光脉冲(功
41、率密度可达 1023W/cm2)。这为人们在实验室条件下进行高能量密度物理的自主可控研究提供了前所未有的重要实验手段。“高能量密度物理青年科学家论坛”是每年一次的全国性学术会议,旨在为青年学者的交流合作提供良好的学术平台,推动这一新兴交叉学科的快速发展。会议主要聚焦于激光驱动的粒子加速与新型辐射源、超强激光实验方法与技术、惯性约束聚变物理、高能量密度下的物质特性、极强场物理、实验室天体物理、激光核物理等方向。本次会议共有口头报告总数 133 个,包括论坛邀请报告 18 个、分会邀请报告 38 个和一般口头报告 77 个,张贴报告 79 个。论坛报告人为活跃在高能量密度物理等各个研究领域的中青年学者和研究生。他们介绍了各自在本领域近期的研究新进展,并在报告结束后,进行了提问和讨论。在海报环节,学术委员会通过投票从中选出了 12 个优秀海报,并向报告人颁发了优秀海报奖。本次会议为中青年学者、研究生的交流合作提供了良好的学术平台,加强了国内相关研究单位的相互了解、合作和资源整合,进一步提升了高能量密度物理专业委员会和粒子加速器分会的影响力。经大会商定,下一届高能量密度物理青年科学家论坛由西安交通大学具体承办。(强刊编辑部王涛)强激光与粒子束104002-6