1、Jun.2023JOURNALOFCHENGDUUNIVERSITYOFINFORMATIONTECHNOLOGY2023年6 月Vol.38 No.3报工程大学学第38 卷第3期成都阝信息文章编号:2 0 96-16 18(2 0 2 3)0 3-0 32 4-0 6成都区域气象站自动分型方法设计及应用夏昕1,王冬萌,贺南3(1.成都市气象局,四川成都6 11130;2.成都信息工程大学通信工程学院,四川成都6 10 2 2 5;3.成都温江国家观象台,四川成都6 10 2 2 5)摘要:为快速区分下垫面不同气象站类型,采用一种区域气象站自动分型方法。选取两个日气温极小值之差在-5 5站点,
2、以0.1为步长划分档位,按照温差值的高低顺序排列温差;统计90 天内,各档温差值出现的频数,得到反映某个温差位拥有多少样本量的频次分析序列,取样本量的中位数频次进行归一化处理,即为特征频率,记为F;设置量化因子K,量化距离影响因素,下垫面一致性的影响可用K,体现。最终结果表明,经运算分型站点被自动分为A、B、C3个大群,通过观察A群和C群可知,乡村型站点与城镇型站点在地理分布上被清晰地自动区分,通过对A群C群进行抽样检查,及对城市站点与乡村站点的数据比对,验证了运算分型的有效性。关键词:分型;日最低气温差值;频率;下垫面类型中图分类号:TP311.11文献标志码:Adoi:10.16836/k
3、i.jcuit.2023.03.0120引言为提供精细化气象服务,提升气象减灾防灾能力,中国陆续建设了大量区域气象自动站,其中成都地区自动气象站的总量已超过50 0 个。为满足社会对气象服务工作提出的更高要求,气象监测网格将进一步加密,台站数量还将继续增长,台站管理和数据应用面临全新压力:尽管区域站连续监测的雨量、风速等实时数据已在防灾减灾等气象服务工作中发挥了重要作用,但由于气温测量数据受局部环境条件的影响很大 1-2 ,同时数量巨大的区域自动站并不适宜沿用国家级站点(大监站)的建设和维护标准,区域自动站监测数据的可比性、代表性和数据序列的连续性受到不同程度局限,使区域自动站的数据在精细化预
4、报与服务等领域的应用价值未能充分体现;尤其设置在市区内的站点受场地限制,因道路、公园水体等外部环境受到的影响显著 3-10 ,自动站测量值的精细化应用更需要准确匹配站点的背景环境条件,但这对环境变动频繁的区域站而言有一定难度。在站点数量迅速增长和城市建设发展的背景下,如何从大量建成站点中快速筛选出观测环境已发生较大变化、观测数据质量下降的站点,为站点迁址、优化布局、数据精细化管理等提供参考依据方面进行了研究。通过气象大数据的聚类分析有益于实现站点自动化分型 1-12 ,但气象数据的聚类还需注重物理机理 13 以便于应用解析。贺南等 14 在对成都地区气温收稿日期:2 0 2 2-0 7-18极
5、小值的站间空间差值序列的频数分析中注意到,较高的频率与两个站观测条件的一致性有关联,并同阴晴等天气条件也有关联 15-19,频率与站间距离等客观因素也联系密切,因此可考虑使用分析温差的频率特点这种技术线路,实现区域站点依照观测环境条件聚类分型,以解决区域自动站数据应用中的实际环境背景的主动识别问题 2 0 1区域气象站自动分型方法1.1资料数据资料来源于成都地区14个国家气象站近10年逐日历史资料和2 52 个建站时间较长区域自动站近5年逐小时资料,区域站小时数据剔除异常值后计算得到逐日最低气温。气象站自动分型方法中采用聚类方法对分型量化因子做进一步处理,从而实现聚类分型1.2数据处理分型运算
6、使用的数据为通过两个站点日最低气温的差值生成的温差位/频率序列(X,f),整理时将站A的日气温极小值与站B的日气温极小值一一对应求差,该差值记为Tmin,此时TminE1、-0.2、-0.1、0、+0.1、+0.2、。通常ATm-5,在这个值域内,用0.1为步长,按照温差值的高低,顺序排列温差,温差的档位值记为X”,令X,=0.1i,i=,-4,-3,-2,-1,0,+1,+2,+3,+4,。单个由两个站点生成的Tmn会对位夏325昕动分型方法设计及应用第3期某个档位的X,值一次,即Tmin=X,时,计数P,=1;取一个时段共M天,将可以用M个T构成Tmm的时间序列(Tmj),j=1,2,3,
7、,M),在这个序列中,统计出各档X,温差值上Tmn出现的频数f(x):j=Mf(x;)=ZPiT m i n j=X,则P,=1;T m i n j+X,则P,=0即可以得到反映某个温差位X,拥有多少样本量的频次分析序列(X,f(x,)。观察不同长度的时间序列时,需将频次量转化为归一化的频率值F,数据处理流程见图1。以0.1为间隔,计算开始5之间每档温差的频率(X,F)导入最低气温序列计算中位值的频率输出值站点配对,计算温差序列结束图1F值计算流程1.3客观基础分析所选用的特征频率反映一段时间内两个站点日气温极小值的差值的分布特征,差值集中时特征频率较高,差值分散时特征频率较低,由于以往对这类
8、频次/温差位数据序列进行系统分析的理论文献够不丰富,因此对于分型方法的客观依据的阐述,以常识性规律的归纳为主,包括:(1)如果一个站点环境干燥,另一个站点环境湿润,它们之间的气温差值分布相较于两个湿润的站点间的气温差值分布要分散一些;两个荒漠环境下干燥站点间的气温差值分布比两个临海环境下湿润的站点间的气温差值分布分散,这说明地面观测站点的环境条件,与两个站点的气温空间差值的分散程度存在关联,进而也就与特征频率有关联。(2)即使下垫面条件相近,相对干燥的冬春季,与水汽充分的夏秋季相比较,站点之间产生的气温差值也会相对分散,再次说明观测环境中的含水量等因素与特征频率有关联。(3)受地形等地理条件影
9、响,对天气系统能同步响应的站点之间产生的温差值会相对集中一些,说明两个站点的地形系数差异对特征频率会有影响。(4)在众多无风的安静夜晚,空气团的热交换形式主要是长波辐射散热,日气温极小值形成的机理较单一,便于更稳定地提取下垫面的特征信息,同时,日气温极小值对环境敏感,如通常城市中测得的日气温极小值会高于郊外,因此气温极小值为基础的数据序列中隐含有可以用于提取分析观测环境的信息,(5)天气背景条件为阴天时,站间的日最低气温差值更为集中。使用阴天较多的成都地区国家站30 a的74710组有日照背景的站间最低气温差值样本,同45828组两站均无日照条件的站间最低气温差值样本相比较,后者的温差值分布更
10、集中(参考频次中位数对应的温差位的绝对离差值小30%),这显示出站间日最低气温差值的分布方式,以及特征频率还会附带有天气背景条件的波动量。但特征频率中的环境影响量却是比较稳定的值,因而可以通过对较长时间序列的观察削弱天气背景影响,突出特征频率中的环境影响量。(6)间距小的站点间,温差值的分布要集中很多,距离对特征频率的影响强势并且恒定,因此,要突出观测环境量的影响必须消除距离影响因素,这是方法的运算基础。1.4实验设计成都地区气候平和,有很多无风和寡照的天气,有较多日最低气温是在绝热环境下的昼夜日周期背景下形成 15,站间的气温差值分布集中并且比较稳定,有利于提取下垫面的差异信息。当使用一定时
11、间长度序列,平均化天气条件对特征频率F的影响使其稳定,再设置量化因子K,量化距离影响因素K,=aF/aD(式中F指特征频率,D指站间距离),进而下垫面一致性的影响就可以用K,体现。通过选用观测条件一致的站点组合的K,值作为判断两个站下垫面一致性的参照指标,再对本地国家站、区域站间的大量温差数据组合的排序计算,就可以实现区域自动站以足够的一致性指标K,值聚类分型。通过统计成都地区站点间组合的距离D与特征频率F,可以粗略得到F随D的渐变关系F=KD+11.3,如图2 所示。12108%/64I:=KxD+11.3k=-0.132001020304050D/km图2成都地区国家站呈现的频率与距离的关
12、系图2 中,如果F值在距离增加时急速衰减,说明两个站点不容易重叠出现固定气温差异值,联系不稳定,即关系式中K对一致性有所反映。但斜率k不方便观察,K,将斜率k的变动量转化为便于比对的指标化倍率值,整理成都本地样本的实际数据可以得到=(K D)+23KD+128)D。由此这些样本的K,提取式为大326息程都报成第38 卷信学学(K,=(KxD)+23KxD+128)xD)/2(12 kmD55 km)F-11.3K=(F11.3)D指标值K,中和了距离权重后,不再随距离变化,图3为成都地区国家站间形成的K,值。0102030405060D/km图3国家站之间呈现的K,指标与距离的关系K,指标量不
13、随距离变化的特点,为观察特征频率中的其他影响因素提供了基础,图4中的A,B,C3个站点,A,B站点为环境理想的站点(国家站),C为观测环境遭受干扰的站点(国家站),在同一时段,A,B站点间的K,值达到45,但A,C之间K,值为35,B,C之间K,值只有32,这组样本中,C站的观测环境异样对K,的影响很明显。N5图43个样本站的环境影像(1:2 2 56)K,指标整合了F值与站间距离的关系,同一间距上F越高两个站点的环境相似度会越高;不同间距则K,越大,两个站点的环境相似度会越高,因此K,可用于设置站点间的比对阀值 2 1。成都地区国家站间的K,值主要在30 48,区域站与国家站间K,值分布在8
14、 48。以国家站间的下限值30 为参考阀值,聚类分型的实现的方法流程如图4。主要流程步骤包括:基础数据导人与(Xf.)序列生成;站点地理信息导人与K,计算;K,排序;K,值聚类分型及后续分型特征解析。开始计算F值导入基础温度序列数据导入最低气温序列计算F值站点配对,计算温差序列经纬度2计算K,值以0.1为间隔,计信息算土5之间每档温差的频率(Xi,F)T计算中位值K,=30群A的频率FT群B输出值K20FTKC天数/d687564707362607161湿度AC的占比/%768371788169677968统计在表2 中的数据反映本地样本最高气温时段的相对湿度逐日对比结果,城市站点多数低于乡村
15、站点。说明分型算法区分出的乡村站点的湿度明显整体高于城市站点,分型运算有效。表3林样本90 d数据里日气温极小值时段城市站点与乡村站点相对湿度的统计比较样本1样本2样本3样本4样本5样本6样本7样本8样本9乡村型站AS1018S1024S1030S1018S1024S1030S1018S1024S1030城镇型站CS1006S1006S1006S1007S1007S1007S1009S1009S1009湿度 AC天数/d879090809070878978湿度AC的占比/%971001008910078979987统计在表3中的数据反映,本地样本最低气温时段的相对湿度逐日对比结果,城市站点绝大
16、多数情况下低于乡村站点。再次说明分型算法区分出的乡村站点的湿度,在最低气温发生时段显著整体高于城市站点,乡村站点会有更多的霜、雾、露,分型运算符合客观存在。大328息报程都成第38 卷学学信表4样本90 d数据里日气温极小值(Tmin)城市站点与乡村站点的统计比较样本1样本2样本3样本4样本5样本6样本7样本:样本9乡村型站AS1018S1024S1030S1018S1024S1030S1018S1024S1030城镇型站CS1006S1006S1006S1007S1007S1007S1009S1009S1009TminAC天数/d000141520115TminAAA的占比/%1001001
17、00828173999994表4的数据反映出,绝大多数情况下,分型归类为城市站点(C)的样本站点的日气温极小值要高于归类为乡村型的站点,这种结果符合常识,再次说明分型算法准确有效。特别说明的是,在这组随机抽取的6 个数据样本站点中,3个城市型站点间距10 15km;3个乡村型站点中,S1018距3个城市型站点间距2 0 30 km,距另外两个乡村型站点间距为55km和6 5km。3结束语提出一种区域气象站自动分型的方法,分型算法能够综合反映站点下垫面差异,算法输出的结果在气象观测台站管理应用、结论的物理机制解析以及相关理论的建立完善等方面都有实质意义。方法采用的观测数据为一个空间区域内的气温差
18、异量,是很重要的热动力基础值,但这个量的演化规律在以往台站管理中很少被发掘应用,根据算法输出结论的精细程度,利用这种方法可以解决的问题包括:对大量区域自动站的观测环境异常变动的自动化在线识别;对站点的布局进行客观研判和优化;与测量数据配套的精细化地形系数的自动生成;分布式观测系统的构建;以高精度监控阀值改善数据质量等。其中分布式观测系统架构下站点的互补替代与数据的平行应用较为常见,如解决成都站数据的替代与延续需求。参考文献:1李林,孙赫敏,乔晓燕,等.探测环境对北京气象站气温观测值的影响分析 J.气象与环境学报,2 0 19(4):12 0-12 6.2徐新良.基于气象站观测数据的京津冀城市扩
19、展对气温变化的影响研究 J.地球信息科学学报,2 0 19(7):10 8 6-10 96.3罗丽,郭建侠,陈一枝,等.公路路面热效应对环境气温的影响分析 J.气象科技,2 0 18(2):40 3-411.4徐园园,任永建,许存华,等.城市化对咸宁地区气温变化的贡献分析 J.江西农业学报.2 0 17(5):101-106.5岳艳霞,智利辉,王磊,等.石家庄市区域自动气象站气温数据适用性分析 J.气象与环境学报,2 0 17(2):53-6 2.6张媛,任国玉.无参考序列条件下地面气温观测资料城市化偏差订正方法:以北京站为 J.地球物理学报,2 0 14(7):2 197-2 2 0 7.7
20、李娇,任国玉,任玉玉,等.资料均一化对沈阳站气温趋势和城市化偏差分析的影响 J.大气科学学报,2 0 14(3):2 97-30 3.8苑佳佳,沈雪峰,郭建侠,等.水体对气温观测影响的试验分析 J.气象科技,2 0 14(3):496-50 2.9沈滢洁,王成刚,曹乐,等.屋顶绿化对城市降温效应的模拟分析-一以南京市为例 J.气象,2017(5):610-619.10贾红莉.不同下垫面对气温观测的影响分析J.南方农业,2 0 16,10(9):2 2 0-2 2 1.11玉坤.空间数据聚类在气象灾害预警中的应用J.电子技术与软件工程,2 0 18(9):16 4-16 5.12张瑶,历超,王子
21、洋.聚类分析在气象数据处理中的应用 J.林业勘查设计,2 0 10(3):37-39.13 严中伟,李珍,夏江江.气候序列的均一化定量评估气候变化的基础 J.中国科学:地球科学,2 0 14,44(10):2 10 1-2 111.14贺南,文斌,陈乐,等.一种新的气象数据分析和误差诊断方法 J.成都信息工程大学学报,2019,34(4):342-345.15张学文.熵气象学M.北京:气象出版社,1992:153.16屠其璞,翁笃鸣,武全,等.气候资料超短序列订正方法讨论(上)J.南京气象学院学报,1978(1):59-67.17李庆祥,刘小宁,张洪政,等.定点观测气候序列的均一性研究 J.气
22、象科技,2 0 0 3(1):3-10.夏329听型方法设计及应用第3 期18周子康.山区气温超短序列延长方法的讨论J.农业气象,198 3(2):53-6 1.19 吴雪.城市化进程对气温变化的分析一以北京、郑州、南京、杭州城市为例J.内蒙古气象,2 0 19(3):42-45.20汤绪.超大城市气象观测网的设计与应用,J.气象科技进展,2 0 16(4):8-17.21 贺南,夏昕,杨乐,等.一种区域自动气象站客观分群方法 P.发明专利,ZL2020.1.1253654.7.Design and Application of Automatic ClassificationMethod f
23、or Chengdu Regional Weather StationXIA Xin,WANG Dongmeng,HE Nan(1.Chengdu Meteorological Office Chengdu China Postcode,Chengdu 611130,China;2.Chengdu University of Information TechnologyChengdu China Postcode,Chengdu 610225,China;3.Wenjiang Meteorological Office Chengdu China Postcode,Chengdu 610225
24、,China)Abstract:In order to quickly classify different types of weather stations on the underlying surface,an automatic classifi-cation method of regional weather stations is proposed.First,the temperature data selected from the stations where thedifference between the two minimum daily temperature
25、values is between-5 C and+5,i s d i v i d e d w i t h a s t e p o f0.1 C as,and sorted according to the temperature difference value;then the frequency analysis sequence reflecting thesample size of a certain temperature difference position can be obtained from the temperature difference values of e
26、ach in-terval within 90 days.And the median frequency of the normalized sample size is taken as the characteristic frequency,marked as F;finally,the quantization factor is set K,quantifies the factors affecting distance,and the influence of theunderlying surface consistency can be reflected in Ky.Th
27、e final results show that,the stations are automatically dividedinto 3 groups:A group,B group,and C group.By analyzing groups A and C,it can be concluded that the geographicaldistribution of rural and urban stations is clearly defined.The validity of the operational classification was verified bysampling inspection of group A and group C and comparing the data of urban and rural sites.Keywords:classification;daily minimum temperature difference;frequency;underlying surface type