收藏 分销(赏)

气象统计方法第一章.ppt

上传人:精**** 文档编号:7988865 上传时间:2025-01-30 格式:PPT 页数:107 大小:1.26MB 下载积分:18 金币
下载 相关 举报
气象统计方法第一章.ppt_第1页
第1页 / 共107页
气象统计方法第一章.ppt_第2页
第2页 / 共107页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,要求:,1、掌握气象上常用的一些统计方法,运用这些方法进行资料分析,在此基础上作一些简单的气候预测等,2、了解其它方法在业务和科研中的应用,对后期学习起引导作用,气象统计方法:,利用统计方法对气象资料样本进行分析来估计和推测总体的规律性,为气象预报提供依据。,课时安排,总学时,:48学时(1-16周),讲授为主,课堂练习,考核方式,平时成绩,(出勤、课堂作业),期末考试,参考书目:,1、李湘阁等气象统计方法,,2、黄嘉佑著气象统计分析与预报方法,气象出版社,2004.3,3、施能著气象统计预报,气象出版社,2009.11,4、吴洪宝等著气候变率诊断和预测方法,气象出版社,2010.6,5、魏凤英著现代气候统计诊断与预测技术,气象出版社,2009.9,1.气象要素,大气温度、压力、空气湿度、风向和风速、降水、云、雾、雷暴、辐射、能见度等,还有土壤、陆面植被、海洋等监测要素,一、气象资料(研究对象),气象监测意义:,记录天气、气候的实际情况,了解气候的基本状况,分析研究气候变化规律,气候预测,(第一张天气图的诞生),气象中单个或多个要素可看成为统计学中单个或多个变量。,二、气象资料的表示,第一节,单个要素的气象资料,1、,数据的表示:,某要素,x,有,n,次观测值,其向量表达形式为,或者,n 样本容量,时间序列概念,数据是随时间变化的序列,习惯称为时间序列。例如:取某要素月平均值的,n,年资料,几何意义:,(1),n,维空间中的一个点,(2)一维空间(单坐标)中的,n,个点,举例:,1.某站点1958至2007年的气温,2.某站点1960至2010年一月份的气温,3.某站点某时段冬季/夏季降水,2、数据资料的,统计特征,要素样本中资料分布的特点-用一些统计量表征。,1)平均值,含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。,平均值概念在气象上的应用:,气象上的月平均气温、年平均气温及某要素多年平均值就是这种统计量。,例如:某地气候状态(对于逐月资料,一般分别求各月多年的平均值,所以会有,12,个月平均值场;逐日资料也是类似)。,气象研究中,不同时间分辨率气象资料的使用(逐日资料、月资料、年资料等),举例:,江苏气候?,江苏省1958-2007年月平均气温,江苏省各月气温平均值(气候态),江苏省1958-2007年冬季月平均气温,2)距平,含义:,反映数据偏离平均值的状况,也是通常所说的,异常,。,距平序列,:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向量。,气象上的应用:,中心化的概念:,把资料处理为距平的方法叫,中心化。,气象上常用距平值代替原样本中的资料值作为研究对象。,中心化的必要性:,因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。,特性:,距平值的平均值为,0,,使用方便;,直接作为预报值,比较直观(偏高,/,偏,低)。,3)方差和均方差(标准差),对气象要素x,资料长度n,其表达式:,含义:,是均方差(标准差),描述样本中资料与平均值差异的,平均,状况,反映变量围绕平均值的,平均,变化程度(离散程度),是方差。,方 差,向量表示形式:,气象上的应用:,1),如果,12,月份气温标准差比,1,月份大,反映了,12,月份气温随时间变化幅度比,1,月大。,2),对于同一个月(例如,12,月),如果南京气温的标准差比拉萨小,,,表,明,拉萨冬季气温的变化幅度比较大。,(,内陆日变化较沿海大,这个日变化大小的比较使用的是标准差的比较,),江苏省各月气温标准差,3)均方差小的要素预报比大的困难还是容易?原因?,4)变量减去某常数后均方差相同。,5,)标准差与变量值同量纲,,一般用标准差表示变量取值变化的大小。,数据的标准化,对气象要素x,资料长度n,其表达式:,特征:1)标准化变量的平均值为0。,2)标准化变量的方差为1。,为何要进行标准化?,各要素,单位不同,、,平均值,和,标准差,也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量-,标准化变量,。,江苏省气温异常及其标准化,降水距平百分率,距平/平均值*100%,1)计算降水距平,即观测值减去平均值,2)1步骤所得结果除以该平均值,乘以100,,即为降水距平百分比,注意:,当观测值序列时间比较长,超过30年,可以选择19802009的平均值,作为步骤1中的平均值,4),变率和变差系数,1)意义:,说明变量值变化的大小。,2)变率,绝对变率,:距平绝对值的平均。,相对变率:,绝对变率与平均值之比,3)变差系数,标准差与平均值之比(%),表示变量的相对变化,,注意:,绝对变率和标准差的数量级与变量平均值的量级有关。,有些同类型变量,彼此之间,平均值差别大,,若要比较它们的变化性用绝对变率和标准差不恰当,应当利用,相对变率,或,变差系数,。,5)频率分布,累积频率概念的引入:,平均值和均方差相同,但取值很大区别,区别其特征,就需要引入新的统计量-,累积频率,。,累积频率,:变量小于某上限的次数与总次数之比。(,样本特征,直方图,),总体(母体):,统计分析对象的全体。,样本:,总体中的一部分。,三、总体和样本,理解与应用:,总体的特征是,客观,存在的,样本的特征,随样本而变,,与其有关,的变量均称为随机变量,如平,均值、均方差等,选取,有代表性,的样本很重要,样本量,n=30,根据数理统计中的大数定理推断得到。,气象上的总体指无限总体,一组气象资料就是无限总体的样本。总体与样本关系的相对性。,大数定律,大数定律又称大数法则、大数率。在一个随机事件中,随着,试验次数的增加,,事件,发生的频率趋于一个稳定值,;同时,在对物理量的测量实践中,大量测定值的,算术平均也具有稳定性,。在数理统计中,根据,贝努利定理,辛钦定理:,当n很大时,算术平均值接近数学期望;,频率以概率收敛于事件的概率。,1)分布函数,无限,总体,的累积频率,称为概率密度函数,其最常见的形式是正态分布,和 分别是总体平均值(期望)和标准差,可以用样本平均值和均方差去估计。,,,正态分布曲线,标准化变量的平均值为0、方差为1。,特点,:1)标准化正态分布随机变量的绝对值大于2.58(1.96)的概率仅为0.01(0.05),2)不同要素变量作图,3)标准化变量值的取值范围(+/-3之间),大于3的概率仅为0.0027,世界气象组织(WMO)旱涝年确定标准:距平达到或者大于2倍均方差,出现概率不到5%年份。,江苏省冬季气温数据分布图,江苏省月平均气温标准化数据,P(|T|=2)=0.0483;P(|T|=3)=0.005,2)正态分布的统计检验,大多数气候诊断方法和预测模型是在气候变量呈,正态分布假定,前提下进行的,所以对气候变量是否呈正态分布形态的检验是十分必要的。正态分布检验不仅可以判断原始变量是否遵从正态分布,还可以检验那些原本不遵从正态分布,但经过数学变换后的变量是否已成为正态分布形式。,(1)概念,峰度系数,与,偏度系数,是用来衡量随机变量概率密度分布曲线形状的数字特征,描述了气候变量的分布特征。,偏度系数,:表征曲线峰点对期望值(平均值)偏离的程度。,峰度系数,:表征曲线分布形态顶峰的凸平度(即渐进于横轴的陡度)。,(2)标准偏度系数和峰度系数的计算公式为:,其中,和 s 分别为样本均值和标准差。,g,2,=,g,1,=,偏度系数:,峰度系数:,标准偏度系数的意义,测量数据分布的不对称性情况,,刻画以平均值为中心的偏向情况,,g,10,,表示正偏,即均值在峰值的右边;,g,1=0,,表示对称分布,标准峰度系数的意义,测量分布图像坡度的缓急程度,g20,表明图形坡度偏陡,若,g1=0,g2=0,时,表明研究变量为理想的正态分布变量,(3)显著性检验,(4)资料的正态化,1、正态化的必要性,各类统计预报模型和统计检验方法(Ftu 检验)要求资料是符合正态分布。,年月平均气温气压多雨地区的月降水量符合!,日降水,和,少雨地区月降水,通常偏态。旬候降水不一定!,2、资料正态化处理方法,1.立方根或四次方根;,2.双曲正切转换(纠正课本公式)-旬降水;,3.化为有序数后的正态化转换(标准化和正态化)。,江苏省全年月降水数据分布图,课堂练习,利用该资料,计算相关统计量和分析数据特征,江苏省夏季降水资料(,1978-2007,),江苏省夏季降水的气候态及变化特征?,1958-2007年x、y海温、降水资料序列,*,也可以理解为同一要素多个格点(站点)的资料,下面慢慢体会。,第二节 多要素的气象资料,一、数据矩阵,多个气象要素的样本如何表示?-,矩阵。,设有,m,个气象要素,每个要素有,n,次观测值,则数据矩阵为:,(,2.1,),第,t,个样本的资料向量为,(,2.2,),两个方面来研究问题(,),“,R型分析,”,:,研究不同要素或变量(如同一,要素不同格点之间)的关系。(列),“,Q型分析,”,:,研究样本之间的关系(行)。,二、数据的两种空间表示(几何意义),1、n维空间中的 m个点(行),m个变量(格点、站点)确定了n维空间中的 m个点;,用来研究变量(或者不同格点、站点)之间的关系。-相关关系,如两个变量之间的相关系数,2、m维空间中的n个点(列)-空间点聚图,一个样本对应m维空间中的一个点,;,分析样本之间的关系时用到,如寻找相似个例。,三、均值向量,m个变量的样本平均值组成的向量。,m维空间中的n个点的,重心,(各部分受到的重力作用集中于一点,这一点就是重心)。,(,2.3,),多年平均1月气温(19712010年),多年平均,7,月气温(,19712010,年),多年平均,1,月降水量(,19712010,年),多年平均,7,月降水量(,19712010,年),四、距平向量,其表达式为,:,降水距平百分率,距平/平均值*100%,1)计算降水距平,即观测值减去平均值,2)1步骤所得结果除以该平均值,乘以100,,即为降水距平百分比,注意:,当观测值序列时间比较长,超过30年,例如可以选择19812010的平均值,作为步骤1中的平均值,五、协方差和协方差矩阵,1.协方差,衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系),另外一个统计量叫相关系数(以后讲解)。,表达式:,(,2.4,),距平的内积,协方差气象意义的进一步理解:,1)反映了两个气象要素异常关系,的平均状况,或者两个变量的正、负相关关系。,两变量关系越密切,其协方差的绝对值越大,,,如理解(气温为例):,前冬气温负距平(冷)、后冬正距平(暖)-协方差负值-反相关,前冬气温正距平(暖)、后冬正距平(暖)-协方差正值-正相关,2)变量自身的协方差就是方差。,距平的乘积,X1与x2的距平符号相同率高,有相同的变化趋势,,x2与x3的距平符号相反率高,有相反的变化趋势;,两组变量均有良好的相关关系。,问题:,协方差带单位,不同要素之间不好比较,以后学习相关系,数可解决这个问题。,2.协方差矩阵,m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。,(,2.6,),协方差的另一种表示:,用,离差积,表示,构成离差矩阵。,总体协方差矩阵的无偏估计,(,2.7,),(,2.8,),状态资料和统计特征,1、状态资料,表征气象要素的各种状态,观测结果无法用数据表示。,如雾、冰雹、霜-用,“,有,”,、,“,无,”,、,“,强,”,、,“,弱,”,等表示。,雨的强度-等级表示,如大暴雨、大雨等。,风的强度等级-1级、2、。12,2、频率表、分布列,如何描述状态资料的统计特征?,列出各个状态出现的频率。,对样本而言是,频率表,,总体而言就是,分布列,。,3、多维频率表、多维分布列,针对气象要素的状态资料;,概念:,统计多个气象要素(现象)的各种情况,下的频率,组成一张多维频率表。,优点:,对预报有参考价值。,7月份某气象站24小时内(08时到次日08时)降雨量与08时绝对湿度关系,重要天气气候事件及其影响,1、台风,2012年8月我省先后受到,5个近海,和,登陆台风,的直接或外围环流系统影响,台风影响个数偏多。5个热带气旋分别是9号台风,“,苏拉,”,、10号台风,“,达维,”,、11号强台风,“,海葵,”,、14号台风,“,天秤,”,和15号超强台风,“,布拉万,”,。其中,,,“,海葵,”,对我省的影响特别严重,其风雨程度超过2005年的台风,“,麦莎,”,,是1991年以来影响江苏最严重的台风,。,2、强对流天气,据不完全统计,2012年8月江苏省因强对流天气过程共造成多人伤死,房屋损坏,农田受灾。8月苏州出现8个强对流天气日,其中出现雷雨大风短时强降水,冰雹,龙卷风袭击,,8月26日17:30左右,江苏洪泽湖上出现了难得一见的“龙吸水”现象,,巨大的水柱连接水天。灰色水柱从远处的乌云中垂落湖面,像吊在空中晃晃悠悠的一条巨蟒,这时候的天空依然可见蓝天白云,拖着水柱的那片乌云分外显眼。,3、暴雨洪涝,4、高温,8月苏南大部地区出现26天高温天气常州出现高温6天。因高温引发头痛的病人频频增加,其中感冒、发烧引发头痛者最多。,5、雾霾,8月连云港市共出现区域性大雾天气2次,全市大部分地区出现能见度低于500米的浓雾,最强时段能见度低于200米,对交通运输和旅客出行造成了一定影响。,第三节 气候资料的审查与订正,1、什么叫资料均匀或均一,2、什么是可靠的观测序列,3、资料的订正,插补、纠正、延长,资料的订正,(,插补、延长,),资料订正问题的发展史,空间均一性,*,在统计各种气候指标、进行气候分析之前,对气候资料的质量应该进行审查,。,(,一,),气候资料的误差,从统计意义上讲,各种气象要素观测值都可以看作随机变量。一地的气候状态可以用各种要素的统计特征值来表示,如算术平均值、均方差等实质上是要素总体数字特征的样本值。,气候指标是否反映真实的气候状态,,取决于:,数字特征样本值对总体值的,抽样误差,如样本平均值的抽样误差,一般的,样本容量越大,特征值的抽样误差越小,。,m,为真实平均数,.,2,),要素观测值对真值,的观测误差,*,系统误差,:,由于仪器不良、观测方法不完善,在各次观测中的大小和符号保持不变。,通过校正仪器和改善观测方法可基本消除。,温度不超过,0.05C,,气压不超过,0.05,百帕,降水量不超过,0.05mm,(,根据规定进行器差订正后的观测值对真值的系统误差,),如果在整个记录时期,误差无改变,,则由,N,次观测求得的算术平均值对真值的系统误差等于每次观测中的系统误差。,而,N,次观测值总和的系统误差将是每次观测的系统误差的,N,倍。,,,*偶然误差(过失误差):,操作不慎等,如读错数、计算错误。,一般通过对资料的仔细审核、校对,.,*随机误差:,随机因素造成,如四舍五入的小数位数的取舍、仪器刻度的限制。,随机误差各次观测值是相互独立的;所以,,旬、月、年平均气温,的随机误差一般可以忽略不计;,(二)气候资料的质量要求和审查,1、质量要求,(1)准确性和精确性,精确性:,指测量得到数据的精确程度,准确性:,指观测值与真值的符合程度,对,准确性的审查,:主要检查资料中有无明显过失误差,如发现有,应将其改正或订正,无法改正的,则不参加统计分析;,精确性的审查:,主要看其记录是否达到规定的精度,,如降水观测应达到0.1mm,。精度不够会影响分析结果,但对观测随机误差较大的一些项目,过高的记录精度也没有实际意义。,(2)均一性:,如果测站气象记录序列仅仅是气候变化的反映,那么资料是均一的。,测站位置的迁移,周围环境的改变,观测仪器和安装方法的更新,观测时制的改变,都可能破坏资料的均一性。分析时应注意。,(3)代表性,测站所在位置是否对周围一定区域范围内的气候具有代,表性,如山谷的测站代表性差。一般说,由于地理环境的差异,各个测站所能代表的范围是很不一样,的。,气候记录的代表性,是指某个测站记录能否反映我们研究地区范围内的气候状况。,在不同目的、不同尺度的气候分析中,测站代表性当然可以是不同的,。如河谷中的测站由于地形对降水的影响,常偏大,大范围气候分析中无代表性,但研究地形影响时就有代表性,.,只要观测场地的设置符合规范要求,气象站的记录都可代表类似地理环境下相当大范围的气候状况。,(4)比较性,不同测站进行气候时空变化分析时,资料要有可比性。如不同测站气候变化的空间比较时,要求,各测站的资料都在同一时期,;,另外是否相同的观测制式,仪器性能等,,如,城郊对比观测时,,最好观测同时段,使用相同的设备。,2、气候资料的质量审查,气候资料的审查是项复杂而细致的工作。,需要具备一定的气象学、天气学、气候学和气象观测知识,,更需要有相当,丰富的气候资料,工作经验,审查工作类别,通常将审查工作分为两类,,一 类:,技术性检查,另一类:,合理性检查,技术性检查,主要从下列几方面进行:,(1)查阅测站历史沿革和资料说明,分析,是否存在因测站迁移、仪器和观测方法更新、观测时制改革,等引起的非均一性。,(2)根据观测规范、统计规定、检查观测记录和统计结果,是否符合规定,、校对统计计算有否错误。,(3)检查同一要素的,各个统计项目之间,是否协调。,合理性检查,主要是以,天气学、气候学,知识为依据,从气象要素的,时、空变化规律,和,各要素问的相互联系规律,出发,分析气候资料是否合理。主要采用以下几种方法:,(1),本站,前后期资料比审法,。气候变化是缓慢的、连续的。因此虽然逐年的观测值不一样,但它们应在一个大致的水平上随机波动。如果通过前后资料的对比,,发现资料序列中存在明显的不连续变化,,则可能存在非均一性,应配合测站历史沿革情况作进一步的分析判断。,(2),区域资料比审法,。相邻测站由于受同一天气系统的影响,常常有相当好的一致性和相关性。,相邻测站气象要素之间的相互联系规律,,可以成为我们发现和订正错误记录的重要依据。,(3),气象要素相关法。,各种不同的气象要素从不同的测面描写了一地的天气气候特征以及它们之间存在着各种不同程度的相关。在实际工作中,,常常用同一测站或者若干个地理环境相似测站的相关密切的两个要索的观测值作成相关图进行审查,。当资料符合要求时,所有点子应密集地落在一根曲线或直线附近。如果个别点子明显偏离相关线,则这个点子的观测值可能有明显的误差。,(三)订正方法,1)回归订正方法(关系密切的站),两站同一要素,:先计算相关系数,再建立,一元线性回归,方程,对周围的基本站进行逐步筛选来建立,多元回归订正公,式,是一个较好的途径。,屠先生提出:,用基本站不同要素值作为逐步回归因子,建立与订正站某一要素的联系方程,。他用上海站,为基本站,用逐步回归方法对7个因子筛选,建立,南京1月平均气温多元回归插补公式,,因此公式插补抗日战争期间南京缺测资料。这7个因子是上海1月平均气压、平均气温、平均最高气温、平均最低气温、月降水量、降水数和日照百分率。,2)差值订正法,(地理环境近似一致的站点,站与站之间差值基本为常数-气温、气压),3)比值订正法,两台站降水比值为准常数,*订正适当性的论证,*,只有在基本站与订正站距离不很远,两站气象要素相关相当密切,且平行观测时期比较长时才用回归订正法进行序列延长。如果平行观测时期不长,通常还是以采用计算简便的差值订正法或比值订正法为好。,复习思考题,1.理解并掌握统计量平均值、距平、标准差、协方差、变率、变差系数的概念,特别是其在气象上的意义。,2.思考如何求出北半球1980-2010年逐月850hPa纬向风场的气候场、异常场和均方差场,?,3.理解总体、样本、频率表、分布列的概念。,4.何谓中心化、标准化、正态化,这样做资料处理的必要性为何?如何处理?,5.如何整理区域资料。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服