资源描述
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,应用统计学,精品课程,第三章 统计量与抽样分布,Unit three,Statistics with the distribution of sample,应用统计学,精品课程,3.1,总体,、,样本与统计量,population,、,sample and sample statistics,描述分布集中趋势的统计量,Description distribution central tendency statistic,3.2,描述分布离散趋势的统计量,Description distribution discrete tendency statistic,3.3,抽样分布,Sample Distribution,3.4,应用统计学,精品课程,总体,、,样本与统计量,population,、,sample and sample statistics,3.1,在统计学中我们将研究问题的全体称为,“,总体,”,。,(,例如,:,一组混凝土试块的强度称为,“,总体,”,;,而每一个试块的强度则称为,“,样本,”,),总体,(,Overall,):,样本,(Samples),在总体中随机抽取,X,1,,,,,X,n,相互独立的总体单位称为,“,样本,”,.,样本需要满足两个条件:,(Samples need to meet two conditions),X,1,,,,,X,n,相互独立;,每个,X,i,(i,=1,n),与总体,X,有相同概率分布,.,应用统计学,精品课程,统计量,(Statistics):,总体中抽取的,(X,1,,,,,X,n,)n,个总体单位称为样本容量为,n,的样本,,n,是该样本的样本容量,N,的样本称为小样本,N,的样本称为大样本,样本容量的特点,应用统计学,精品课程,样本均值,(Sample mean),;,5.,中位数,(median),;,调和平均数,(Harmonic Average),;,3.,几何平均数,(Geometric mean),;,平均数,(mean),;,众数,(mode),;,描述分布集中趋势的统计量,Description distribution central tendency statistic,3.2,描述样本集中趋势的样本统计量,计算平均数,位置平均数,静态平均数,动态平均数,应用统计学,精品课程,3.2.1,样本均值,(Sample mean),:,样本均值是样本,X,1,,,,,X,n,的算术平均数,记为,未分组计算公式,(,No group calculation formula,),已分组计算公式,:,(Formula has Packet),备注,:,1.,称为,”,算术平均数,”,(Arithmetic averages),2.,称为,”,加权平均数,”,;,(Weighted average),区别,:,加权平均数精确性受权数,f,i,影响,当某一组的权数较大,则该组的数据对均值的影响就较大;反之,则小,3.2.2,调和平均数,(,Harmonic Average,),:,定义:样本,X,1,,,,,X,n,的各变量的倒数的算术平均数的倒数,记为,.,未分组计算公式,(No group calculation formula),已分组计算公式,:,(Formula has Packet),应用统计学,精品课程,某大坝沥青混凝土心墙在,9,月上旬,3,天用核子密度计测得沥青混凝土容重数据,:,应用统计学,精品课程,3.2.3,几何平均数,(Geometric mean),:,定义:样本,X,1,,,,,X,n,的,n,各变量乘积的,n,次方根,记为,“,”,.,当,n,时可以用对数法计算几何平均数,:,未分组计算公式,(No group calculation formula):,已分组计算公式,:,(Formula has Packet),应用统计学,精品课程,3.2.4,中位数,(median),定义:样本的各变量值按照大小顺序排列,处于中间位置的值,记为“”,未分组数据,先进行,X,1,,,,,X,n,排序,然后确定中位数的位置,其计算公式为:,n=2k+1,n=2k,已分组按照以下公式近似求解:,下限公式:,(Minimum formula,),上限公式:,(Limit Formula),注:,和,分别表示中位数所在的下限和上限;,f,m,表示所在组的频数;,m-1,表示中位数所在组下限以上各组累计频数;,m,表示中位数所在组上限以下各组累计频数;,d,表示所在组的组距,应用统计学,精品课程,3.2.5,众数,(mode),:,定义:样本数据,X,1,,,,,X,n,中出现频率最大的变量值,记为,“,e,”.,对于未分组数据,X,1,,,,,X,n,,只需找出出现次数最多的变量值即为众数,已分组样本数据计算公式:,上限公式,:,(Limit Formula,),下限公式,:,(Minimum formula),注,:,和,分别表示中位数所在的下限和上限;,f1,众数组的频数众数组前一组的频数;,f,2,众数组的频数众数组后一组的频数;,d,表示所在组的组距,应用统计学,精品课程,描述分布离散趋势的统计量,Description distribution discrete tendency statistic,3.3,3.3.1,样本方差和样本标准差,样本方差:样本数据,X,1,,。,,X,n,的离差平方和除以样本容量,n,求,平方记为,”,”,.,未分组计算公式;,(No group calculation formula):,已分组计算公式,:,(Formula has Packet),修正样本标准差公式:,应用统计学,精品课程,定义:样本数据,X1,,,,,Xn,中的最大最小值之差,记为,“”,备注:极差易受端值数据的影响,有时候不能准确的描述数据的分,散程度,定义:样本数据,X1,,,,,Xn,中的样本标准差与其均值的之比,,记为,“,V,S,”.,3.3.3,离散系数,(Discrete coefficient),:,3.3.2,极差:,应用统计学,精品课程,抽样分布,Sample Distribution,3.4,抽样分布就是统计量的概率分布。,抽样分布的方法:,1.,精确方法,(Accurate methods):,设,X,的分布已知,如果对于样本,X,1,,,,,X,n,能够确定统计量 的分布的明显表达式,这种方法叫做精确方法,所得的分布叫做精确分布。,(注:适用于小样本的统计推断问题),2.,渐进方法,(Progressive Methods):,利用极限定理,寻求在样本容量,n,无限增大时统计量的极限分布,并将此极限分布作为抽样分布近似,这种方法叫作渐进方法。,(注:适用于大样本的统计推断问题),几,种,概,率,分,布,应用统计学,精品课程,正态分布,X,2,分布,t,分布,F,分布,应用统计学,精品课程,3.4.1,分布:,设是相互独立的随机变量,且都服从正态分布,即,X,i,N,(,0,1,),,则随机变量服从自由度为,n,的 分布,记为,.,分布具有以下性质,:,若,则,EY=,n,DY,=2n;,具有可加性若,Y,1,,,Y,2,相互独立,且,,,则,当时,分布渐近于,分布密度图,应用统计学,精品课程,3.4.2,分布:,设随机变量,X,、,Y,相互独立,且,XN,(,0,1,),则随机变量,服从自由度为,n,的,t,分布,记作,t,(n,),。其分布密度为:,若,则,t,分布密度关于,t=0,对称,即有,当时,,t,分布趋近于标准正态分布,即,t,分布具有的性质:,1,应用统计学,精品课程,3.4.3,分布,:,设随机变量,x,、,y,相互独立,且分别服从自由度为,n,1,、,n,2,的,x,2,分布,则随机变量 服从第一自由度为,n,1,,,第二自由度为,n,2,的,F,分布,记为,F,(,n,1,、,n,2,)。,其分布密度为:,注:,分布对于两个正态分布的方差比的统计推断十分重要,是方差分析等统计推断的基础,m=10,n=4,m=10,n=10,m=10,n=15,F,分布密度曲线图,x,f(x,),应用统计学,精品课程,3.4.4,样本均值的抽样分布:,(Sample distribution of the sample mean),正态总体已知方差,样本均值的抽样分布,设总体,其中已知,,X,1,,,,,X,n,为从总体中抽得的一个,样本,由于,X,1,,,,,X,n,为一个简单随机样本,,X,1,,。,,X,n,相互独立且,都服从由此可知正态分布的线性函数也服从正态分布,且:,正态总体未知方差,样本均值的抽样分布,设总体,其中未知,,X,1,,,,,X,n,为从总体中抽得一个样,本样本均值为,修正后的样本标准差,则统计服从自由,度,n-1,的,t,分布,应用统计学,精品课程,3.4.5,样本比例的抽样分布,(Samples proportion of the sample distribution),样本比例是样本中具有某种特征的个体占全部个体的比例,记为,从整体中抽出一个样本容量样本具有某种特征的个数目服从二项式分布,且:,样本比例也服从二项分布,且:,注:当时,二项分布趋近于正态分布,即,
展开阅读全文