资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,*,统计学,第三章 分布数量特征的统计描述,主要内容:,第一节 分布的平均水平、集中趋势和位置的度量,第二节 分布离散程度的度量,第三节 分布的偏度和峰度,第二节,分布离散程度的度量,第三章,第二节,第三章,第一节,现象分布数量特征的统计描述,平均水平、,集中趋势,离散程度,分布的形状,平均数,中位数,众数,极差,四分位差,方差,标准差,变异系数,峰度,偏度,一、变异指标的含义与作用,(,一,),变异指标的含义,反映总体内部的,离中趋势,或,变异状况,。,变异指标值越大,表明总体各单位标志的变异程度越大。,第二节 分布离散程度的度量,第三章,第二节,(,二,),变异指标的作用,1.,衡量平均指标的代表性,当总体各单位标志值的变异程度越大时,平均指标的代表性就越 小;反之则越大。,【,例,3-13】,过去三年中,某公司的年平均销售额已达到,1200,万元,这可能有下面,A,、,B,、,C,三种情况,如下表所示。,表,3-5,某公司平均销售额,单位:万元,第二节 分布离散程度的度量,第三章,第二节,年份,A,销售额,B,销售额,C,销售额,1,1100,200,1600,2,1300,3000,1200,3,1200,400,800,(,二,),变异指标的作用,2.,反映社会经济活动的均衡性,变异指标可以表明生产过程的节奏性和其他经济活动的均衡性,因此可以作为企业产品质量控制和评价经济管理工作的依据。,表,3-6,某公司下属两个企业销售额计划完成情况,第二节 分布离散程度的度量,第三章,第二节,企业,计划数,实际数,第一季度,第二季度,第三季度,第四季度,绝对数,比重,%,绝对数,比重,%,绝对数,比重,%,绝对数,比重,%,甲,1000,1000,140,14,100,10,460,46,300,30,乙,1200,1200,300,25,280,23.3,310,25.8,310,25.8,(,二,),变异指标的作用,3.,研究总体标志值分布偏离正态的情况,标志值分布越集中,频数分布的形态也越尖峭,标志 值分布越分散,频数分布的形态也越平坦。,4.,资产风险的度量,5.,变异指标是进行抽样推断等统计分析的一个基本指标。,第二节 分布离散程度的度量,第三章,第二节,二、极差与四分位差,(,一,),极差,一组数据的最大值与最小值之差,离散程度的最简单测度值,易受极端值的影响,未考虑数据的分布,计算公式为,未分组数据,组距分组数据,R,=,最高组上限,-,最低组下限,第二节 分布离散程度的度量,第三章,第二节,(,二,),四分位差,离散程度的测度值之一,上四分位数与下四分位数之差,反映了中间,50%,数据的离散程度,不受极端值的影响,四分位差越小,说明中间的数据越集中,四分位差越大,说明中间的数据越分散。,P36,例题,第二节 分布离散程度的度量,第三章,第二节,78 80 82 85 89 87 90 86 79 88 84 81,的四分位差是多少?,把数据从小到大排列 并分为,4,组:,78 79 80,,,81 82 84,,,85 86 87,,,88 89 90,其中第一四分位数为:,80,第三四分位数:,88,所以四分位差为:,88-80=8,10,三、平均差:,总体所有单位的标志值与其平均数的离差绝对值的算术平均数。,用未分组的资料计算平均差,其计算公式为:,用分组的资料计算平均差,其计算公式为,:,第二节 分布离散程度的度量,第三章,第二节,四、方差与标准差,(,一,),总体数量标志的方差与标准差,1.,数量标志方差与标准差的计算公式,:,未分组的情况:,分组的情况:,第二节 分布离散程度的度量,第三章,第二节,按交易额分组,组中值,频数,50,以下,25,7,-94.17,62071.53,50100,75,25,-44.17,48767.36,100150,125,12,5.83,408.33,150200,175,7,55.83,21821.53,200250,225,4,105.83,44802.78,250300,275,3,155.83,72852.08,300,以上,325,2,205.83,84734.72,合计,60,390.83,33584.33,13,方差计算表,2.,总方差、组间方差和组内方差,第二节 分布离散程度的度量,组间方差反映,组平均数对总平均数,的方差;,组内方差反映,组内标志值对组平均数,的方差。,2.,总方差、组间方差和组内方差,利用这个关系式,可以分析总体变异中,有多少是由于分组标志引起的变异,(,用 表示,),,有多少是其他因素引起的变异,(,用 表示,),。通常是通过计算经验相关比指数,来反映分组因素对总体变异的影响程度。经验相关比指数的取值范围在,0,1,之间。,第二节 分布离散程度的度量,第二节 分布离散程度的度量,3,、标准分数,变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或,z,分数。,标准分数给出了一组数据中各数值的相对位置。,16,第二节 分布离散程度的度量,经验法则,当一组数据对称分布时,经验法则表明:,约有,68%,的数据在平均数,1,个标准差的范围内。,约有,95%,的数据在平均数,2,个标准差的范围内。,约有,99%,的数据在平均数,3,个标准差的范围内。,在,3,个标准差之外的数据,在统计上称为,离群点,。,17,第二节 分布离散程度的度量,契比雪夫不等式,当一组数据不是对称分布时,经验法则不再适用,这时可用契比雪夫不等式,它对任何分布形状的数据都适用。根据契比雪夫不等式,至少有(,1-1/k,2,)的数据落在,k,个标准差之内。对于,k=2,3,4,该不等式的含义是:,约有,75%,的数据在平均数,2,个标准差的范围内。,约有,89%,的数据在平均数,3,个标准差的范围内。,约有,94%,的数据在平均数,4,个标准差的范围内。,18,4.,方差与标准差的数学性质,变量的方差等于变量平方的平均数减去变量平均数的平方。即,:,变量对算术平均数的方差小于对任意常数的方差。,n,个同性质独立变量和的方差等于各个变量方差的和。,第二节 分布离散程度的度量,第三章,第二节,4.,方差与标准差的数学性质,n,个同性质独立变量平均数的方差等于各变量方差平均数的,1/n,。,变量线性变换的方差等于变量的方差乘以变量系数的平方。,第二节 分布离散程度的度量,第三章,第二节,(,二,),是非标志的方差与标准差,第二节 分布离散程度的度量,第三章,第二节,品质标志,标志值,次数,是,1,N,1,(1-p),2,N,1,非,0,N,0,(0-p),2,N,0,合计,N,【,例,3-18】,已知某产品的合格率为,95%,,求其合格率的方差和标准差。,=,p(1-p)=95%5%=4.75%,=,21.79%,第二节 分布离散程度的度量,第三章,第二节,五、变异系数,极差、四分位差、标准差,都是反映总体各单位标志值变异的,绝对指标,。这些变异指标的大小不仅取决于总体的变异程度,还与,标志值绝对水平,高低有关。所以,不同现象或具有不同水平的单位,,不宜直接用变异指标来比较他们它们的变异程度,而应该采用标志值变异的相对指标,变异系数。,第二节 分布离散程度的度量,第三章,第二节,五、变异系数,变异系数也称离散系数,是各变异指标与其算术平均数的比值。,例如:极差与其平均数对比得到极差系数;,标准差与其平均数对比得到标准差系数。,第二节 分布离散程度的度量,第三章,第二节,【,例,3-19】,某学校男子体操队,5,名队员的体重分别为,55,、,54,、,52,、,52,、,51,公斤;女子体操队,6,名队员的体重分别为,46,、,45,、,44,、,44,、,43,、,42,公斤。试比较哪个队的队员体重更均匀。,第二节 分布离散程度的度量,第三章,第二节,【,例,3-20】,某投资者想购买在沪市证券交易所上市的股票,A,和股票,B,中的一种。从前几个月两种股票的收盘价格可以发现两者的标准差差别很大,。两种股票收盘价格的平均数分别为 。试问该投资者为规避投资风险应怎样决策投资股票品种?,第二节 分布离散程度的度量,第三章,第二节,六、箱线图,(boxplot,)在统计描述中的运用,箱线图也称盒须图,由一个箱子,(,或盒子,),和两条线段组成。其绘制的方法是,求出总体的五个数量特征值:极大值、极小值、中位数、上四分位数、下四分位数,连接上四分位数和下四分位数画出箱体,再将两个极值点与箱体相连。,第二节 分布离散程度的度量,第三章,第二节,【,例,3-21】,某大学统计学专业,60,名学生,8,门专业主干课考试成绩分布的特征值如表,3-9,所示。,表,3-9 8,门专业主干课考试成绩的特征值,课程名称 极大值 上四分位数 中位数 下四分位数 极小值,高等数学,90 82 71 63 56,概率论,93 81 75 66 60,统计学,94 82 71 69 60,计量经济学,88 80 78 66 58,抽样技术,80 78 68 67 62,贝叶斯统计,81 77 70 59 58,多元统计学,82 77 70 62 59,时间序列分析,85 82 76 69 55,第二节 分布离散程度的度量,第三章,第二节,第三章,第二节,解:,8,门专业主干课考试成绩的箱线图,30,箱线图,在存在多个同类现象时,可以将不同总体的数据用箱线图并列起来,进行分布特征的中位数、离散程度和集中程度的比较。,第三节,分布的偏度和峰度,第三章,第三节,一、统计动差:,原点动差:,以频数分配各组标志值,x,i,对平均数,的,k,阶中心动差,,第三节 分布的偏度和峰度,第三章,第三节,偏度,数据分布偏斜程度的测量,偏度系数,=0,为对称分布,偏度系数,0,为右偏分布,偏度系数,0,时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数的代表性更大;,0,时表示频数分布比正态分布更分散,分布呈平坦峰,平均数的代表性较小。,37,小结,节,主要内容,知识要点,第二节,分布的离散程度,变异指标的含义与作用,掌握:变异指标的含义,理解:变异指标的作用,极差与四分位差,熟记:极差的含义和计算方法,掌握:四分位差的含义、特点与实际应用,平均差,掌握:平均差的含义、特点与实际应用,方差与标准差,熟记:方差和标准差的含义、特点与计算方法,掌握:总方差、组间方差与组内方差的关系,理解:方差与标准差的数学性质,掌握:是非标志的方差与标准差的含义与计算方法,变异系数,熟记:变异系数的含义与计算公式,理解:变异系数的实际应用,箱线图在统计描述中的应用,理解:箱线图的含义、绘制方法及其实际应用,38,小结,节,主要内容,知识要点,第三节,分布的偏度和峰度,统计动差,理解:统计动差的含义与分类,偏度,掌握:偏度的含义、计算方法,峰度,掌握:峰度的含义、计算方法,39,习题,1,、用标准差比较分析两个同类总体平均指标的代表性,其基本的前提条件是(),A.,两个总体的标准差应相等,B.,两个总体的平均数应该相等,C.,两个总体的单位数应该相等,D.,两个总体的离差之和应相等,40,2,、某数列变量值平方的平均数等于,9,,而变量值平均数的平方等于,5,,则标准差为(),A.,B.4,C.,D.2,41,3.,某地区,GDP,的平均增长速度,;2005-2007,年为,13%,,,2008-2009,年为,9%,,则这,5,年的平均增长速度为(),A.(13%*3+9%*2)/5,B.,C.(113%*3+109%*2)/5-100%,D.,42,4,、众数(),A,总是小于算术平均数,B,是分布数列中标志值最大的数,C,是分布数列中最大的频数,D,不受分布数列变量值大小变动的影响,43,5,、若篮球运动员的平均身高,198cm,,标准差,2.6cm,,小学生的平均身高,100cm,标准差,1.8cm,。则根据该资料判断(),A,篮球运动员组的身高较均匀,B,小学生组的身高较均匀,C,两组的身高不能进行比较,D,无法判断,44,6,、数量标志的方差(),A,具有非负性,B,一般大于平均差,C,会受到极端值的影响,D,具有平移不变的性质,E,可以反映现象发展过程的均衡性,45,7,、下列关于权数的描述,不正确的有(),A,权数是衡量相应的变量对总次数作用的强度,B,权数起作用在于次数占总次数的比重大小,C,权数起作用在于次数本身绝对值的大小,D,权数起作用的前提之一是各组的变量值必须互相有差异,E,权数就是频数,46,
展开阅读全文