资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,#,西安翻译学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,西安翻译学院,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/19,#,通过本章的学习,要求掌握总量指标的概念和种类,分清时期指标和时点指标;理解相对指标的概念,掌握几种常用的相对指标的计算和应用;掌握集中趋势和离中趋势的含义及测定方法,掌握各种指标的特点及计算方法。,学习目标,1,2,3.1,总量指标与相对指标,3.1.1,总量指标的概念和种类,1.,总量指标(,AggregateIndicators,)的概念,总量指标是反映社会经济现象在一定时间、地点条件下所达到的总规模、总水平或工作总量的综合指标,也称为绝对数指标或绝对数,其表现形式是绝对数,。,4,2.,总量指标的种类,(1),按说明总体内容,总体单位总量(单位总量),总体标志总量(标志总量),总体单位总量是一个总体内总体单位数之和,反映总体本身规模大小。,总体标志总量是总体各单位某一数量标志的各标志值之和,说明总体特征的总数量。,一个总量指标究竟属于总,体单位总量还是总体标志,总量,并不是固定不变的,,随着研究目的的不同和研究,对象的变化而定。,5,(2),按其反映的时间状况,时期指标,时点指标,时点指标表明社会经济现象总体在某一时点的总量,时期指标反映社会经济现象总体在一段时期内发展过程的总量,6,时期指标的数值是连续计数的,表现的是现象在一段时间内发生的总量;时点指标的数值是间断计数的,表现的是现象在一定时点上所处的发展水平,时期指标数值具有可加性;时点指标不具有可加性,时期指标数值大小与时期长短有直接关系;时点指标的数值的大小与其时间间隔长短无关,时期指标和时点指标的特点,7,(3),按采用的,计量单位,实物指标,价值指标,劳动量指标,自然单位,度量衡单位,双重或多重单位,复合单位,8,3.1.2,相对指标的概念及其计算方法,1.,相对指标的概念,相对指标是将两个有联系的指标数值对比形成的一种比率,用来反映现象之间的数量对比关系和联系程度,又称相对数,。,9,无名数,有名数,表现形式,将分子和分母计量单位结合使用,表明事物的密度、普遍程度等,如人口密度用人,/,平方公里,一种抽象化的数值,有系数、倍数、成数、百分数、千分数等,10,2.,相对数的种类和计算方法,结构相对数,比例相对数,强度相对数,计划完成相对数,动态相对数,相对数的种类,比较相对数,11,(1),结构相对数,结构相对指标是用分组法将总体区分为不同性质的各部分来反映总体内部组成情况的综合指标,一般用百分数表示,各组比重的百分数总和等于,100%,或,1,,亦称比重指标。,12,计算公式,结构相对指标的分子和分母可以同是总体单位数,也可以同是总体的标志数值。,13,作用,反映事物的变化过程及发展趋势,14,(2),比例相对数,概念,比例相对数是将总体内某一部分与另一部分数值对比所得到的相对数。,15,计算公式,分子分母属于同一总体,分子分母可以互换,可以用百分数表示,也可以用一比几或几比几的形式表示,16,(3),比较相对数,概念,比较相对数是将不同地区、单位或企业之间的同类指标值作静态对比而得出的综合指标,表明同类事物在不同空间条件下的差异程度或相对状态。,17,计算公式,比较相对数的分子分母是同类指标,但数值分别属于不同的总体,所属统计指标的涵义、口径、计算方法和计量单位必须一致,可以用百分数、系数或倍数表示,分子分母可以互换,18,例:甲、乙两个同类企业工人劳动生产率分别为,18000,元和,24000,元,则,19,(4),强度相对数,概念,强度相对数是两种性质不同而有联系的,属于不同总体的总量指标之间的对比,以说明现象的强度、密度和普遍程度的综合指标。,20,计算公式,两个有联系的不同的总量指标的对比,分子分母大多可以互换,有正指标和逆指标两种,人口出生率、死亡率等分子分母不能互换,正指标和逆指标分别从两个不同的方面说明现象的密度。,正指标数值越大越好;逆指标数值越小越好,21,例:某地区人口总量为,500,万人,医疗机构,600,家,则,22,(5),动态相对数,概念,动态相对数是由同一总体的同类指标在不同时间上的数值对比而确定的相对数,表明某一现象在不同时间上的发展不平衡程度。,23,计算公式,分子分母的数值是同类但不同时期的,作为对比标准的时期是基期,同基期比较的时期是报告期,计算结果一般用百分数、系数或倍数表示,24,(6),计划完成相对数,概念,计划完成相对数是用现象在某一段时间内的实际完成数与计划任务数相比表明计划完成程度的综合指标,又称计划完成百分比,通常以百分数表示。,25,计算公式,26,计算问题:,在计划完成相对数的计算上,由于计划指标既有可能是总量指标也可能是相对指标,所以在计算时,根据不同的情况要采取不同的方法。,27,根据总量指标计算计划完成相对数,例,:,某企业某年计划总产值为,300,万元,实际完成,330,万元,则,产值计划完成相对数,=330300,110,超额的绝对值,=330300,30,(万元),计算结果表明该企业超额完成,10%,的任务,超产,30,万元,28,根据相对指标计算计划完成相对数,例,:,某企业要求劳动生产率达到,5000,元人,某种 产品的计划单位成本为,100,元,该企业实际的劳动生产率达到,6000,元人,某种产品的实际单位成本为,80,元,则,劳动生产率计划完成相对数,60005000,120,单位成本计划完成相对数,80100,80,对于正指标,如产值、产量、利润额、劳动生产率等,其计划完成程度若大于,100,,说明超额完成计划;若小于,100,,说明没有完成计划,对于逆指标,如单位成本等,其计划完成程度若小于,100,,说明超额完成计划;若大于,100,,说明没有完成计划,29,计划完成相对数的作用,30,全公司的计划执行情况达到了,75%,,但乙企业离进度要求还有差距。,乙企业完成进度计划是完成全年计划的关键,。,31,累计法,水平法,计划指标按整个计划期内累计,完成量来规定应该达到的水平,在计划期内只规定最后一期应,达到的水平,32,例,:,某五年计划的基本建设投资额为,5000,亿元,,5,年内实际累计完成,5150,亿元,则,33,例,:,某产品计划规定第五年产量,56,万件,第五年实际产量为,63,万件,则,计划提前完成,提前多久?,34,从第,4,年,9,月到第,5,年,8,月,产量合计为,57,万件,累计到第,5,年,7,月的产量合计数为,51,万件,因此,8,月份只需完成,5,万件就可以达到计划规定的,56,万件,而,8,月的实际产量是,6,万件,所以提前完成任务的天数可以根据生产进度推知。即:,(1-5/6)30=5,天。即提前,4,个月又,5,天完成计划。,月 份,1,2,3,4,5,6,7,8,9,10,11,12,合计,第,4,年,3.5,3.5,4,3.8,4,3.8,4,4,5,5,5,4,49.6,累 计,5,10,15,19,第,5,年,4,4,4,5,5,5,5,6,6,6,6,7,63,累 计,23,27,31,36,41,46,51,57,35,3.1.3 应用相对指标的原则,可比性原则,相对指标和总量指标结合应用的原则,各种相对指标结合应用的原则,36,37,3.2.1,集中趋势的涵义,集中趋势(,Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。,38,位置平均数,根据总体中处于特殊位置的个别或部分单位的标志值来确定的代表值,众数、中位数,根据所有变量值计算的,算术平均数、调和平均数、几何平均数,39,3.2.2,算术平均数(,Arithmetic Mean),集中趋势的最主要度量值,基本公式,:,40,算术平均数的分子和分母是同一总体的标志总量和单位总量,而强度相对指标对比的分子分母是两个不同总体现象总量,算术平均数分子中的每一个标志量都是由分母中的每一个单位来承担,分子的标志值个数和分母的单位数存在着对应关系,而强度相对指标对比的分子分母在数量上没有对应关系,41,强度相对指标一般由对比双方原有的计量单位构成;平均数计量单位则与标志值指标计量单位相同,有的强度相对指标的分子分母可互换;平均数则不可,42,算术平均数的计算方法,简单算术平均数(,Simple Arithmetic Mean,),43,【例,3.1,】某产品某种型号的价格有,5,种,分别为:,100,元、,105,元、,110,元、,120,元和,125,元,计算平均价格。,解:,根据公式,,5,种价格用简单算术平均数计算平均价格如下:,44,加权算术平均数(,Weighted Arithmetic Mean,),表现,次 数,频 率,各组次数完全相同,此时不再对,x,大小产生影响,实际上简单算术平均数是加权算术平均数的特例,45,根据单项数列计算加权算术平均数,根据单项数列计算加权算术平均数,直接利用各组总体单位数(次数)对各组变量值进行加权。,46,【例,3.2,】某车间,100,名工人生产的零件产量如下所示,根据所给资料,计算工人的平均产量。,x,f,P,(,%,),10,20,20,11,40,40,12,30,30,13,10,10,合计,100,100,200,440,360,130,xf,1130,xp,2,4.4,3.6,1.3,11.3,47,两种计算方法结果相等,,平均每个工人一天生产,11.3,个零件,。,48,由组距数列计算加权算术平均数,理论上讲,由组距数列计算加权算术平均数,应先计算各组的平均数,再以各组的平均数乘以相应的权数,并计算加权算术平均数,但在实际工作中,很少计算组平均数,而是用各组的组中值代替各组平均数,。,49,【例,3.3,】某市旅游协会根据,100,个会员的样本,整理出一年的营业额分布资料如下,计算年均营业额。,营业额,(,万元,),f,p,100,150,4,4,150,200,16,16,200,250,40,40,250,300,28,28,300,350,10,10,350,400,2,2,合计,100,100,x,125,175,225,275,325,375,_,50,计算结果表明,,100,个旅游企业年平均销售,额为,240,万元。,51,算术平均数的数学性质,52,53,3.2.3,调和平均数(,harmonic mean,),调和平均数是被研究对象中各单位标志值倒数的算术平均数的倒数,因而也称为倒数平均数。调和平均数也分为简单调和平均数和加权调和平均数。,54,m=xf,时,加权调和平均数实际上是加权算术平均数,的变形,当各组标志总量相等时,加权调和平均数可化简成为简单调和平均数形式,55,【例,3.4,】某饭店分一部、二部、三部,,2010,年实际收入分别为,306,万元、,278.2,万元、,261.6,万元,计划完成相对数分别为,102,,,107,,,109,,求平均计划完成程度。,56,解:以实际收入为权数的加权调和平均数公式计算,57,58,【例,3.5,】某饭店分一部、二部、三部,,2000,年计划收人分别为,300,万元、,260,万元、,240,万元,计划完成程度分别为,102,,,107,,,109,,求平均计划完成程度。,59,解:根据掌握的资料,平均计划完成程度应采用以计划收入为权数的加权算术平均法来计算,60,3.2.4,几何平均数,(geometric mean,),几何平均数是把各个标志值连乘,然后开次方根所得的平均水平。几何平均数是适应于特殊数据的一种平均数,在实际生活中通常用来计算平均比率和平均速度。当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,就应采用几何平均法计算平均比率,。,61,简单几何平均数,加权几何平均数,62,【例,3.6】,某投资者持有一种股票,,2007,,,2008,,,2009,,,2010,收益率分别为,5%,、,6%,、,5.5%,、,5.4%,。计算该投资者在这四年内的平均收益率,。,平均收益率为,5.47%,。,63,【例,3.7】,投资银行某笔投资是的年利率是按复利计算的,利率分配时有一年是,3%,,有,4,年为,4%,,有,8,年为,8%,,有,10,年为,10%,,有,2,年为,15%,。求平均年利率。,即平均年利率为,8.6%,。,64,几何平均数的特点,相对于算术平均数而言,几何平均数应用范围较窄,如果变量值等于零或者负值,无法计算几何平均数,相对于算术平均数和调和平均数几何平均数受极端值影响较小,几何平均数的对数是各变量值对数的算术平均数,65,3.2.5,众数(,Mode,),含义,变量数列中出现次数最多或频率最大的标志表现为众数,用,M,0,表示。,从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。,66,只有集中趋势明显时,才能用众数作为总体的代表值。如果数据的分布没有明显的集中趋势,众数可以不存在,称为无众数;如果有多个高峰点,可以有多个众数,称为复众数。,67,根据单项数列确定众数,在单项数列中,一般用直接观察法确定众数,在分配数列中出现次数最多(频率最大)的标志值就是众数。,68,【例,3.8,】面对房租上涨,,2010,年,12,月中国青年报社会调查中心对全国,31,个省(区、市)共计,4060,名租房者进行的调查结果如下表所示,判断房租上涨对受访者生活的影响程度的众数。,69,解:本题中标志表现为严重影响、一般、比较小和非常小,可以看到,,80.6%,的受访者表示房租上涨给生活带来的严重影响,所以,M,0,=,严重影响。,70,组距数列确定众数,下限公式,:,上限公式,:,式中:,L,为众数所在组组距的下限,;U,为众数所在组组距的上限,,1,=f,m,-f,m-1,其中:,f,m,为众数组次数,,f,m-1,众数组前一组次数,2,=f,m,-f,m+1,,其中:,f,m,为众数组次数,,f,m+1,众数组后一组次数,d,为众数所在组的组距,71,【例,3.9,】利用下表资料确定某地区农民收入的众数。,f,m,f,m-1,f,m+1,72,解:从表中的数据可以看出,出现次数最多的频数是,1050,,,即众数组为,1400,1600,这一组,根据公式得:,下限公式,:,=,或者,上限公式,:,73,3.2.6,中位数,(Median,),概念,中位数是将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的标志值就是中位数,用,M,e,表示。中位数将总体分为两个相等的部分,一半单位的标志值小于中位数,一半单位的标志值大于中位数,用,m,e,表示。,74,计算,由未分组资料确定中位数,n,为奇数时,中间位置对应的标志值为所求的中位数,n,为偶数时,处于中间位置的两个标志值的简单算术平均数为所求的中位数,75,【例,3.10,】某班,7,名同学的身高分别为,1.70m,、,1.80m,、,1.85m,、,1.60m,、,1.65m,、,1.75m,和,1.72m,,试求其中位数。,解:先将学生身高按大小顺序排列为:,1.60m,、,1.65m,、,1.70m,、,1.72m,、,1.75m,、,1.80m,、,185m,;,然后求中位数的位置,即:中位数的位置,则位于第四位的标志值就是中位数,即,M,e,=,1.72m,。,76,【例,3.11,】某班,6,名学生统计学考试成绩(单位:分)分别为,80,、,90,、,60,、,50,、,65,和,75,,试求其中位数。,解:先将学生考试成绩按大小顺序排列为:,50,、,60,、,65,、,75,、,80,、,90,;然后求中位数的位置,即中位数位于第,3,个和第,4,个学生成绩之间,也就是,65,和,75,的算术平均数,,即,Me=70,(分)。,77,组距数列确定中位数,下限公式,:,上限公式,:,L,为中位数所在组下限;,U,为中位数所在组下限;,S,m-1,为小于中位数组下限的观察值的累积频数;,S,m+1,为大于中位数组上限的观察值的累积频数;,d,为中位数所在组组距,78,【,例,3.12,】,利用下表的资料确定某地区农民收入的中位数。,f,m,S,m-1,S,m+1,79,解,:,由表中的次数合计可知,中位数位于 的位置,应当位于第三组,根据下限公式,或者根据上限公式,80,3.2.7,分位数,四分位数(,Quartile,)、十分位数,(Decile),和百分位数,(Percentile),分别是用,3,个点、,9,个点和,99,个点将数据,4,等分、,10,等分和,100,等分各分位点的值。下面以四分位数为例介绍计算方法。,81,四分位数是通过,3,个点将全部数据等分为,4,部分,通常所说的四分位数是指一组数据排序后处于,25%,和,75%,位置上的值,分别称为下四分位数和上四分位数。,82,设下分位数为,Q,L,上四位数为,Q,U,根据四分位数的定义,:,83,【例,3.13】,在某城市随机抽取,8,个家庭,调查得到每个家庭的人均月收入为,1500,元、,750,元、,780,元、,850,元、,960,元、,1250,元、,1080,元和,1630,元,计算人均月收入的四分位数。,解:先对数据进行排序,结果如下:,750 780 850 960 1080 1250 1500 1630,根据公式得,即,QL,在第二个数值(,780,)和第三个数值(,850,)之间,0.25,的位置上,,QL=780+(850-780)0.25=797.5(,元,),。,即,QU,在第六个数值(,1250,)和第七个数值(,1500,)之间,0.75,的位置上,,QU=1250+(1500-1250)0.75=1437.5(,元,),。,84,3.2.8,算术平均数、中位数、众数的特点和关系,含义和特点不同,算术平均数是应用最广泛的平均指标,全面反映了整个总体的次数分布,当总体中出现极大值或极小值时,算术平均数受极端值的影响。中位数和众数都属于位置平均数,不受极端值的影响,。,85,对称的“钟”型分布,右偏分布时,左偏分布时,受非对称分布的影响程度不同,86,皮尔生经验法则,分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:,87,【例,3.15】,某外贸企业月收入众数为,2800,元,算术平均数为,3100,元,推测总体分布特征,。,所以为右偏分布。,解:根据公式(,3.25,)月收入中位数近似值为,88,3.3,离中趋势的测定,离中趋势的涵义,离中趋势反映各变量值远离其中心值的程度,因此也称为离中趋势,从另一个侧面说明了集中趋势测度值的代表程度。,89,离中趋势的作用,评价平均指标代表性大小的依据,反映社会生产和其他社会经济活动的均衡性或协调性,进行质量和风险控制,标志变动度越大,则平均数的代表性就差;,标志变动度越小,平均数代表性越强。,标志变动度越小,质量越好,风险越小;,标志变动度越大,质量越差,风险越大,90,3.3.2,离中趋势的测定方法,全距(,range,),全距又称极差,是一组数据的最大值与最小值之差,用,R,表示,公式:,R=max(x,i,),min(x,i,),R,最高组上限值最低组下限值,(,开口组,),91,R,越大,表明数值变动的范围越大,即数列中各变量值差异大,反之,,R,越小,表明数值变动的范围越小,即数列中各变量值差异小。,92,四分位差(,quartile deviation,),四分位差是下四分位数和上四分位数之差,也成内距,常用,Q,d,表示,公式,:,Q,d,=Q,U,Q,L,四分位差反映了中间,50%,的数据的离散程度,不受极端值的影响,一定程度上克服了用全距描述离散程度的不足,中位数经常和四分位差可以结合使用,93,平均差(,Average Deviation),平均差,即平均绝对偏差,是各变量值与其算术平均数离差绝对值的平均数,用,A.D.,表示。,根据掌握资料的不同,平均差有以下两种计算方法:,94,简单平均差,对于未分组资料,采用简单平均法。,公式:,95,【例,3.17,】某车间,5,名工人日生产零件数分别为,50,件、,60,件、,70,件、,80,件和,90,件,求平均差。,解:根据公式计算平均数,根据公式计算平均差,96,加权平均差,在资料分组的情况下,应采用加权平均式:,97,【例,3.18,】某企业,100,名工人的月工资统计资料如下表所示,计算平均差。,1400,以下,20,1400,1600,30,1600,1800,35,1800,以上,15,合计,100,组中值,x,1300,1500,1700,1900,xf,26000,45000,59500,28500,159000,5800,2700,3850,4650,17000,98,月工资(元),工人数(人),解:根据公式,99,100,标准差和方差,标准差是总体中各单位变量值与其算术平均数离差平方的平均数的平方根,通常用,表示。标准差的意义与平均差基本相同,也是各项离差的平均数,但在数学处理上,标准差是采用平方的方法来避免正负离差相互抵消的。,标准差的平方称为方差,通常用 表示。,101,根据所掌握的资料不同,标准差和方差的计算公式也有简单式和加权式两种形式。,用未分组资料计算,如果所掌握的资料未经过分组,需要采用简单平均公式计算标准差和方差。,102,用分组资料计算,103,方差及标准差的计算过程,计算,平均数,计算,离差,计算离差的平方,乘以,权数,104,【例,3.19,】用例,3.2,中,100,个工人生产的元件数量计算方差和标准差。,零件数量,/,个,x,工人人数,/,人,f,所占比重,/%,p,10,20,20,1.69,33.8,0.338,11,40,40,0.09,3.6,0.036,12,30,30,0.49,14.7,0.147,13,10,10,2.89,28.9,0.289,合计,100,100,_,81,0.81,105,解:,或者,106,107,可包括总体单位数的,68.27%,;,可包括总体单位数的,95.45%,;,可包括总体单位数的,99.73%.,社会经济统计是研究大量社会经济现象的数量特征,,大多数现象总体内的次数呈正态分布,即以平均数,为中心,中间大,两头小的分布特征,在正态分布情况下,:,108,是非标志的均值及标准差,是非标志是指只具有两种表现的品质标志,在社会经济统计中有时把某种社会经济现象的全部总体单位,分为具有某一标志的单位和不具有某一标志的单位两组,其值仅表现为具有某种特征或不具有某种特征两种情况,。,109,在计算平均数时首先需要将是非标志的文字表现进行数量化处理。用“,1,”表示具有某种表现,用“,0,”表示不具有某种表现,然后以“,1,”和“,0,”作为变量值,计算是非标志的平均数和标准差。,110,是非标志总体的算数平均数,即是非标志总体的算数平均数是总体中标志值为,1,的单位的成数,111,112,【例,3.20,】某机械厂铸造车间生产,6000,吨铸件,合格品,5400,吨,不合格品,600,吨,铸件合格率为,90%,,其合格品成数数和标准差各为多少?,解:平均数合格品的成数,即,标准差为,113,离散系数(,coefficient of variation,),离散系数是反映一组数据相对差异程度的指标,是各变异指标与其算术平均数的比值,又称变异系数。离散系数通常用,V,表示,分别是全距、平均差、标准差除以算术平均数所得到的相对水平,即全距系数、平均差系数和标准差系数,其中最常用的是标准差系数。,114,在平均数不为零的条件下,离散系数越大,数据的离散程度越大,而所对应的集中趋势统计量的代表性就越小;反之,则数据的离散程度越小,集中趋势统计量的代表性就越大,115,【例,3.21,】甲乙两组工人的平均工资分别为,1938.14,元、,2276,元,标准差分别为元,305.73,、,329.27,元,判断哪一组的平均工资代表性更好?,解:根据公式,甲组相对的变异程度大于乙组,因而乙组平均工资的代表性要大,116,异众比率(,variation ratio,),异众比率是一组数据的非众数与全个数的比率,用,V,r,表示。异众比率常常和众数结合起来使用。,公式,:,异众比率越大,众数的代表性越差;,异众比率越小,众数的代表性越好。,117,【例,3.22,】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对,50,名顾客购买饮料的品牌整理得到不同品牌饮料的频数分布资料要求根据资料计算异众比率。,118,解:,很明显,,M,0,=,可口可乐,,f,m,=15,根据公式可得,119,标准化数值(,Z-Score),标准化数值是数据在数据集中相对位置的测度,计算一组数据中各个数值的标准化数值以测度每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群值。变量值与其平均数的离差除以标准差后的值,称为标准分数,也称标准分数或,Z,值。,正的,z,值表示观察值位于平均数右侧,负的,z,值表示观察值位于平均数左侧。,120,【例,3.23,】,某班学生先后进行了两次难度不同的考试,第一次成绩的平均值和标准差分别为,80,分和,10,分,第一次成绩的平均值和标准差分别为,70,分和,7,分。张某两次考试的成绩分别为,92,分和,80,分,那么就与全班相比较而言,张某哪一次成绩更好?,121,解:两次考试的平均值和方差都不相同,所,以学生两次考试的成绩不宜直接比较,需要,将两次考试成绩标准化,通过标准化数值进,比较,根据公式可得,所以,就与全班的比较而言,张某第二次考试成绩更好,122,123,3.4.1,偏态(,skewness,)及其测定,含义,偏态是对数据分布对称性的测度,如果次数分布是完全对称的,叫对称分布;如果次数分布不是完全对称的,就称为偏态分布,124,测定,偏态系数(,coefficient of skewness,)是对数据分布不对称性的度量值,记作,SK,。测定偏态的方法有算术平均数与众数比较法和动差法。,125,算术平均数与众数比较法,若算数平均数大于众数时,,SK,为正值,为右偏分布;若算数平均数小于众数时,,SK,为负值,为左偏分布;当算数平均数与众数相等,,SK,为零,为对称分布,126,【例,3.24,】甲车间,300,工人日产量资料下表所示,求偏态系数,日产量(件),工人数(人),50,以下,11,50,60,13,60,70,70,70,80,120,80,90,50,90,100,30,100,110,5,110,以上,1,合计,300,组中值,x,xf,45,495,9900,55,715,5200,65,4550,7000,75,9000,0,85,4250,5000,95,2850,12000,105,525,4500,115,115,1600,22500,45200,127,解,:,表明甲车间日产量为右偏分布,偏斜程度为,0.07,。其偏态系数较小,说明工人日产量的众数接近平均数水平。,128,动差法,未分组资料,分组资料,SK,等于,0,对称分布;,当,SK,为正值时,右偏分布;,当为,SK,负值时,左偏分布。,SK,的绝对值越大,表示偏斜程度越严重。,129,例,:,根据例,3.24,的资料,用动差法求偏态系数,日产量(件),工人数(人),组中值,x,50,以下,11,45,-30,-297000,50,60,13,55,-20,-104000,60,70,70,65,-10,-70000,70,80,120,75,0,0,80,90,50,85,10,50000,90,100,30,95,20,240000,100,110,5,105,30,135000,110,以上,1,115,40,64000,合计,300,22500,18000,130,解,:,因此,该分布数列是右偏分布,131,3.4.2,峰度及峰度的测定,峰度的含义,峰度,(kurtosis),通常描述分布形态的陡缓程度。某种次数分布与正态分布相比较是尖顶还是平顶,其尖顶或平顶的程度如何,记作,K,。,根据变量值的集中与分散程度,峰度一般可表现为三种形态:尖顶峰度、平顶峰度和标准峰度。,132,峰度的计算,未分组数据,根据分组数据,133,峰度系数,K=3,,分布为正态峰度,当峰度指标,K3,时,表示频数分布比正态分布更集中,呈尖峰分布,,K3,时表示频数分布比正态分布更分散,呈平峰分布,(a),尖峰分布,(b),平峰分布,134,
展开阅读全文