资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,李金,德制,李金,德制,李金,德制,第四章 差异量数,李金德,1,第一节 全距与百分差,第二节 平均差、方差与标准差,第三节 标准差的应用,第四节 差异量数的选用,2,例题,500,500,500,均数,2500,2500,2500,合计,490,480,440,5,495,490,460,4,500,500,500,3,505,510,540,2,510,520,560,1,丙,乙,甲,编号,例:设甲、乙、丙三人,做四级英语模拟试题,5,套,得分结果如下:,500,甲,乙,丙,450,550,3,第四章 差异量数,差异量数:,表示一组数据的,差异情况或离散程度,的量数;,反映数据分布的,离中,趋势,;,描述事物,差异性,的表现。,差异量越小,平均数的代表性越好。,差异量越大,平均数的代表性则差。,4,第一节 全距与百分位位差,一、全距,定义:是一列数据中最大数与最小数的差距,又称极差。公式:,R=X,max,-X,min,特点:,1.,是说明数据离散程度最简单的统计量;,2.,不能充分利用数据信息;,3.,不稳定,不可靠,也不灵敏。,5,二、百分位差,(一)百分位数(,Percentile,),百分位数是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比,符号为,Pp,。,如:,P,75,=90,,即百分位数为,90,,实际指的是在这组数据中,90,分以下的数据包含了整个数据的,62%,。,又如:,P,25,=60,,即百分位数为,60,,实际指的是在这组数据中,60,分以下的数据包含了整个数据的,25%,。,6,7,1.,未分组数据百分位数的求法,第一步:从小到达排列原始数据。,第二步:计算位置指数,i,。,i=,(,p/100,),n,,,n,为项数,,i,为所求的百分位的位置。,第三步:若,i,不是整数,将,i,向上取整;若,i,是整数,则第,p,百分位数是第,i,项与第(,i+1,)项数据的平均值。,8,例题,有,12,个职员薪金的数据,求第,85,和第,50,百分位数。,解,:(,1,)先排序:,2210 2225 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825,(,2,),i=(p/100),n=(85/100),12=10.2,。由于,i=10.2,不是整数,向上取整,所以第,85,百分位数对应的是第,11,项,其值为,2630,。,(,3,),i=(50/100),12=6,,因是整数,第,50,百分位数是第,6,项和第,7,项的平均值,(2390+2420)/2=2405,。,9,2.,分组数据计算公式:,Pp,第,p,个百分位数,Lb,百分位数所在组的精确下限,f,百分位数所在组的次数,Fb,小于,Lb,的各组次数的和,N,总次数,i,为组距,10,例题,4-1,计算百分位差,P,90,P,10,组别,f,向上累加次数,65,1,157,60,4,156,55,6,152,50,8,146,45,16,138,40,24,122,35,34,98,30,21,64,25,16,43,20,11,27,15,9,16,20,7,7,11,解,:(,1,)先,确定,P,90,,,P,10,的位置:,157*,(,90/100,),=141.3;157*,(,10/100,),=15.7,(,2,)确定,P,90,,,P,10,所在区间:,P,90,在“,50,”这组,,P,10,在“,15,”这组,(,3,)确定公式中的符号:,Lb=49.5,,,Fb=138,,,i=5,,,f=8,Lb=14.5,,,Fb=7,,,i=5,,,f=9,12,(,4,)代入公式计算,P,90,,,P,10,(,5,)计算,P,90,-P,10,=51.56-19.33=32.23,13,课堂练习,计算上例中,P,75,,,P,25,14,二、四分位差,1.,四分位数可视为百分位数的特例,用,Q,来表示。,2.P,25,P,50,P,75,把数据分成四等份,所以称为四分位数。,P,25,(第一个四分位,,Q,1,);,P,50,(第二个四分位,,Q,2,);,P,75,(第三个四分位,,Q,3,);,15,3.,四分位差是,百分位差特例,:,(,P,75,-P,25,),/2=,(,Q,3,-Q,1,),/2,。,4.,实质:,反映了中间,50%,数据的离散程度。,16,四分位差实质反映中间,50%,数据的离散程度,Q1 Q2 Q3,Q1 Q2 Q3,四分位差越小中间,50%,数据越集中,四分位差越大中间,50%,数据越离散,17,三、百分等级,1.,含义:是指某个数据在整个数据中所处的百分位置。,2.,作用:可以表示任何一个分数在该团体中的相对位置。,例如:某人考试成绩的百分等级,P,R,=80,,就意味着他的成绩比约,79%,的人要好,比约,19%,的人要差。,18,百分等级的编制过程,精确,登记,实际累加,相对累加,上下限,次数,次,数,次,数,96-.,97,95.598.5,|,2,0.02,100,1,93-,94,92.5-95.5,|,3,0.03,98,0.98,90-,91,89.592.5,|,4,0.04,95,0.95,87-,88,86.589.5,|,|,8,0.08,91,0.91,84-,85,83.586.5,|,|,11,0.11,83,0.83,81-,82,80.583.5,|,|,17,0.17,72,0.72,78-,79,77.580.5,|,|,19,0.19,55,0.55,75-,76,74.577.5,|,|,14,0.14,36,0.36,72-,73,71.574.5,|,10,0.1,22,0.22,69-,70,68.571.5,|,|,7,0.07,12,0.12,66-,67,65.568.5,|,3,0.03,5,0.05,63-,64,62.565.5,|,1,0.01,2,0.02,60-,61,59.562.5,|,1,0.01,1,0.01,f=100,1,上限以下的累加次数,分组区间,组中值,Xc,次数,f,频数,p/N,0.01+0.01=0.02,19,3.,百分等级的公式:,可以通过百分位数公式推导而出,20,课堂练习,分数分组,次数,累积次数,累积百分数,90-,85-,80-,75-,70-,65-,60-,55-,50-,45-,40-,35-,30-,25-,20-,15-,10-,5-,0-,13,27,51,70,98,134,131,125,149,136,134,126,138,139,147,151,98,26,7,1900,1887,1860,1809,1739,1641,1507,1376,1251,1102,966,832,706,568,429,282,131,33,7,100.00,99.32,97.89,95.21,91.53,86.37,79.32,72.42,65.84,58.00,50.84,43.79,37.16,29.89,22.58,14.84,6.89,1.74,0.37,21,第二节 平均差、方差与标准差,一、平均差,1.,含义:原始数据与平均数绝对离差的平均值。,2.,符号,:,A.D.,或者,M.D.,22,3.,特点:,较好反映了数据分布的离散程度;,平均差是绝对值,使用受到限制;,属于低效的差异量数。,23,二、方差与标准差,1.,含义,:,(,1,)方差:是离均差平方的算术平均数,表示一列数据平均差距的平方。,符号:样本方差,s,2,总体方差,2,(2),标准差,就是方差的算术平方根,表示一列数据的平均差距。,符号:样本标准差,s,、总体标准差,24,2.,未分组数据计算公式,25,利用原始数据计算,26,例题,4-2,计算,6,、,5,、,7,、,4,、,6,、,8,这一组数据的方差和标准差。,解,:,(,1,)先计算平均数:,(,2,)求离均差的平方和:,(,3,)代入方差和标准差的公式,计算结果:,27,课堂练习,73,87,83,80,77,79,75,78,72,86,-6,8,4,1,-2,0,-4,1,-7,7,36,64,16,1,4,0,16,1,49,49,28,课堂练习:采用原始数据计算,编号,1,4,16,2,5,25,3,7,49,4,4,16,5,6,36,6,8,64,36,226,解:,1.,先对原始数据求和:,2.,再对原始数据平方求和:,3.,把结果带入公式,29,3.,分组数据的标准差和方差(了解),30,练习:学生创造性思维成绩分布表,求标准差,第,1,行,40-44,35-39,30-34,25-29,20-24,15-19,第,2,行,人数,f,1,7,3,11,8,2,32,第,3,行,Xc,42,37,32,27,22,17,第,4,行,f Xc,42,259,96,297,176,34,904,第,5,行,Xc-M,13.75,8.75,3.75,-1.25,-6.25,-11.25,0,第,6,行,(Xc-M),2,189.062,76.562,14.062,1.562,39.062,126.562,第,7,行,f(Xc-M),2,189.062,535.93,42.187,17.187,312.500,253.125,1350.00,31,解:,32,分组数据标准差计算的便捷式,33,学生创造性思维成绩分布表,人数,组中值,第,1,行,40-44,35-39,30-34,25-29,20-24,15-19,第,2,行,1,7,3,11,8,2,32,第,3,行,42,37,32,27,22,17,第,4,行,3,2,1,0,-1,-2,第,5,行,9,4,1,0,1,4,第,6,行,3,14,3,0,-8,-4,8,第,7,行,9,28,3,0,8,8,56,34,把结果带入公式,35,4.,总标准差的合成,36,例题,4-4,:,在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差。,班级,人数,平均数,标准差,1,42,103,16,2,36,110,12,3,50,98,17,37,计算过程,班级,1,42,103,16,6,0.000004,2,36,110,12,1,48.7204,3,50,98,17,-4,25.2004,74,38,39,5.,方差、标准差的性质和意义,(,1,)性质,每个观测值加一个常数,C,,标准差不变。,每个观测值乘一个常数,C,,新数据标准差为原标准差乘此常数。,(,2,)意义,表示数据离散程度的最好指标。,40,第三节 标准差的应用,思考:,已知某小学一年级学生的平均体重为,25,公斤,体重的标准差是,3.7,公斤,平均身高,110,厘米,标准差为,6.2,厘米,问体重与身高的离散程度哪个大,?,41,一、差异量数,1.Coefficient of variation,也称离散系数,标准差系数,是一组数据的标准差与其相应的均值之比。,42,例题,4-5,已知某小学一年级学生的平均体重为,25,公斤,体重的标准差是,3.7,公斤,平均身高,110,厘米,标准差为,6.2,厘米,问体重与身高的离散程度哪个大,?,解,:CV,体重,=3.7/25,100%=14.8%,CV,身高,=6.2/110 100%=5.64%,所以,体重的离散程度比身高的离散程度大。,43,2.,差异系数的评价:,只能用于一般的相对差异量的描述,没有有效的假设检验方法,不能进行统计推论。,CV,小于,5%,,表示离散程度太小;,CV,大于,35%,,表示离散程度太大。,44,二、标准分数,(一)概念和公式,标准分数:又称基分数或,Z,分数,是以标准差为单位的一种量数。表示的是一个原始分数在团体中所处的相对位置。,计算公式:,45,例题,4-7,例,:,某班平均成绩为,90,分,标准差为,3,分,甲生得,94.2,分,乙生得,89.1,分,求甲乙二学生的,Z,分数各是多少,?,解:,Z,甲,=(94.2-90)/3=1.4,Z,乙,=(89.1-90)/3=-0.3,46,(二)标准分数的性质,1.Z,分数是一个相对量,以平均数为参照点,以标准差为单位。,2.,一组原始数据的,Z,分数分布:平均数为,0,,标准差为,1,。,3.,如果原始数据呈正态分布,则转换所得的,Z,分数分布为,标准正态分布,且所有,Z,分数的均值为,0,。,47,(三)标准分数的应用,1.,观测值在数据分布中相对位置的高低,例:某年高考理科数学全国平均成绩,65,分,标准差是,12.5,分,考生,A,、,B,、,C,三人的数学原始分数为,50,、,65,、,85,分,求他们的标准分数是多少?,解:,Z,A,=(50-65)/12.5=-1.2;,Z,B,=(65-65)/12.5=0;,Z,C,=(85-65)/12.5=1.6,48,2.,当已知各,不同质,的观测值的次数分布为正态时,可用,Z,分数求不同的观测值的总和或平均值,以表明在总体中的位置。例:求甲乙两人的标准分之和。,考试科目,甲,乙,平均分,标准差,语文,85,89,70,10,政治,70,62,65,5,外语,68,72,69,8,数学,53,40,50,6,理化,72,87,75,8,49,计算过程,考试科目,甲,乙,平均分,标准差,Z,甲,Z,乙,语文,85,89,70,10,1.500,1.900,政治,70,62,65,5,1.000,0.6,外语,68,72,69,8,0.125,0.375,数学,53,40,50,6,0.500,1.67,理化,72,87,75,8,0.375,1.500,总计,348,350,2.50,1.505,50,(,3,),表示标准测验分数,经过标准化的测验,如果其常模分数分布接近正态分布,常常要转换成正态标准分数。这是,线性转换,。,公式:,Z=a Z+b,Z,为正态标准分数,Z=(X-X)/,a,b,为常数,为测验常模的标准差。,51,常见标准测量分数:,韦氏常人智力量表(,WAIS,):,IQ=15Z+100,比奈,-,西蒙智力测验:,Z=16Z+100,普通分类测验,(AGCT)Z=20Z+100,52,(,4,)异常值的取舍,取舍标准:|,Z|,3,53,第四节 差异量数的选用,一、优良差异量数具备的标准,根据客观数据资料获得的,根据全部观测值计算出来,简单明了,计算方便,稳定,能够采用代数方法进行计算,54,二、各差异量数的比较,全部数据,计算,稳定性,代数方法,评 价,全距,百分位差,四分位差,平均差,方差、,标准差,否,简便、方便,差,不能,否,简便,稳定,不能,否,简便,稳定,不能,是,简便,差,不能,是,繁琐、严密,稳定,能,测量粗糙,适用于,描述统计,优良、描述和,推论统计,55,三、各种差异量数的关系,1.,样本相当大的时候,标准差大约为全距的六分之一。,2.,当分布呈正态时:,S=1.2533AD=1.4826Q,AD=0.7979S=1.1829Q,Q=0.6745S=0.8453AD,s,标准差,,AD,平均差,,Q,四分位差。,56,四、如何选用差异量数,1.,当样本为随机取样时:,S,、,Q,、,R,的可靠性以此降低。,2.,当要求计算要容易、快捷时,,R,、,Q,、,S,依次变得复杂。,3.,当要求统计量进一步使用时,,S,胜过其他差异量数。,4.,在偏态分布中,,Q,比,S,更常用。,5.,当分布是截尾分布,只有,Q,能正确地指出分布的变异性。,57,除此之外,选用差异量数还需要把集中量数结合起来考虑。,最常用的是,平均数,和,标准差,。,中数,和,四分位差,一起使用,58,课后作业,P106,思考与练习题第,5,、,9,题。,59,
展开阅读全文