资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,教学内容,第一节 相对数指标,第二节 平均数指标,第三节 变异指标,教学目的,1.,掌握,相对数指标的意义,率与构成比的计算及区别,;,2.,了解,频数表的编制过程和用途;,3.,掌握,平均数指标的意义,算数均数、几何均数;,4.,掌握,中位数、众数、百分位数的计算及应用,5.,掌握,变异指标的意义,四分位数间距、方差、标准差变异系数的计算及应用。,第二节 平均数指标,Average Number,*,3,众数是指在一群观察值中,出现,频率最高,(即次数最多)的数据,用符号,M,o,表示。,(三)众数(,mode,),众数主要应用在对,小样本的探索性数据,进行分析,特点,:它不受变量数列极端数值的影响,但众值的计算只有在总体单位数足够多,而且又具有明显的集中趋势时,才有意义。,*,6,下限值,L,上限值,U,i,;,f,m,中位数,Md,(2)频数表上,中位数的计算,某市,192,例健康成人尿汞值,尿汞值(,g/L,)(1),组中值,x,频数,f,(2),fx,累计频数,(3),0.0-,0.25,4,1.00,4,0.5-,0.75,30,22.50,34,1.0-,1.25,37,46.25,71,1.5-,1.75,59,103.25,130 96,2.0-,2.25,23,51.75,153,2.5-,2.75,13,35.75,166,3.0-,3.25,8,26.00,174,3.5-,3.75,9,33.75,183,4.0-,4.25,4,17.00,187,4.5-,4.75,1,4.75,188,5.0-,5.25,1,5.25,189,5.5-,5.75,0,0.00,189,6.0-,6.25,1,6.25,190,6.5-,6.75,1,6.75,191,7.0-,7.25,1,7.25,192,合计,L,U,Md,实例,*,8,计算步骤:,计算,n/2,,作为数据按大小排列后居中数据的顺序号;,n/2=192/2=96;,即中位数为,由大至小计算累积频数,以确定中位数所在组段;,在,“,1.5,”,组段内,代入公式求中位数;,1.50.5/59(9671)=1.71(,ug/L),式中 为中位数所在组段的下限,为组距,为中位数所在组段的频数,为由小至大累积时小于各组段的累积频数;,中位数的应用与特点,适用条件,:,适合各种类型的资料。尤其适合于,大样本偏态分布,的资料;,资料有,不确定数值,;资料,分布不明,等。,特点:,由于中位数总处在居中的位置上,将频数等分为二,它不受特大或特小值的影响,,仅仅利用了中间的12个数据,均数、中位数、众数三者关系,正态分布,时:,均数中位数众数,正偏态分布,时:,均数中位数众数,负偏态分布,时:,均数中位数120,,求调和均数。,7,只大鼠的睡眠时间为,39.2,min,。,实例,调和均数可用于明显正偏态资料,当数据两端波动大以及计算某些率的平均率时,适宜计算调和均数。,2,、调和均数的应用,*,21,同质事物,或现象才能求平均数;,要根据数据分布类型,正确选用平均数,;,要与下一节的,离散趋势分析,相结合,以弥补反映不出差异和易受极端值影响的缺陷。,在计算和应用平均数指标时的注意事项,第三节 变异指标,Variation Number,*,23,变异指标,又称,离散指标,,用以描述一组计量资料各观察值之间参差不齐的程度。,变异指标越大,观察值之间差异愈大,说明平均数的代表性就越差;反之亦然。,三组同性别、同年龄儿童体重,甲组,26,28,30,32,34,乙组,24,27,30,33,36,丙组,26,29,30,31,24,丙组,乙组,甲组,极差(,Range,),意义:,是一批数据中最大值与最小值之差,反映了数据散布范围。,符号及计算:,优点:,简便。,缺点:,不能反映在该范围以内的其它数据的离散度;,各样本含量大小悬殊时,不宜比较其极差;,极差的抽样误差较大,样本的例数越多,极差越大,不够稳定。,适用条件:,极差仅适用于对,未知分布的小样本资料,作粗略的分析。样本量增大,极差会增大。,通常与众数结合使用。,极差(,Range,),四分位数间距,(,Quartile range),意义:,包括了全部变量值中居于中间水平的一半数据的分布范围。,Q,=P,25,P,75,符号及计算:,特点:,比较稳定,但不能反映其余数据的变异情况,没有充分利用每个变量值的信息。,适用条件:,四分位数间距用来描述大样本偏态资料的变异情况。通常与中位数结合使用。,四分位数间距,(,Quartile range),符号及计算:,方差分为样本方差和总体方差。样本方差符号为 ,相应的总体方差符号为 。,方差,(,Variance,),意义:,样本观察值的,离均差平方和(,sum of square,SS),的均值。表示一组数据的平均离散情况。,方差,(,Variance,),样本方差为什么要除以(,n,1)?,数理统计证明,,n,代替,N,后,计算出的样本方差对总体方差的估计偏小。对于样本资料,对离均差平方和取平均时分母用,n-1,代替,n。,分母为,n-1,,称为,自由度,(,degrees of freedom,),指随机变量能自由取值的个数。,自由度是数学名词,在统计学中,,n,个数据如不受任何条件的限制,则,n,个数据可取任意值,称为有,n,个自由度。若受到,k,个条件的限制,就只有(,nk,),个自由度了。计算方差时,,n,个变量值本身有,n,个自由度。但受到样本均数的限制,任何一个,“,离均差,”,均可以用另外的(,n,1),个,“,离均差,”,表示,所以只有(,n,1),个独立的,“,离均差,”,。因此只有(,n,1),个自由度。,小知识,标准差,(,standard deviation,),意义:,标准差即为方差的平方根。其单位与原变量,X,的单位相同。,符号及计算:,样本标准差符号为,s,,,相应的总体标准差符号为,频数表上计算:,三组同性别、同年龄儿童体重,甲组,26,28,30,32,34,乙组,24,27,30,33,36,丙组,26,29,30,31,34,丙组,乙组,甲组,方差与标准差的应用,方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用 的形式表达资料。,方差与标准差的应用,方差是样本观察值的离均差平方的平均值,它全面地反映了数据的变异大小;方差越大,观察值与均数间的差异就越大,数据的变异程度就越大,反之亦然;,标准差的量纲与原始数据一致,适用于对称分布的资料;标准差保持了方差的优点,其单位与观察值单位一致;在同质条件下,当样本含量逐渐增多时,标准差将趋于相应的总体标准差,故同类事物的标准差常有一定的实用范围。,变异系数,(,coefficient of variation,,,CV),变异系数可用于,不同类型资料间变异程度的比较,,,变异系数也可用于,均数相差悬殊时同单位资料间变异程度的比较,,如不同年龄段同性别儿童的体重变异大小比较等。,符号及计算:,适用条件:,均数,标准差,变异系数,青年男子 身高,170,cm,6,cm,3.5,体重,60,kg,7,kg,11.7,实例,:某部队干部体检得到体脂的均数和标准差分别为18.9%和5.8%,血清胆固醇的均数与标准差分别为4.84,mmol/L,和1.03,mmol/L,,试比较两者的变异情况。,由于体脂和血清胆固醇是两个不同的观察指标,不能直接比较其标准差大小,而应比较变异系数。对本例:,体脂变异系数:,血清胆固醇变异系数:,显然,体脂变异大于血清胆固醇变异。,变异系数主要用于量纲不同的指标间,或均数相差较大的指标间的变异程度的比较;,极差、四分位数间距与标准差有单位;,变异系数为标准差与均数的比值,无单位;,变异系数的特点,*,39,平均数与变异指标的使用范围,均数与标准差:,适用是均匀分布的小样本数据或近似正态分布数据,对样本含量没有要求。,中位数与四分位数间距:,适用于大样本偏态分布资料。,众数与极差:,适用于描述未知分布的小样本数据。,几何均数:,描述近似对数正态分布数据的平均水平或平均发展速度,变异系数:,比较不同资料或同类资料均数相差悬殊时变异程度的比较。,本章小结,1、对计数资料的绝对数指标常需进一步计算相对数,常用相对数的算法和用途,应用时需注意:分母一般不宜过小,不以构成比代替率,可比性。,2、为了解数值变量,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征(集中趋势和离散趋势),以及分布类型(对称分布或偏态分布),3、平均数是描述频数分布集中位置的指标,它代表一组观察值的平均水平。,常用平均数的意义及其应用场合,4、百分位数描述观察序列在某百分位置的水平,是分布的百分界值,可用于确定医学参考值范围,适用于任何分布。,5、描述频数分布离散程度的指标有:极差与四分位数间距,后者较为稳定,但均不能综合反映各观察值的变异程度;方差和标准差,最为常用,对正态分布尤为重要;变异系数,可用于多组资料间度量衡单位不同或均数相差悬殊时作变异度的比较。以上指标都是数值越小,说明观察值的变异度越小,均数的代表性越好。,6、一般算数均数与标准差结合应用,描述正态分布资料,形式为 等;中位数与四分位数间距结合应用,描述大样本偏态分布的资料。,1、数值变量频数表的组段数目是否越细越好?,2、同一资料的标准差是否一定小于均数?,思 考 题,3、下表为10例垂体催乳素微腺瘤经蝶手术前后的血催乳素浓度,试分别求术前、术后的均数、标准差及变异系数。应以何种指标比较手术前后数据的变异情况?,血催乳素浓度,例号,1,2,3,4,5,6,7,8,9,10,术后,276,880,1600,324,398,266,500,1700,500,220,术前,41,110,280,61,105,43,25,300,215,92,手术前后患者的血催乳素浓度(,mg/mL),AVERAGE、MEAN,算术均数,GEOMEAN,几何均数,MEDIAN,中位数,MODE,众数,HARMEAN,调和均数,STDEV,标准差,VAR,方差,QUARTILE,四分位数,PERCENTILE,百分位数,FREQUENCY,频数分布,*,47,谢谢!,
展开阅读全文