资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,医学统计学计量资料的统计描述ppt,医学统计学计量资料的统计描述ppt,第1页,个体变异,是同质观察对象间表现出差异。,变异是生物体在一个或各种、已知或未知不可控原因作用下所产生综合反应。,就,每个观察单位,而言,其观察指标变异是不可预测,或者说是随机,(random),。,就,总体,而言,个体变异是有规律。,医学统计学计量资料的统计描述ppt,第2页,变异规律表达:,分布,(distribution),何为分布,?,熊猫分布在温暖多雨山区,尤以中国西南部,刀鱼分布在长江下游水域,长寿村由来,医学统计学计量资料的统计描述ppt,第3页,统计描述,统计描述,(,descriptive statistics,),统计分析,统计推断,(inferential statistics),统计描述:,用统计指标、统计表、统计图 等方法对资料数量特征及其分布规律进行测定和描述。,医学统计学计量资料的统计描述ppt,第4页,频数,:当汇总大量原始数据时,把数据按类型分组,其中每个组数据个数,称为该组频数。,频数表(频数分布),:表示各组及它们对应组频数表格称为频数表或频数分布。,频数分布表,医学统计学计量资料的统计描述ppt,第5页,某市,1997,年,12,岁男童,120,人身高,(cm),142.3,156.6,142.7,145.7,138.2,141.6,142.5,130.5,134.5,148.8,134.4,148.8,137.9,151.3,140.8,149.8,145.2,141.8,146.8,135.1,150.3,133.1,142.7,143.9,151.1,144,145.4,146.2,143.3,156.3,141.9,140.7,141.2,141.5,148.8,140.1,150.6,139.5,146.4,143.8,143.5,139.2,144.7,139.3,141.9,147.8,140.5,138.9,134.7,147.3,138.1,140.2,137.4,145.1,145.8,147.9,150.8,144.5,137.1,147.1,142.9,134.9,143.6,142.3,125.9,132.7,152.9,147.9,141.8,141.4,140.9,141.4,160.9,154.2,137.9,139.9,149.7,147.5,136.9,148.1,134.7,138.5,138.9,137.7,138.5,139.6,143.5,142.9,129.4,142.5,141.2,148.9,154,147.7,152.3,146.6,132.1,145.9,146.7,144,135.5,144.4,143.4,137.4,143.6,150,143.3,146.5,149,142.1,140.2,145.4,142.4,148.9,146.7,139.2,139.6,142.4,138.7,139.9,医学统计学计量资料的统计描述ppt,第6页,(,1,)求,极差,(,range,):即最大值与最小值之差,又称为全距。,本例极差:,R,=160.9,125.9=35,(,cm,),(,2,)决定,组数,、,组段,和,组距,:依据研究目标和样本含量,n,确定。组距,=,极差,/,组数,通常分,8-15,个组,为方便计,组距常取整数或一位小数。,本例,i,=R/10,=35/10=3.54,。,列出组段:第一组段,下限略小于最小值,,最终一个组段,上限必须包含最大值,,其它组段上限值忽略。,(,3,),划记计数,:用划记法将全部数据归纳到各组段,得到各组段频数。,频数表编制步骤,医学统计学计量资料的统计描述ppt,第7页,1997,年某市,120,名,12,岁男童身高频数分布,组,段,频,数,频,率,百分率,124,1,0.0083,0.83,128,2,0.0167,1.67,132,10,0.0833,8.33,136,22,0.1834,18.34,140,37,0.3083,30.83,144,26,0.2167,21.67,148,15,0.125,12.5,152,4,0.0333,3.33,156,2,0.0167,1.67,160,1,0.0083,0.83,合,计,120,1,100,医学统计学计量资料的统计描述ppt,第8页,某市,120,名,12,岁男童身高频数分布,124,132,140,148,156,164,0,10,20,30,40,医学统计学计量资料的统计描述ppt,第9页,频数表分布特征,集中趋势,(central tendency):,变量值集中位置。本例在组段“,140,”。,集中趋势指标,离散趋势,(tendency of dispersion):,变量值围绕集中位置分布情况。本例,132,148,,共有,114,人,占,95,;离“中心”位置越远,频数越小;且围绕“中心”左右对称。,离散趋势指标,医学统计学计量资料的统计描述ppt,第10页,120,名,7,岁男童身高频数分布图,124,132,140,148,156,164,0,10,20,30,40,人,数,身高,(cm),医学统计学计量资料的统计描述ppt,第11页,239,人发汞含量频数分布,70,3,5,7,9,11,13,15,17,19,21,10,20,30,40,50,60,0,1,发汞含量,(,mol/kg),人,数,医学统计学计量资料的统计描述ppt,第12页,某市,892,名老年人生存质量自评分频数分布,0,10,20,30,40,50,60,70,80,90,100,100,200,3,0,0,0,400,自评分,人,数,医学统计学计量资料的统计描述ppt,第13页,102,名黑色素瘤患者生存时间频数分布,0,5,10,15,20,25,30,35,40,45,0,1,0,2,0,3,0,4,0,生存时间,(,月,),人,数,医学统计学计量资料的统计描述ppt,第14页,某地某年,10000,例死亡者年纪分布,0,10,20,30,4,0,50,60,70,80,0,1000,3000,4000,死亡年纪,(,岁,),人,数,医学统计学计量资料的统计描述ppt,第15页,频数分布类型,对称分布,医学统计学计量资料的统计描述ppt,第16页,偏态分布,正偏态,负偏态,长尾向,右,延伸,长尾向,左,延伸,医学统计学计量资料的统计描述ppt,第17页,频数分布表用途,揭示资料分布类型,看出频数分布两个主要特征,集中趋势,离散趋势,便于发觉一些特大或特小可疑值,便于深入计算指标和统计分析处理,医学统计学计量资料的统计描述ppt,第18页,集中趋势指标,1.,算术均数,:,简称均数,是用得最多统计描述指标。,总体均数,样本均数,x,医学统计学计量资料的统计描述ppt,第19页,计算方法:,直接法:,例,:,10,名七岁儿童体重,(kg),分别为:,17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求平均体重,x,17.3+18+25.5,10,21.35(kg),医学统计学计量资料的统计描述ppt,第20页,加权法:,x,f,1,x,1,+,f,2,x,2,+,f,3,x,3,+,f,n,x,n,f,1,+,f,2,+,f,3,+,f,n,fx,f,权数,医学统计学计量资料的统计描述ppt,第21页,均数特征,各观察值与均数之差(离均差)总和等于零,即 ,,各观察值离均差平方和最小,即,,,均数是一组观察值最理想代表。,医学统计学计量资料的统计描述ppt,第22页,均数应用:,均数能全方面反应全部观察值平均数量水平,应用甚广,最适于对称分布资料,尤其是正态分布资料,对于偏态资料,均数不能很好地反应其集中趋势。,医学统计学计量资料的统计描述ppt,第23页,2.,几何均数,计算方法:,G=,或者G=,直接法:,加权法:,f,lg,x,f,G=,lg,-1,医学统计学计量资料的统计描述ppt,第24页,例,:,5,人血清滴度为,1:10,,,1:20,,,1:40,,,1:80,,,1:160,,求平均滴度?,G=,=40,故平均滴度为,1:40,。,医学统计学计量资料的统计描述ppt,第25页,例,:某医院预防保健科用流脑疫苗为,75,名儿童进行免疫接种后,抗体滴度测定结果见下表,求平均滴度。,抗体滴度,滴度倒数,x,lgx,频数,f,flgx,1:4,4,0.6021,4,2.4084,1:8,8,0.9031,9,8.1279,1:16,16,1.2041,21,25.2861,1:32,32,1.5051,20,30.1020,1:64,64,1.8062,12,21.6744,1:128,128,2.1072,5,10.5360,1:256,256,2.4082,4,9.6328,累计,75,107.7676,75,名儿童平均抗体滴度计算表,医学统计学计量资料的统计描述ppt,第26页,75,名儿童进行流脑疫苗免疫接种后,平均抗体滴度为,1:27.35,医学统计学计量资料的统计描述ppt,第27页,几何均数应用:,1.,等比资料,如抗体平均滴度,2.,对数正态分布资料,Remember!,医学统计学计量资料的统计描述ppt,第28页,使用几何均数时,注意点,:,1),观察值不能有,0,。,2),观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。,Be careful!,医学统计学计量资料的统计描述ppt,第29页,3.,中位数和百分位数,中位数,指将一组观察值从小到大按次序排列,位次居中观察值,常见,M,表示。反应一批观察值在,位次,上平均水平。,百分位数,是一个位置指标,以,P,x,表示,一个,P,x,将总体或样本全部观察值分为两个别。理论上有x观察值比它小,有(100-x)%观察值比它大,而,P,50,就是中位数,所以,中位数也是一个特定百分位数。,医学统计学计量资料的统计描述ppt,第30页,适合各种类型资料。尤其适合于,偏态分布资料;,资料一端或两端有不确定数值(开口资料);,资料分布不明等。,中位数和百分位数适用条件:,医学统计学计量资料的统计描述ppt,第31页,中位数计算方法:,当,n,为奇数时,M,当,n,为偶数时,M,医学统计学计量资料的统计描述ppt,第32页,例,:某病患者,5,人,其潜伏期分别为,2,,,3,,,5,,,8,,,20,,求中位数?,n=5,,,M,x,3,=5(,天),例,:,8,名新生儿身长,(cm),依次为50,51,52,53,54,56,55,58,求中位数?,n=8,,,M,(,x,4,x,5,)/2=(53+54)/2=53.5(cm),医学统计学计量资料的统计描述ppt,第33页,对于频数表资料,:,f,x,为,P,x,所在组频数,i,为组距,f,L,为小于,L,各组段累计频数,M,P,50,L,为,P,x,所在组下限值,医学统计学计量资料的统计描述ppt,第34页,组段,(,1,),划 记,(,2,),频数,,f,(,3,),累计频数,S,f,(,4,),累计频率,(%),0.5,3,3,1.9,(,0,1.9,),0.6,正,9,12,7.5,(,1.9,7.5,),0.7,正正,12,24,15.0,(,7.5,15.0,),0.8,正正,13,37,23.1,(,15.2,23.1,),0.9,正正正,17,54,33.8,(,23.1,33.8,),1.0,正正正,18,72,45.0,(,33.8,45.0,),1.1,正正正正,20,92,57.5,(,45.0,57.5,),1.2,正正正,18,110,68.8,(,57.5,68.8,),1.3,正正正,17,127,79.4,(,68.8,79.4,),1.4,正正,13,140,87.5,(,79.4,87.5,),1.5,正,9,149,93.1,(,87.5,93.1,),1.6,正,8,157,98.1,(,93.1,98.1,),1.71.8,累计,3,160,100.0,(,98.1,100,),160,中位数,1.1+0.1x(160 x50%,72)/20,1.14,医学统计学计量资料的统计描述ppt,第35页,组段,(,1,),划 记,(,2,),频数,,f,(,3,),累计频数,S,f,(,4,),累计频率,(%),0.5,3,3,1.9,(,0,1.9,),0.6,正,9,12,7.5,(,1.9,7.5,),0.7,正正,12,24,15.0,(,7.5,15.0,),0.8,正正,13,37,23.1,(,15.2,23.1,),0.9,正正正,17,54,33.8,(,23.1,33.8,),1.0,正正正,18,72,45.0,(,33.8,45.0,),1.1,正正正正,20,92,57.5,(,45.0,57.5,),1.2,正正正,18,110,68.8,(,57.5,68.8,),1.3,正正正,17,127,79.4,(,68.8,79.4,),1.4,正正,13,140,87.5,(,79.4,87.5,),1.5,正,9,149,93.1,(,87.5,93.1,),1.6,正,8,157,98.1,(,93.1,98.1,),1.71.8,累计,3,160,100.0,(,98.1,100,),160,P,25,0.9+0.1x(160 x25%,37)/17,0.92,P,75,1.3+0.1x(160 x75%,110)/17,1.36,医学统计学计量资料的统计描述ppt,第36页,中位数应用:,中位数常见于描述偏态资料集中趋势,它和均数、几何均数不一样是,不是由全部观察值数据综合得到,而只受居中变量波动影响。,医学统计学计量资料的统计描述ppt,第37页,百分位数计算,直接法,当,时,,。,当 时,,。,医学统计学计量资料的统计描述ppt,第38页,举例,例 依据表,2.1,资料求某地域,434,名少数民族已婚妇女现有儿女数第,80%,位数。,本例,,n=434,,,43480%=347.2,,,,按式,(,人,),。,医学统计学计量资料的统计描述ppt,第39页,频数表法,医学统计学计量资料的统计描述ppt,第40页,百分位数应用:,百分位数用于描述某个观察序列在某百分位置上水平。常见于确定参考值范围,亦称正常值范围。,正常值范围指特定健康情况人群解剖、生理、生化等各种数据波动范围。,常见,95,范围,医学统计学计量资料的统计描述ppt,第41页,平均数,平均数,算术 均数,几何均数,中位数,加权均数,众数,医学统计学计量资料的统计描述ppt,第42页,组别,均数,甲组,26,29,30,31,34,30,乙组,24,27,30,33,36,30,丙组,26,28,30,33,36,30,例:三组同性别、同年纪儿童体重(,kg),以下,试分析该三组资料异同。,离散趋势指标,医学统计学计量资料的统计描述ppt,第43页,医学统计学计量资料的统计描述ppt,第44页,1.,全距,(range)(,极差,),优点:简单方便,缺点:除了最大、最小值,不能反应组内其它数据变异。,两样本例数相差悬殊时,不适用全距比较变异度。,R=max-min,医学统计学计量资料的统计描述ppt,第45页,2.,四分位数间距:,P,75,上四分位数,P,25,下四分位数,Q,U,Q,L,P,100,(max),P,75,P,50,(,中位数,),P,25,P,0,(min),P,x,医学统计学计量资料的统计描述ppt,第46页,组段,(,1,),划 记,(,2,),频数,,f,(,3,),累计频数,S,f,(,4,),累计百分率,0.5,3,3,1.9,(,0,1.9,),0.6,正,9,12,7.5,(,1.9,7.5,),0.7,正正,12,24,15.0,(,7.5,15.0,),0.8,正正,13,37,23.1,(,15.2,23.1,),0.9,正正正,17,54,33.8,(,23.1,33.8,),1.0,正正正,18,72,45.0,(,33.8,45.0,),1.1,正正正正,20,92,57.5,(,45.0,57.5,),1.2,正正正,18,110,68.8,(,57.5,68.8,),1.3,正正正,17,127,79.4,(,68.8,79.4,),1.4,正正,13,140,87.5,(,79.4,87.5,),1.5,正,9,149,93.1,(,87.5,93.1,),1.6,正,8,157,98.1,(,93.1,98.1,),1.71.8,累计,3,160,100.0,(,98.1,100,),160,P,25,0.9+0.1x(160 x25%,37)/17,0.92,P,75,1.3+0.1x(160 x75%,110)/17,1.36,Q,1.36-0.92,0.44,医学统计学计量资料的统计描述ppt,第47页,3.,方差和标准差:,(,X,-,),离均差,平方和,2,SS,N,2,=,总体方差,样本方差,自由度,医学统计学计量资料的统计描述ppt,第48页,标准差,(,standard deviation)即方差正平方根;其单位与原变量X单位相同。,医学统计学计量资料的统计描述ppt,第49页,例:设甲、乙、丙三人,采每人耳垂血,然后红细胞计数,每人数,5,个计数盘,得结果以下(万,/mm3,),医学统计学计量资料的统计描述ppt,第50页,盘编号,甲,乙,丙,甲,2,乙,2,丙,2,1,440,480,490,193600,230400,240100,2,460,490,495,211600,240100,245025,3,500,500,500,250000,250000,250000,4,540,510,505,291600,260100,255025,5,560,520,510,313600,270400,260100,累计,2500,2500,2500,1260400,1251000,1250250,标准差,50.99,15.81,7.91,医学统计学计量资料的统计描述ppt,第51页,标准差用途:,表示观察值离散度。,(,越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好,),结合均数描述正态分布特征。,计算标准误、变异系数等。,预计正常值范围,医学统计学计量资料的统计描述ppt,第52页,4.,变异系数:,比较单位不一样多组资料变异度,比较均数相差悬殊多组资料变异度,均数,标准差,变异系数,青年男子 身高,170 cm,6 cm,3.5,体重,60 kg,7 kg,11.7,医学统计学计量资料的统计描述ppt,第53页,平均数与变异度关系,它们都是定量资料统计描述两个指标,分别描述集中趋势与离散趋势,分布越集中,变异度越小,平均数代表性就越好;反之,变异度大,代表性就越差。,医学统计学计量资料的统计描述ppt,第54页,集中趋势指标正确应用,算数均数:,适合用于单峰对称分布资料;,几何均数:,适合于作对数变换后单峰对称分布资料;,中位数和百分位数:,适合用于任何分布资料;,中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;,中位数在抗极端值影响方面,比均数含有很好稳定性,但不如均数准确。,所以,当资料适累计算均数或几何均数时,不宜用中位数表示其平均水平。,不一样质资料应考虑分别计算平均数。,医学统计学计量资料的统计描述ppt,第55页,离散趋势指标正确应用,极差,不稳定,不灵敏,标准差,基础内容是离均差,它显示一组变量值与其均数间距,故标准差直接地、概括地、平均地描述了变量值离散程度。,在同质前提下,标准差大表示变量值离散程度大,即变量值分布分散、不整齐、波动较大;反之,标准差小表示变量值离散程度小,即变量值分布集中、整齐、波动较小。,变异系数,派生于标准差,其应用价值在于排除了平均水平影响,并消除了单位。,医学统计学计量资料的统计描述ppt,第56页,平均数与变异度,均数,标准差,(,min,max,),中位数,四分位数间距,(,min,max,),变异度小,则均数代表性好!,变异度大,数据分散,则均数代表性差!,平均数所表示集中性与变异度所表示离散性,从两个不一样角度说明计量资料特征!,医学统计学计量资料的统计描述ppt,第57页,
展开阅读全文