资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,学习目标和要求,掌握:,1.集中趋势指标计算与应用意义,2.离散趋势指标计算与应用意义,3.数值变量资料t检验,熟悉:,1.总体均数区间预计,2.假设检验意义和步骤,了解:数值变量资料统计描述中频数表制作,数值变量资料的统计分析之统计描述专家讲座,第1页,第一节 数值变量资料统计描述,一、编制频数表(了解),120名12岁男孩身高(cm)资料,142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5,134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0,145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6,151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4,141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1,143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4,134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4,150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2,125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7,160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4,134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4,129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9,数值变量资料的统计分析之统计描述专家讲座,第2页,1.计算全距(极差),R,=最大值-最小值,2.确定组距,确定组段数:815组,确定组距:组距,i,=全距/组段数,3.划分组段,4.统计频数,数值变量资料的统计分析之统计描述专家讲座,第3页,组段 划记 频数f,(1)(2)(3),125 一 1,129 止 4,133 正止 9,137 正正正正正下 28,141 正正正正正正正 35,145 正正正正正丁 27,149 正正一 11,153 止 4,157161,1,累计 =120,120名12岁男孩身高(cm)资料频数分布,数值变量资料的统计分析之统计描述专家讲座,第4页,二、集中趋势指标(掌握),数值变量资料集中趋势指标用平均数来描述。,惯用平均数有,算数均数,、,几何均数,、,中位数,数值变量资料的统计分析之统计描述专家讲座,第5页,(一)算数均数,将各观察值相加后除以观察值个数所得商即为算术均数。,1、定义,总体均数用希腊字母 表示,样本均数用 表示,数值变量资料的统计分析之统计描述专家讲座,第6页,2.应用条件,适合用于呈对称分布或近似对称分布资料。,数值变量资料的统计分析之统计描述专家讲座,第7页,3.计算方法,直接法,:,变量值个数不多,公式为,数值变量资料的统计分析之统计描述专家讲座,第8页,加权法:,n,100,公式为,数值变量资料的统计分析之统计描述专家讲座,第9页,例,某年某市120名12岁健康男孩身高(cm)资料以下表,求其平均数。,数值变量资料的统计分析之统计描述专家讲座,第10页,142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5,134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0,145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6,151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4,141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1,143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4,134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4,150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2,125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7,160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4,134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4,129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9,120名12岁男孩身高(cm)资料,数值变量资料的统计分析之统计描述专家讲座,第11页,组段 划记 频数f,(1)(2)(3),125 一 1,129 止 4,133 正止 9,137 正正正正正下 28,141 正正正正正正正 35,145 正正正正正丁 27,149 正正一 11,153 止 4,157161,1,累计 =120,120名12岁男孩身高(cm)资料频数分布,数值变量资料的统计分析之统计描述专家讲座,第12页,组段,组中值x 频数 f fx,(1)(2)(3)(4)(2)(3),125 127 1 127,129 131 4 524,133 135 9 1215,137 139 28 3892,141 143 35 5005,145 147 27 3969,149 151 11 1661,153 155 4 620,157161 159 1 159,累计 -=120 =17172,120名12岁健康男孩身高(cm)均数加权法计算,数值变量资料的统计分析之统计描述专家讲座,第13页,数值变量资料的统计分析之统计描述专家讲座,第14页,(二)几何均数,1定义,将,n,个变量值乘积开,n,次方所得根即为几何均数。,符号 用G表示,数值变量资料的统计分析之统计描述专家讲座,第15页,2.适用条件:,数值变量呈倍数关系或呈对数正态分布,如抗体效价、抗体滴定度、疾病潜伏期,数值变量资料的统计分析之统计描述专家讲座,第16页,3.计算,数值变量资料的统计分析之统计描述专家讲座,第17页,例,5人血清滴度分别为1:2、1:4、1:8、1:16、1:32,求平均滴度。,数值变量资料的统计分析之统计描述专家讲座,第18页,数值变量资料的统计分析之统计描述专家讲座,第19页,加权法,:,变量值个数较多或变量值为频数表资料,二、几何均数(,几何平均数),数值变量资料的统计分析之统计描述专家讲座,第20页,例2-4,某年某市100名儿童接种某种疫苗后,测定抗体滴度资料如第(1)、(2)列所表示,求该疫苗抗体平均滴度。,数值变量资料的统计分析之统计描述专家讲座,第21页,数值变量资料的统计分析之统计描述专家讲座,第22页,数值变量资料的统计分析之统计描述专家讲座,第23页,(三)中位数和百分位数,中位数,1.定义 将一组变量值按大小次序排列,位次居中变量值即为中位数。,符号 用M表示,数值变量资料的统计分析之统计描述专家讲座,第24页,2.适用条件,变量值中出现特小或特大数值,资料分布呈显著偏态,变量值分布一端或两端无确定数值,只有小于或大于某个数值,资料分布类型不清,数值变量资料的统计分析之统计描述专家讲座,第25页,3.计算方法,直接法,当变量值个数为奇数时计算公式为,M=,数值变量资料的统计分析之统计描述专家讲座,第26页,当变量值个数为偶数时计算公式为,数值变量资料的统计分析之统计描述专家讲座,第27页,例,某地11例某传染病患者,其潜伏期(天)分别为2,2,4,3,5,6,3,8,9,11,15,求其平均潜伏期。,数值变量资料的统计分析之统计描述专家讲座,第28页,数值变量资料的统计分析之统计描述专家讲座,第29页,例,如上例资料在第21天又发生1例该传染病患者,其平均潜伏期又为多少?,先将变量值按从小到大次序排列:2,2,3,3,4,5,6,8,9,11,15,21。,数值变量资料的统计分析之统计描述专家讲座,第30页,数值变量资料的统计分析之统计描述专家讲座,第31页,编制频数表,计算步骤4,计算步骤3,计算步骤2,计算步骤1,频数表法,编制中位数计算表,确定中位数所在组段,计算中位数,数值变量资料的统计分析之统计描述专家讲座,第32页,计算公式,数值变量资料的统计分析之统计描述专家讲座,第33页,例,现有145例食物中毒病人,其潜伏期分布以下表第(1)(2)栏,求中位数。,数值变量资料的统计分析之统计描述专家讲座,第34页,潜伏期(小时)频数f 累计频数 累计频率(%),(1)(2)(3)(4),0 17 17 11.7,6 46 63 43.4,12 38 101 69.6,18 32 133 91.7,24 6 139 95.9,30 0 139 95.9,36 4 143 98.6,42 2 145 100.0,累计 145 ,145例食物中毒病人潜伏期分布表,数值变量资料的统计分析之统计描述专家讲座,第35页,可确定中位数所在组段是12,故,L,12,,i,6,f,m,38,n145,63。,代入公式,得,M=12+(6/38),(145 50%63)=13.5(小时),数值变量资料的统计分析之统计描述专家讲座,第36页,百分位数,1定义 指将n个观察值从小到大依次排列,再把它分成100等份,对应于,x,%位数值即为第x百分位数。,中位数是第50百分位数,用P50表示。,第25,第75,第95百分位数记为P25,P75,P95是统计学上惯用指标。,数值变量资料的统计分析之统计描述专家讲座,第37页,P,X,X%(100-X)%,数值变量资料的统计分析之统计描述专家讲座,第38页,2计算方法,L:Px,所在组段下限,i:,组距 n:总例数,f:Px,所在组段频数,f,L,:,小于,L,各组段累计频数,数值变量资料的统计分析之统计描述专家讲座,第39页,潜伏期(小时)频数f 累计频数 累计频率(%),(1)(2)(3)(4),0 17 17 11.7,6 46 63 43.4,12 38 101 69.6,18 32 133 91.7,24 6 139 95.9,30 0 139 95.9,36 4 143 98.6,42 2 145 100.0,累计 145 ,145例食物中毒病人潜伏期分布表,求P,25,和P,75,数值变量资料的统计分析之统计描述专家讲座,第40页,P,25,=6+(6/46)(14525%17),=8.51(小时),P,75,=18+(6/32)(14575%101),=19.45(小时),数值变量资料的统计分析之统计描述专家讲座,第41页,练习题,1.适合用于对称分布或近似对称分布资料平均数为,A.算数均数,B.几何均数,C.中位数,D.百分位数,答案:A,数值变量资料的统计分析之统计描述专家讲座,第42页,描述正态分布资料集中趋势指标是(),A.中位数,B.几何均数,C.算术平均数,D.标准差,答案:C,(全国年4月高等教育自学考试预防医学(二)试题),数值变量资料的统计分析之统计描述专家讲座,第43页,2.描述一组偏态分布资料平均水平,以下哪个指标很好,A算术均数,B几何均数,C百分位数,D中位数,答案:D,数值变量资料的统计分析之统计描述专家讲座,第44页,3.计算某抗体滴度平均水平,普通宜选择,A算术均数,B几何均数,C中位数,D百分位数,答案:B,数值变量资料的统计分析之统计描述专家讲座,第45页,描述呈倍数关系数值变量指标是,A算术均数,B几何均数,C中位数,D百分位数,答案:B,数值变量资料的统计分析之统计描述专家讲座,第46页,三、离散趋势指标(掌握),数值变量资料的统计分析之统计描述专家讲座,第47页,数值变量资料的统计分析之统计描述专家讲座,第48页,数值变量资料的统计分析之统计描述专家讲座,第49页,离散趋势指标(掌握),三组同龄男孩体重(kg)以下:,甲组 90 95 100 105 110 均数=100(cm),乙组 96 98 100 102 104 均数=100(cm),丙组 96 99 100 101 104 均数=100(kg),平均水平指标仅描述一组数据集中趋势,可作为总体均数一个预计值。因为变异客观存在,需要一类指标描述资料离散趋势,。,惯用指标:,全距,四分位数间距,方差,,标准差,,变异系数,数值变量资料的统计分析之统计描述专家讲座,第50页,科学出版社卫生职业教育出版分社,概念,是一组变量值中最大值与最小值之差,反应一组变量值变异范围。,符号,以符号,R,表示,公式,R=最大值-最小值,极差,(又称全距),数值变量资料的统计分析之统计描述专家讲座,第51页,R,甲=110,90=20(cm,),R,乙=104,96=8(cm),R,丙=104,96=8(cm),甲组 90 95 100 105 110 均数=100(cm),乙组 96 98 100 102 104 均数=100(cm),丙组 96 99 100 101 104 均数=100(kg),数值变量资料的统计分析之统计描述专家讲座,第52页,缺点:,只用到最大、最小值,样本信息没能充分利用,不能反应全部数据变异程度。,受样本含量影响较大,样本例数越多,R可能越大,2组观察值例数悬殊时不用R比较。,样本含量不变时,每次抽样得到极差值相差较大,R稳定性较差。,优点:表示变异范围,简单明了;,各种分布类型资料均可用。,数值变量资料的统计分析之统计描述专家讲座,第53页,练习题,关于极差描述错误是,A.极差值大,离散度就大,B.极差能够反应全部数据变异大小,C.极差受样本含量影响较大,D.极差只能粗略说明变量值变动范围,答案:B,数值变量资料的统计分析之统计描述专家讲座,第54页,四分位数间距,四分位数,间距,用Q表示:,Q=,四分位数间距越大,说明变异度越大;反之,说明变异度越小。,数值变量资料的统计分析之统计描述专家讲座,第55页,方差,方差也称均方差,反应一组数据平均离散水平。,方差愈小,说明变量值变异程度愈小;方差愈大,说明变异程度愈大。,数值变量资料的统计分析之统计描述专家讲座,第56页,样本方差用 表示,数值变量资料的统计分析之统计描述专家讲座,第57页,概念,把方差开平方,恢复了原来单位,这就是标准差。,优点,因为克服了方差不足因而最惯用。,符号,s,表示样本标准差,表示总体标准差,。,标准差,数值变量资料的统计分析之统计描述专家讲座,第58页,公式:,样本标准差用 表示,公式:,数值变量资料的统计分析之统计描述专家讲座,第59页,说明变量值变异程度。,2.标准差意义,标准差愈小,说明变量值变异程度愈小;标准差愈大,说明变异程度愈大。,数值变量资料的统计分析之统计描述专家讲座,第60页,标准差公式还能够写成,:,利用频数表计算标准差公式为,数值变量资料的统计分析之统计描述专家讲座,第61页,测定了5名健康人第一小时末红细胞沉降率,分别是6,、3、2、9、10mm,求标准差。,数值变量资料的统计分析之统计描述专家讲座,第62页,例,某年某市120名12岁健康男孩身高(cm)资料以下表,求其标准差。,数值变量资料的统计分析之统计描述专家讲座,第63页,142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5,134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0,145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6,151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4,141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1,143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4,134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4,150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2,125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7,160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4,134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4,129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9,数值变量资料的统计分析之统计描述专家讲座,第64页,数值变量资料的统计分析之统计描述专家讲座,第65页,数值变量资料的统计分析之统计描述专家讲座,第66页,练习题,描述离散趋势指标是A.标准差 B.中位数C.几何均数 D.算术均数,答案:A,(全国年4月高等教育自学考试预防医学(二)试题),数值变量资料的统计分析之统计描述专家讲座,第67页,关于样本标准差描述正确是,A.样本标准差就是总体标准差,B.样本方差是样本标准差正平方根,C.标准差有量纲,其量纲与原变量值相同,D.标准差可能为负值,答案:C,数值变量资料的统计分析之统计描述专家讲座,第68页,均数和标准差关系是,A均数愈大,s愈大,B均数愈大,s愈小,Cs愈大,均数对各变量值代表性愈好,Ds愈小,均数对各变量值代表性愈好,答案:D,数值变量资料的统计分析之统计描述专家讲座,第69页,各观察值均加(或减)同一个不等于零数后,A均数不变,标准差改变,B均数改变,标准差不变,C二者均不变,D均数不变,标准差不一定改变,答案:B,数值变量资料的统计分析之统计描述专家讲座,第70页,变异系数,变异系数(,coefficient of variation,)记为,CV,,,多用于观察指标单位不,同时,如身高与体重变异程度比较;或均数相差较大时,如儿,童,身高与成人身高变异程度比较。,数值变量资料的统计分析之统计描述专家讲座,第71页,例,某地20岁男子160人,身高均数为166.06,cm,,标准差为4.95,cm,;体重均数为53.72,kg,,标准差为4.96,kg,。试比较身高与体重变异程度。,数值变量资料的统计分析之统计描述专家讲座,第72页,数值变量资料的统计分析之统计描述专家讲座,第73页,例,某地130名10岁女生体重均数为26.96,kg,,标准差为3.9,kg,;150名17岁女生体重均数为49.18,kg,,标准差为5.3,kg,,试比较两个年纪别女生体重离散程度。,数值变量资料的统计分析之统计描述专家讲座,第74页,数值变量资料的统计分析之统计描述专家讲座,第75页,练习题,关于变异系数以下描述错误是,A.变异系数能够反应变量值绝对值离散程度,B.变异系数是无量纲单位,C.变异系数能够用来比较不一样单位指标间变异度,D.变异系数消除了均数大小对标准差影响,答案:A,数值变量资料的统计分析之统计描述专家讲座,第76页,比较血压和脉搏两组数据变异度大小宜采取,A变异系数,B方差,C极差,D标准差,答案:A,数值变量资料的统计分析之统计描述专家讲座,第77页,设同一组7岁男童身高均数是110cm,标准差是5cm,体重均数是25kg,标准差是3kg,则比较二者变异程度结论为,A身高变异程度小于体重变异程度,B身高变异程度等于体重变异程度,C身高变异程度大于体重变异程度,D单位不一样,无法比较,答案:A,数值变量资料的统计分析之统计描述专家讲座,第78页,正态分布,正态分布(normal distribution)又称高斯分布(Gaussian distribution),是一个主要连续型分布,应用甚广,是许多统计方法理论基础。,数值变量资料的统计分析之统计描述专家讲座,第79页,正态分布曲线,数值变量资料的统计分析之统计描述专家讲座,第80页,正态分布特征,数值变量资料的统计分析之统计描述专家讲座,第81页,数值变量资料的统计分析之统计描述专家讲座,第82页,(4)正态曲线下面积分布有一定规律。,1,范围内面积占68.27。,1.96,范围内面积占95.00。,2.58,范围内面积占99.00。,数值变量资料的统计分析之统计描述专家讲座,第83页,标准正态分布,数值变量资料的统计分析之统计描述专家讲座,第84页,练习题,正态曲线位置参数是指,A.均数,B.标准正态变量u,C.标准差,D.样本标准差s,答案:A,数值变量资料的统计分析之统计描述专家讲座,第85页,正态分布N(,,2,),当恒定时,越大,则,A曲线沿横轴越向右移动,B曲线沿横轴越向左移动,C曲线形状和位置都不变,D观察值变异程度越大,曲线越“胖”,答案:D,数值变量资料的统计分析之统计描述专家讲座,第86页,对于均数为标准差为正态分布,95变量值分布范围为,A,-,+,B,-1,96,+1,96,C,-2,58,+2,58,D,-,+1,96,答案:B,数值变量资料的统计分析之统计描述专家讲座,第87页,正态曲线下、横轴上,从均数到+196面积为,A95,B45,C975,D475,答案:D,数值变量资料的统计分析之统计描述专家讲座,第88页,关于标准正态分布描述,错误,是,A.标准正态分布能够表示为N(0,1,2,),B.标准正态分布均数等于0,C.标准正态分布标准差等于1,D.标准正态分布(-11)区间面积占总面积95%,答案:D,数值变量资料的统计分析之统计描述专家讲座,第89页,医学参考值范围包括到采取单侧界值还是双侧界值问题,这通常依据医学专业知识而定。,双侧,:,血清总胆固醇不论过低或过高均属异常,白细胞数不论过低或过高均属异常,单侧:,1、血清转氨酶仅过高异常,2、肺活量仅过低异常,数值变量资料的统计分析之统计描述专家讲座,第90页,医学参考值范围有 、,等,最惯用为 。,计算医学参考值范围惯用方法:,1、正态分布法,2、,百分位数法,数值变量资料的统计分析之统计描述专家讲座,第91页,1、,正态分布法:,许多生物医学数据,服从或近似服从正态分布,,如同年纪同性别儿童,身高值,、,体重值,,同性别健康成人,红细胞数,等;,数值变量资料的统计分析之统计描述专家讲座,第92页,公式:,数值变量资料的统计分析之统计描述专家讲座,第93页,数值变量资料的统计分析之统计描述专家讲座,第94页,数值变量资料的统计分析之统计描述专家讲座,第95页,即 不低于3.3L。,数值变量资料的统计分析之统计描述专家讲座,第96页,2、,百分位数法,适用:,各种分布资料尤其是偏态分布资料,数值变量资料的统计分析之统计描述专家讲座,第97页,公式:,数值变量资料的统计分析之统计描述专家讲座,第98页,例,2-17,测得某年某地名正常人尿汞值以下表,试制订正常人尿汞值参考值范围。,数值变量资料的统计分析之统计描述专家讲座,第99页,正常人尿汞值为偏态分布,且过高为异常,应计算第95百分位数,数值变量资料的统计分析之统计描述专家讲座,第100页,练习题,医学中确定参考值范围时应注意,A正态分布资料不能用均数标准差法,B正态分布资料不能用百分位数法,C偏态分布资料不能用均数标准差法,D偏态分布资料不能用百分位数法,答案:C,数值变量资料的统计分析之统计描述专家讲座,第101页,数值变量资料的统计分析之统计描述专家讲座,第102页,
展开阅读全文