1、卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,*,第一节 数值变量资料的统计描述,一、数值变量资料的频数分布,二、平均水平指标,三、离散程度指标,1,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例.某地用随机抽样方法检查了140名成年男子的红细胞数(,x10,12,/L),,检查结果见下表。,4.76,5.26,5.61,5.95,4.46,4.57,4.31,5.18,4.92,4.27,4.77,4.88,5.00,4.72,4.47,5.34,4.70,4.81,4.93,5.04,4.40,5.2
2、7,4.63,5.50,5.24,4.97,4.71,4.44,4.94,5.05,4.78,4.52,4.63,5.51,5.24,4.98,4.33,4.83,4.56,5.44,4.79,4.91,4.26,4.38,4.87,4.99,5.60,4.46,4.95,5.07,4.80,5.30,4.65,4.77,4.50,5.37,5.49,5.22,4.58,5.07,4.81,4.54,3.82,4.01,4.89,4.62,5.12,4.85,4.59,5.08,4.82,4.93,5.05,4.40,4.14,5.01,4.37,5.24,4.60,4.71,4.82,4.9
3、4,5.05,4.79,4.52,4.64,4.37,4.87,4.60,4.72,4.83,5.33,4.68,4.80,4.15,4.65,4.76,4.88,4.64,3.97,4.08,4.58,4.31,4.05,4.16,5.04,5.15,4.50,4.62,4.73,4.47,4.58,4.70,4.81,4.55,4.28,4.78,4.51,4.63,4.36,4.48,4.59,5.09,5.20,5.32,5.05,4.41,4.52,4.64,4.75,4.49,4.22,4.71,5.21,4.94,4.68,5.17,4.91,5.02,4.76,2,卫生学(第7
4、版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,频数表的编制步骤,:,求极差,决定组数、组段和组距,列出组段:,划记计数,3,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,(,1,)对称分布:,若各组段的频数以频数最多组段为中心,左右两侧大体对称,就认为该资料是对称分布,6,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,正偏态 负偏态,返回,(,2,)偏态分布:,7,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,1.,算术均数(,ar
5、ithmetic mean,,),2.,几何均数(,geometric mean,,,G,),3.,中位数(,median,,,M,),8,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,1、算术均数,算术均数:简称均数(,mean,),定义:是一组变量值之和除以变量值个数所得的商。,总体均数,:,样本均数,:,x,均数适用于资料呈对称分布,尤其是正态分布或近似正态分布的资料。,9,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,计算方法,(,1,)直接计算法,公式:,例.有,9,名健康成人的空腹胆固醇测定值,
6、mol/L),为,:5.61,,,3.96,,,3.67,,,4.99,,,4.24,,,5.06,,,5.20,,,4.79,,,5.93,,求算术平均数。,x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9,=4.83(mol/L),10,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,(,2,)加权法(利用频数表),公式:,k,:频数表的组段数,f,:频数,:组中值,其中,i,=1,,,2,,,k,。,11,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例.某地
7、用随机抽样方法检查了140名成年男子的红细胞数(,x10,12,/L),,检查结果见下表。,4.76,5.26,5.61,5.95,4.46,4.57,4.31,5.18,4.92,4.27,4.77,4.88,5.00,4.72,4.47,5.34,4.70,4.81,4.93,5.04,4.40,5.27,4.63,5.50,5.24,4.97,4.71,4.44,4.94,5.05,4.78,4.52,4.63,5.51,5.24,4.98,4.33,4.83,4.56,5.44,4.79,4.91,4.26,4.38,4.87,4.99,5.60,4.46,4.95,5.07,4.80
8、5.30,4.65,4.77,4.50,5.37,5.49,5.22,4.58,5.07,4.81,4.54,3.82,4.01,4.89,4.62,5.12,4.85,4.59,5.08,4.82,4.93,5.05,4.40,4.14,5.01,4.37,5.24,4.60,4.71,4.82,4.94,5.05,4.79,4.52,4.64,4.37,4.87,4.60,4.72,4.83,5.33,4.68,4.80,4.15,4.65,4.76,4.88,4.64,3.97,4.08,4.58,4.31,4.05,4.16,5.04,5.15,4.50,4.62,4.73,4.47
9、4.58,4.70,4.81,4.55,4.28,4.78,4.51,4.63,4.36,4.48,4.59,5.09,5.20,5.32,5.05,4.41,4.52,4.64,4.75,4.49,4.22,4.71,5.21,4.94,4.68,5.17,4.91,5.02,4.76,12,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,表,某地140名正常男子红细胞数的频数分布表,红细胞数,组中值,(x,i,),频数,(f),频率,(%),3.80,3.90,2,1.4,4.00,4.10,6,4.3,4.20,4.30,11,7.9,4.40
10、4.50,25,17.9,4.60,4.70,32,22.9,4.80,4.90,27,19.3,5.00,5.10,17,12.1,5.20,5.30,13,9.3,5.40,5.50,4,2.9,5.60,5.70,2,1.4,5.86.00,5.90,1,0.7,13,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,2、几何均数(,geometric mean,),定义:用,G,表示,是将,n,个观察值,x,的乘积再开,n,次方的方根(或各观察值,x,对数值均值的反对数)。,适用条件:,1.,当一组观察值为非对称分布、其差距相差较大;,2.呈倍
11、数关系的等比资料或对数正态分布(正偏态)资料(如抗体滴度资料);,3.不能有0;不能同时有正、负值。,14,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,几何均数计算公式:,(1)直接法,几何均数:,变量对数值的算术均数的反对数。,计算几何均数的观察值应大于零,15,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例,有,7,份血清的抗体效价分别为,1:2,1:4,1:8,1:16,1:32,1:64,1:128,求平均抗体效价。,7,份血清的平均抗体效价,为:1:16,16,卫生学(第7版)第九章 数值变量
12、资料的统计分析,7,版),第九章 数值变量资料的统计分析,(,2,)加权法,(当观察例数多时采用),公式:,17,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例,有,60,人的血清抗体效价,分别为,:7,人,1:5,,,11,人,1:10,,,22,人,1:20,,,12,人,1:40,,,8,人,1:80,,求平均抗体效价。,50,人的血清平均抗体效价为,1:21,。,18,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,3、,中位数,其适用情况:,适合各种类型的资料,尤其适合于,当资料呈明显的偏态分布;
13、资料一端或两端无确定数值(如大于或小于某数值);,资料的分布情况不清楚。,(一)中位数(,median,),定义:用符号,M,表示,中位数是把一组观察值,按从小到大顺序排列,位置居中的数值(,n,为奇数)或位置居中的两个数值的均值(,n,为偶数)。,19,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,计算公式,:,n,为奇数时,n,为偶数时,20,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例,7,名正常人的血压,(,舒张压,),测定值,(mmHg),为,:72,,,75,,,76,,82,77,,81
14、86,,,求,中位数,。,若又观察了一个人的血压,为,87(mmHg),,此时?,从小到大排列,:72,,,75,,,76,,,77,,,81,,,82,,,86,77,(,77+81,),/2=79(mmHg),21,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,百分位数示意图,(二)百分位数(,percentile,),把一组数据从小到大排列,分成,100,等份,各等份含,1%,的观察值,分割界限上的数值就是百分位数。,中位数是第,50,百分位数,用,P,50,表示。,X%,22,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第
15、九章 数值变量资料的统计分析,公式:,23,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,表,某地140名正常男子红细胞数的频数分布表,红细胞数,组中值,(x,i,),频数,(f),累计频数(,f,),频率,(%),累计频率,(%),3.80,3.90,2,2,1.4,1.4,4.00,4.10,6,8,4.3,5.7,4.20,4.30,11,19,7.9,13.6,4.40,4.50,25,44,17.9,31.5,4.60,4.70,32,76,22.9,54.4,4.80,4.90,27,103,19.3,73.7,5.00,5.10,17,
16、120,12.1,85.8,5.20,5.30,13,133,9.3,95.1,5.40,5.50,4,137,2.9,98.0,5.60,5.70,2,139,1.4,99.3,5.86.00,5.90,1,140,0.7,100,P,25,4.40+0.20 x(140 x25%,19,)/25,4.528,M=P,50,4.7625,24,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,1.,极差(,range,,,R,),2.,四分位数间距,(,interquantile range,,,IQR,),3.,方差(,variance,,,S,2,
17、4.,标准差(,standard deviation,,,S,),5.,变异系数,(,coefficient of variation,,,CV,),离散程度指标,25,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,盘编号,甲,乙,丙,1,560,520,510,2,540,510,505,3,500,500,500,4,460,490,495,5,440,480,490,合计,2500,2500,2500,均数,500,500,500,例:设甲、乙、丙三人,采每人的耳垂血,然后作红细胞计数,每人数,5,个计数盘,得结果如下(万,/mm,3,),
18、甲,乙,丙,26,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,全距,用,R,表示:即一组变量值最大值与最小值之差,亦称极差。对于上例中数据,有,简单,但仅利用了两端点值,稳定性差。,1、全距(,Range,),R,5.953.82=2.13(x10,12,/L),R,越大,变异度越大;,R,越小,变异度越小。,27,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,2、四分位数间距(,quartile range,),四分位数间距:,Q=P,75,-P,25,下四分位数:,Q,L,=,P,25,上四分位数:,
19、Q,U,=,P,75,比全距稳定;可用于一端或两端无确切数值的偏态资料。,未考虑每一个观察值。,28,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,3、方差,1.,方差(,variance,)是离均差平方和的均数,是描述所有观察值与均数的平均离散程度的指标,反映一组数据的平均离散水平。,离均差平方和,SS,自由度,29,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,样本标准差用 表示,其度量单位与均数一致,所以最常用。,公 式:,4标准差(,standard deviation,),30,卫生学(第7版)第
20、九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,利用频数表计算标准差的公式为:,31,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例,对以下数据,:75,76,72,69,66,72,57,68,71,72,用直接法计算标准差。,32,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,血糖,(mol/L),组段,频数,(),组中值,(X,i,),3.60,3,3.70,11.10,41.07,3.80,3,3.90,11.70,45.63,4.00,8,4.10,32.80,134.4
21、8,4.20,23,4.30,98.90,425.27,4.40,24,4.50,108.00,486.00,4.60,25,4.70,117.50,552.25,4.80,20,4.90,98.00,480.20,5.00,12,5.10,61.20,312.12,5.20,10,5.30,53.00,280.90,5.40,5.60,4,5.50,22.00,121.00,合计,132,614.20,2878.92,例,.,利用表中的数据和频数表法计算标准差。,33,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,标准差意义和应用,标准差的意义,:
22、全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好),标准差的应用,:,描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围,34,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,5、变异系数,变异系数,(coefficient of variation,,,CV),常,用于比较度量单位不同或均数相差悬殊的两组,(,或多组,),资料的变异程度。,35,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例1:某地,7,岁男孩身高的均数为,123.10
23、 cm,,标准差为,4.71cm,;体重均数为,22.29kg,,标准差为,2.26kg,比较其变异度?,36,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例2:某地不同年龄女童的身高资料如下,比较不同年龄身高的变异程度。,年龄组,人数,均数,标准差,变异系数,12月,100,56.3,2.1,3.7,56月,120,66.5,2.2,3.3,33.5岁,300,96.1,3.1,3.2,55.5岁,400,107.8,3.3,3.1,表 某地不同年龄女童身高(,cm),的变异程度,37,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第
24、九章 数值变量资料的统计分析,小结,正态分布,偏态分布,集中趋势,算术平均数,(,几何平均数,),中位数,离散趋势,标准差、,变异系数,四分位间距,38,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,第二节 正态分布和参考值范围的估计,一、正态分布,二、正态分布的特征和曲线下面积分布的规律,三、医学参考值范围,39,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,40,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,41,卫生学(第7版)第九章 数值变量资料的统计分析
25、7,版),第九章 数值变量资料的统计分析,42,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,一、正态分布,定义:以均数为中心,左右完全对称的频数分布,。,当,X,服从正态分布,记作,X,N,(,2,),其中,为总体均数,,2,为总体方差,43,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,数学形式:,X,f,(,X,),m,正态分布的概率密度函数,Where,f(x):,probability density function,e,2.71828,=3.1415,44,卫生学(第7版)第九章 数值变量资
26、料的统计分析,7,版),第九章 数值变量资料的统计分析,标准正态分布,用,N(0,1),表示,即,u,值的均数为,0,,标准差为,1,。,标准正态变换,45,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,正态分布,标准正态分布,46,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,The shaded regions are equivalent in area.,ZN(0,1),xN(,m,s,2,),47,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,二、,正态
27、分布的特征,正态曲线(,normal curve,)在横轴上方,且均数所在处最高;,正态分布以均数为中心,左右对称;,正态分布有两个参数,即均数与标准差(,与,),标准正态分布的均数和标准差分别为,0,和,1,;,正态分布的面积分布有一定的规律性。,48,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,X N(,2,).,49,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,图,2,正态曲线面积分布示意图,50,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,正态曲线下
28、的面积特点,横轴上曲线下的面积为1,标准正态曲线下,横轴上对称于0的面积相等,从-,到,u;,已知时,进行标准正态变换后再查表,,,未知时,用样本的均数和标准差代替,95%,99%的面积公式:,51,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,计算正态曲线下面积实例,例.,mmol/L,,试估计该地正常女子血清甘油三脂在1.10,mmol/L,以下者占正常女子血清甘油三脂总人数的百分比。,查附表9-8,在表的左侧找到0.1,在表的上方找到0.04,两者的相交处为0.4443=44.43%。即该地正常女子血清甘油三脂在1.10,mmol/L,以下者,
29、估计占总人数的44.43%。,mmol/L,,将,X=1.10,代入标准正态变量变换公式,得:,52,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,是指正常人的解剖、生理、生化、免疫等各种数据的波动范围。,参考值范围在诊断方面可用于划分正常人或异常人的界限。,三、医学参考值范围,参考值范围(,reference ranges,),53,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,制定参考值的基本步骤,1,、从正常人总体中抽样,样本量足够大,;,2,控制测量误差,;,3,判定是否需要分组确定参考值范围,;,
30、4.,决定取单侧还是双侧;,5.,选定合适的百分界限,;,6,对资料的分布进行正态性检验,;,7,根据资料的分布类型选定适当的方法进行参考值范围的估计。,54,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,1,、正态分布法,2,、百分位数法,计算医学参考值范围的常用方法:,55,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,根据正态分布原理,,95%,的参考值范围,,双侧为:,x,1.96,S,单侧上限为:,x,+1.645,S,单侧下限为:,x,1.645,S,1.正态分布法:,56,卫生学(第7版)第九
31、章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,假定正常成年女性红细胞数(,10,12,/L),近似服从均值为4.18,标准差为0.29的正态分布。令,X,代表随机抽取的一名正常成年女性的红细胞数,求:正常成年女性的红细胞数95%参考值范围。,例,因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该指标过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:,下限为:,X-1.96S=4.18-1.96(0.29)=3.61,(,10,12,/L),上限为:,X+1.96S=4.18+1.96(0.29)=4.75,(,10,12,/L),
32、95%的正常成年女性红细胞数所在的范围是3.61,4.75(,10,12,/L,)。,57,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,2.百分位数法:,双侧参考值范围,:,95%:P,2.5,P,97.5,99%:P,0.5,P,99.5,单侧参考值范围,:,95%:,下限,P,上限:,P,95,58,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,对某地630名50岁60岁的正常妇女检查了血清甘油三脂含量,见下表,试估计其血清甘油三脂含量的95%单侧参考值范围。,甘油三脂 (,mg/dl),频数,累计频
33、数,累计频率,(%),10,27,27,4.3,40,169,196,31.1,70,167,363,57.6,100,94,457,72.5,130,81,538,85.4,160,42,580,92.1,190,28,608,96.5,220,14,622,98.7,250,4,626,99.4,280,3,629,99.8,310,1,630,100.0,例:,P,95,=203.2(mg/dl),59,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,小结,计量资料的统计描述,集中趋势指标,算术均数、几何均数、中位数(百分位数),离散趋势指标,极
34、差、四分位数间距,方差、标准差、,变异系数,各类指标的含义、计算方法、应用条件。,正态分布,正态曲线下面积分布规律,医学参考值范围估计,60,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,统计推断,参数估计,假设检验,61,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,第三节 数值变量资料的统计推断,一、均数的抽样误差与标准误,二、,t,分布,三、总体均数的置信区间估计,四、假设检验的基本思想和步骤,62,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,一,、,均数
35、的抽样误差与标准误,1、概念,抽样误差:由于抽样引起的样本统计量与总体参数之间的差异。,63,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例如,从总体均数,为4.83 /,L、,标准差,为,0.52,/,L,的正态分布总体,N,(4.83,0.522),中,随机,抽取10人为一个样本(,n,=10),,并计算该样本的均数、,标准差。如此重复抽取100次(,g=100),,可得到100份,样本,可得到100对均数 和标准差,S。,正态总体,=4.83,=0.52,1.4.58,0.38,2.4.90,0.45,3.4.76,0.49,99.4.87,
36、0.59,100.4.79,0.39,S,64,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,标准误,已知,未,知,样本均数的标准差,用于衡量抽样误差的大小;,65,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,标准误的特点:,当样本例数,n,一定时,标准,误与标准差呈正比;,当标准差一定时,标准误与,样本含量,n,的平方根呈反比。,通过增加样本含量,n,来降低抽样误差。,66,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,从正态总体,N,(,m,s,2,),中抽
37、取样本,获得均数的分布仍近似呈正态分布,N,(,m,s,2,/,n,),。,即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。-中心极限定理,抽样实验,二、,t,分布,67,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,随机变量,X,N,(,m,,,s,2,),标准正态分布,N,(,0,,,1,2,),u,变换,均数,标准正态分布,N,(,0,,,1,2,),Student,t,分布,自由度:,n-1,t,分布,68,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,t,分布,69,卫生学(第7版)第九章
38、数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,t,分布的特征,以0为中心,左右对称的单峰分布;,t,分布曲线是一簇曲线,其形态变化与自由度的,大小有关。,自由度越小,则,t,值越分散,曲线越低平;,自由度逐渐增大时,,t,分布逐渐逼近,u,分布(标准,正态分布);当趋于时,,t,分布即为,u,分布。,70,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,t,分布特点,:,单峰分布,一簇曲线,曲线在,t,0,处最高,并以,t,0,为中心左右对称,与正态分布相比,曲线最高处较矮,两尾部翘得高,随自由度增大,曲线逐渐接近正态分布;分布的极
39、限为标准正态分布。,t,分布曲线,71,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,t,分布曲线下面积(附表,P302),双侧,t,0.05/2,9,2.262,单侧,t,0.025,9,单侧,t,0.05,9,1.833,双侧,t,0.05/2,,1.96,单侧,t,0.025,,单侧,t,0.05,,1.64,t,=,u,72,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,三、总体均数的置信区间估计,1、,点(值)估计:,用样本均数直接作为总体均数的估计值,未考虑抽样误差。,2、,区间估计:,根据样本
40、均数,按一定的可信度计算 出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间。,参数估计有两种方法:,估计正确的概率(1,),称为可信度或置信度(,confidence level),,常取95或99,73,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,参数估计有两种方法:,(,1,)点值估计:即直接用样本均数作为总体均数的估计值。,(,2,)区间估计:总体均数,95%,置信区间的涵义为由样本均数确定的总体均数所在范围包含总体均数的可能性为,95%,。,三、总体均数的置信区间估计,74,卫生学(第7版)第九章 数值变量资料的统计分析,7
41、版),第九章 数值变量资料的统计分析,u,0.05/2,=1.96,双侧1-,置信区间为:,1.,已知(,u,分布法),总体均数的95%置信区间为:,总体均数的区间估计的计算方法,75,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,2.,未知,n,样本例数较小,95%,CI for,:,按,t,分布原理,95%的,t,值在,t,0.05/2,,之间,即,76,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,3.,未知,但,n,足够大(,u,分布法),总体均数的95%置信区间为:,77,卫生学(第7版)第九章
42、 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,2.总体均数的可信区间,小样本总体均数的可信区间,例,78,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,4.大样本总体均数的可信区间(1),大样本总体均数的可信区间,79,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,正常值范围估计与可信区间估计,正常值范围,概念:绝大多数正常人的某指标范围。(95%,99%,指绝大多数正常人),计算公式:,用途:判断观察对象的某项指标是否正常.,可信区间,概念:总体均数所在的数值,范围(95%,99%指
43、可信度),计算公式:,用途:估计总体均数,80,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,小结,均数的抽样误差,标准误:计算公式、意义和特点,t,分布及其特征,总体均数可信区间,含义,估计方法,与医学参考值的区别,81,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,习题,1.有100个健康成年男子,用甲方法进行血钙值测定,得均数为10毫克/100毫升,标准差 为2毫克/100毫升。,(1)根据此资料可否推测所有健康成年男子血钙值总体均数可能的所在范围?,(2)现有一成年男子血钙值为8毫克/100毫升,问
44、此人血钙值是否正常?,(3)另有120个健康成年男子,用乙方法进行血钙值测定,得均数为12毫克/100 毫升,标准差为1.8毫克/100毫升。问甲、乙两方法均数差别有无显著性?,82,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,四、假设检验的基本思想和步骤,假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。,83,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,例,某地抽查了26名男性管理人员的空腹血糖均数,x,为4.84,mmol,/L,,标准差,s,为0.85
45、mmol,/L。,已知大量调查的一般健康成年男性空腹静脉血糖均数为4.70,mmol,/L。,能否据此认为该地抽查的26名健康男性管理人员的空腹血糖均值与一般健康成年男性空腹静脉血糖均值不同?,84,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,差异的原因:,(1),由于抽样误差造成的.,(,实际上 ,但由于抽样误差 不能很好代表,),(2),该地男性管理人员的空腹血糖与一般健康成年男性空腹静脉血糖不同(),85,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,假设检验的目的就是,判断差异的原因,:,求出由
46、抽样误差造成此差异的可能性,(,概率,P),有多大!,若,P,较大,(,P0.05),,,认为是由于抽样误差造成的。,原因(,1,),实际上,若,P,较小,(,P,0.05),,,认为不是由于抽样误差造成的。,原因(,2,),实际上 ,86,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,假设检验的基本思想,假设检验的基本思想是利用小概率反证法思想。反证法思想是先提出假设,(,检验假设,H,0,),,再用适当的统计方法确定假设成立的可能性大小,如可能性小,(,小概率事件(,P,0.05,)是指在一次试验中基本上不大会发生的事件。,),则认为假设不成立,
47、若可能性大,则还不能认为假设不成立。,87,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,假设检验的基本步骤,第一步:提出检验假设,建立检验水准;,第二步:选定统计方法,计算出统计量,的值;,第三步:确定,P,值,作出推断结论。,88,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,1、建立检验假设和设定检验水准,无效假设 或零假设,H,0,:,=,0,双侧检验,0,0,或,0,检验水准 或显著性水准,=0.05,H,1,:,备择假设,单侧检验,89,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),
48、第九章 数值变量资料的统计分析,x,0,s,x,t,=,x,0,4.84 4.70,s,/,n,0.85,/,26,=,=,=,0.844,2、计算统计量,=,0,0,=0.05,H,0:,H,1,:,90,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,3、确定,P,值,作出统计推断统计,P0.05,,,按 检验水准,不拒绝,H,0,,,差异无统计学,意义,(差异无显著性),还不能认为不同或不等。,P0.05,,,按 检验水准,拒绝,H,0,,,接受,H,1,,,差异有统计学意义,(差异有显著性),可以认为不同或不等。,P0.01,,,按 检验水准,
49、拒绝,H,0,,,接受,H,1,,,差异有高度统计学意义,(差异有高度显著性),可以认为不同或不等。,91,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,2.060,-2.060,=26-1=25 t,0.05/2,25,=2.060,t,=0.844 0.05,接受,H,0,结论:,健康男性管理人员的空腹血糖均值与一般健康成年男性空腹静脉血糖均值相同。,t,=25,1.708,92,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,第四节,t,检验和,u,检验,t,检验和,u,检验就是统计量为,t,u,的假设
50、检验,两者均是常见的假设检验方法。当样本含量,n,较大时,样本均数符合正态分布,故可用,u,检验进行分析。当样本含量,n,较小,样本来自正态分布,两样本相应的总体方差相等,则用,t,检验。,93,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,一、样本均数与总体均数的比较,二、配对资料的比较,三、两个样本均数的比较,四、假设检验应注意的问题,94,卫生学(第7版)第九章 数值变量资料的统计分析,7,版),第九章 数值变量资料的统计分析,适用条件,1、资料服从正态分布或近似正态分布,2、两样本均数比较时还要求两总体方差相等,95,卫生学(第7版)第九章






