资源描述
2-数值变量资料的统数值变量资料的统计描述计描述 回顾回顾资料通常被分为三种类型资料通常被分为三种类型:n n定量资料定量资料(measurement data):(measurement data):用定量的方法对观察单位进行测量得到的资料。用定量的方法对观察单位进行测量得到的资料。n n定性资料定性资料(enumeration data):(enumeration data):用定性的方法得到的资料。用定性的方法得到的资料。n n等级资料等级资料(ranked data):(ranked data):不能精确测量不能精确测量,仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。2024/5/242024/5/24周五周五2 2第一节 定量资料频数分布 定量资料进行定量资料进行统计描述统计描述需要根据资料的需要根据资料的分布类型分布类型选择合适的选择合适的统计指标统计指标,因此首先,因此首先要通过频数分布表或分布图了解资料的要通过频数分布表或分布图了解资料的分分布特征布特征。一、频数分布表及其制作一、频数分布表及其制作 2024/5/242024/5/24周五周五3 3例例1 某地区某地区2002年年5558岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)测测定值如下,试编制频数表和观察频数分布情况。定值如下,试编制频数表和观察频数分布情况。5.175.175.565.564.864.864.874.874.744.745.245.245.515.514.464.464.964.964.824.824.904.905.305.305.225.225.585.584.484.484.804.804.64.64.024.025.165.165.365.364.344.344.244.244.644.644.274.274.254.254.444.444.464.464.624.624.874.874.344.344.904.905.255.254.774.774.854.855.075.074.164.164.664.664.704.704.204.203.953.954.094.094.644.644.334.335.215.214.614.614.984.985.245.244.604.604.254.254.784.785.005.003.603.604.114.114.614.614.084.084.784.784.264.264.444.444.384.384.44.44.794.794.764.764.924.924.604.604.784.785.035.034.354.354.184.184.684.684.654.654.574.574.274.274.994.994.214.214.894.894.714.714.724.724.414.414.384.384.064.064.794.794.964.964.834.834.454.454.514.514.274.274.504.504.314.315.055.055.595.595.085.085.165.163.743.744.364.365.365.364.644.645.095.094.574.574.464.464.564.564.394.395.245.244.614.614.214.214.964.964.344.344.454.454.864.864.504.504.904.904.454.454.494.494.424.424.684.684.564.565.385.384.344.344.464.464.164.164.984.984.294.294.834.834.274.273.683.683.853.853.863.864.564.564.564.564.554.555.165.165.155.155.165.162024/5/242024/5/24周五周五4 4频数表的编制步骤:(1)求极差求极差(range):又称为全距):又称为全距 R5.593.60=1.99(mol/L)(2)决定组数、组段和组距决定组数、组段和组距:10组左右,组段包含所组左右,组段包含所有数值,组距为极差的十分之一有数值,组距为极差的十分之一,再略加调整再略加调整 1.99/10 =0.199 0.2(mol/L)(3)列出组段列出组段:第一组段的下限必须包含最小值,最:第一组段的下限必须包含最小值,最后一个组段上限必须大于或等于最大值。后一个组段上限必须大于或等于最大值。3.6 3.8 5.2 5.45.6(4)划记计数划记计数:用划记法将所有数据归纳到各组段,:用划记法将所有数据归纳到各组段,得到各组段的频数。得到各组段的频数。2024/5/242024/5/24周五周五5 5表2-1 某地区2002年5558岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132132100.00 100.00 2024/5/242024/5/24周五周五6 6血糖(mol/L)人数图图图图.某地区某地区某地区某地区20022002年年年年55585558岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测定值的频数分布图测定值的频数分布图测定值的频数分布图测定值的频数分布图 二、频数分布图二、频数分布图2024/5/242024/5/24周五周五7 7三、频数表和频数分布图用途1 1描述频数分布的类型(描述频数分布的类型(描述频数分布的类型(描述频数分布的类型(对称分布、偏态分对称分布、偏态分对称分布、偏态分对称分布、偏态分布)布)布)布)2 2描述频数分布的特征描述频数分布的特征描述频数分布的特征描述频数分布的特征(集中、离散集中、离散集中、离散集中、离散)3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值4 4便于进一步做统计分析和处理(加权)便于进一步做统计分析和处理(加权)便于进一步做统计分析和处理(加权)便于进一步做统计分析和处理(加权)2024/5/242024/5/24周五周五8 8(1 1 1 1)对称分布)对称分布)对称分布)对称分布 :若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布描述频数分布的类型(对称、偏态)描述频数分布的类型(对称、偏态)2024/5/242024/5/24周五周五9 9(2 2)偏态分布)偏态分布 :n n1)左偏态分布(正偏态分布):峰向)左偏态分布(正偏态分布):峰向左偏,频数向右侧拖尾。左偏,频数向右侧拖尾。n n2)右偏态分布(负偏态分布)右偏态分布(负偏态分布):峰向右峰向右偏,频数向左侧拖尾。偏,频数向左侧拖尾。2024/5/242024/5/24周五周五1010正偏态(左偏态)正偏态(左偏态)负偏态(右偏态)负偏态(右偏态)2024/5/242024/5/24周五周五1111发现一些特大或特小的可疑值2024/5/242024/5/24周五周五1212第二节 集中趋势指标n n统计上使用统计上使用平均数(平均数(averageaverage)这一指标体系来描这一指标体系来描述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。n n常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(meanmean)几何均数(几何均数(geometricmeangeometricmean)中位数中位数(medianmedian)百分位数(百分位数(percentilepercentile)2024/5/242024/5/24周五周五1313一、算术均数算术均数:简称均数(算术均数:简称均数(mean)n n定定义义:是是一一组组变变量量值值之之和和除除以以变变量量值值个个数数所所得得的的商商。均均数数适适用用于于资资料料呈呈正正态态分分布布(或近似正态或对称分布)资料(或近似正态或对称分布)资料。n n总体均数总体均数:样本均数样本均数:x2024/5/242024/5/24周五周五14141、计算方法(1 1)直接计算法)直接计算法)直接计算法)直接计算法 公式公式:2024/5/242024/5/24周五周五1515(2)加权法(利用频数表)公式公式:k:频数表的组段数:频数表的组段数 f:频数:频数 :组中值,其中:组中值,其中i=1,2,k。2024/5/242024/5/24周五周五1616二、几何均数(geometricmean)n n定义:用定义:用定义:用定义:用G G表示,是将表示,是将表示,是将表示,是将n n个观察值个观察值个观察值个观察值x x的乘积再开的乘积再开的乘积再开的乘积再开n n次方次方次方次方的方根(或各观察值的方根(或各观察值的方根(或各观察值的方根(或各观察值x x对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。其适用条件是:其适用条件是:其适用条件是:其适用条件是:当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。似倍数关系。似倍数关系。似倍数关系。2024/5/242024/5/24周五周五1717几何均数计算公式:几何均数:几何均数:变量对数值的变量对数值的算术均数的反对数。算术均数的反对数。n n计算几何均数的观察值应大于零2024/5/242024/5/24周五周五1818例 有有7份血清的抗体效价分别为份血清的抗体效价分别为1:2,1:4,1:8,1:16,1:32,1:64,1:128,求求平均抗体效价。平均抗体效价。2024/5/242024/5/24周五周五1919(2)加权法(当观察例数多时采用)(当观察例数多时采用)公式:公式:2024/5/242024/5/24周五周五2020例有有60人的血清抗体效价,分别为人的血清抗体效价,分别为:7人人1:5,11人人1:10,22人人1:20,12人人1:40,8人人1:80,求平均抗体效价。,求平均抗体效价。n n50人的血清平均抗体效价为1:20.705。2024/5/242024/5/24周五周五2121计算几何均数应该注意的事项v变变量量值值中中不不能能有有0 0或或负负数数,因因为为0 0和和负负数数不不能能取对数。取对数。v不不能能同同时时有有正正有有负负。若若全全部部是是负负值值,计计算算时时可先把负号去掉,得出结果后,再加上负号。可先把负号去掉,得出结果后,再加上负号。2024/5/242024/5/24周五周五2222三、中位数与百分位数(一)中位数(一)中位数(median)n n定义:用符号定义:用符号定义:用符号定义:用符号MM表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,按按按按大小顺序排列大小顺序排列大小顺序排列大小顺序排列,位置居中的数值(位置居中的数值(位置居中的数值(位置居中的数值(n n为奇数)或位置为奇数)或位置为奇数)或位置为奇数)或位置居中的两个数值的均值(居中的两个数值的均值(居中的两个数值的均值(居中的两个数值的均值(n n为偶数)。为偶数)。为偶数)。为偶数)。其适用情况有:其适用情况有:其适用情况有:其适用情况有:当资料呈明显的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;资料一端或两端无确定数值(如大于或小于某数资料一端或两端无确定数值(如大于或小于某数资料一端或两端无确定数值(如大于或小于某数资料一端或两端无确定数值(如大于或小于某数值);值);值);值);资料的分布情况不清楚。资料的分布情况不清楚。资料的分布情况不清楚。资料的分布情况不清楚。2024/5/242024/5/24周五周五2323计算公式:n为奇数时为奇数时n为偶数时为偶数时 2024/5/242024/5/24周五周五2424例2.57名正常人的血压名正常人的血压(舒张压舒张压)测定值测定值(mmHg)为为:72,75,76,77,81,82,86,求求中位数中位数。n从小到大排列:72,75,76,77,81,82,86n n若又观察了一个人的血压,为87(mmHg),此时(77+81)/2=79(mmHg)2024/5/242024/5/24周五周五2525频数表资料的中位数下限值下限值L上限值上限值Ui;fm中位数中位数M2024/5/242024/5/24周五周五2626例例例例2.12.1频数表中位数的计算频数表中位数的计算频数表中位数的计算频数表中位数的计算血糖血糖(mol/L)(mol/L)组段组段组中值组中值()频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132(fi)132(fi)100.00 100.00 n n4.60+(0.20/25)*132/2-61=4.642024/5/242024/5/24周五周五2727 百分位数示意图百分位数示意图(二)百分位数(二)百分位数(percentile)n把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。n n中位数是第50百分位数,用P5050表示。2024/5/242024/5/24周五周五2828频数表法频数表法 公式:2024/5/242024/5/24周五周五2929n n当时,此时求得的是中位数2024/5/242024/5/24周五周五3030 例例8.18.1试分别求例试分别求例8.18.1频数表的第频数表的第2525、第、第7575百分位数。百分位数。P254.20+0.20 x(132x25%14)/234.365P754.80+0.20 x(132x75%86)/204.930血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132(fi)132(fi)100.00 100.00 2024/5/242024/5/24周五周五3131三种平均数的特点vv算术均数:通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不稳定而失去代表性。正态分布vv几何均数一般只适宜于等比级数资料。对于这类资料,用几何均数反映集中趋势比算术均数或中位数更合适。vv中位数不受其前后其他数值(特别是极端值)的影响。但如果数据呈明显不同且差异很大,这时中位数可能不适宜作为集中趋势的度量值了。偏态分布2024/5/242024/5/24周五周五3232vv反映集中趋势的指标(平均数),表示一组观察值反映集中趋势的指标(平均数),表示一组观察值反映集中趋势的指标(平均数),表示一组观察值反映集中趋势的指标(平均数),表示一组观察值的平均水及集中特性,并可作为总体的一个代表值的平均水及集中特性,并可作为总体的一个代表值的平均水及集中特性,并可作为总体的一个代表值的平均水及集中特性,并可作为总体的一个代表值加以应用。但是它没有表达其所代表的总体中各个加以应用。但是它没有表达其所代表的总体中各个加以应用。但是它没有表达其所代表的总体中各个加以应用。但是它没有表达其所代表的总体中各个个体之间的差异。个体之间的差异。个体之间的差异。个体之间的差异。vv统计学中把个体间的差异称为统计学中把个体间的差异称为统计学中把个体间的差异称为统计学中把个体间的差异称为变异性(变异性(变异性(变异性(variationvariation)。所谓变异性是指在同质条件下的观察单位,其同一所谓变异性是指在同质条件下的观察单位,其同一所谓变异性是指在同质条件下的观察单位,其同一所谓变异性是指在同质条件下的观察单位,其同一标志的数据间的差异性。用以描述一组数值变量资标志的数据间的差异性。用以描述一组数值变量资标志的数据间的差异性。用以描述一组数值变量资标志的数据间的差异性。用以描述一组数值变量资料观察值之间参差不齐的程度,即离散程度或变异料观察值之间参差不齐的程度,即离散程度或变异料观察值之间参差不齐的程度,即离散程度或变异料观察值之间参差不齐的程度,即离散程度或变异度的指标,称为离散指标或变异指标。度的指标,称为离散指标或变异指标。度的指标,称为离散指标或变异指标。度的指标,称为离散指标或变异指标。第三节 离散趋势的描述2024/5/242024/5/24周五周五3333盘编号盘编号盘编号盘编号 甲甲甲甲乙乙乙乙丙丙丙丙1 1 1 15605605205205105102 2 2 25405405105105055053 3 3 35005005005005005004 4 4 44604604904904954955 5 5 5440440480480490490合计合计合计合计250025002500250025002500250025002500250025002500均数均数均数均数500500500500500500500500500500500500 例例:设设甲甲、乙乙、丙丙三三人人,采采每每人人的的耳耳垂垂血血,然然后后作作红红细细胞胞计计数数,每每人人数数5个个计计数数盘盘,得结果如下(万得结果如下(万/mm3)甲乙丙2024/5/242024/5/24周五周五3434常用统计指标n n全距全距(range)n n四分位数间距四分位数间距(quartile interval)n n方差和标准差方差和标准差(variance&standard deviationvariance&standard deviation)n n变异系数变异系数(CV coefficient of variation)2024/5/242024/5/24周五周五3535n n全距,用R表示:即一组变量值最大值与最小值之差,亦称极差。对于书中例8.1数据,有简单,但仅利用了两端点值,稳定性差。简单,但仅利用了两端点值,稳定性差。一、全距(一、全距(Range)R5.593.60=1.99(mol/L)R R R R越大,变异度越大;越大,变异度越大;越大,变异度越大;越大,变异度越大;R R R R越小,变异度越小。越小,变异度越小。越小,变异度越小。越小,变异度越小。2024/5/242024/5/24周五周五3636二、四分位数间距(quartilerange)四分位数间距,用四分位数间距,用Q Q表示,若将一组资表示,若将一组资料分为四等份,上四分位数和下四分位料分为四等份,上四分位数和下四分位数之差就是:数之差就是:Q=Q=下四分位数:下四分位数:上四分位数:上四分位数:比全距稳定;可用于一端或两端无确切数比全距稳定;可用于一端或两端无确切数值的偏态资料。值的偏态资料。未考虑每一个观察值。未考虑每一个观察值。2024/5/242024/5/24周五周五3737vv全距和四分位数间距都未全面考虑观察值的变异全距和四分位数间距都未全面考虑观察值的变异全距和四分位数间距都未全面考虑观察值的变异全距和四分位数间距都未全面考虑观察值的变异情况,为了克服该缺点,需计算总体中每个观察情况,为了克服该缺点,需计算总体中每个观察情况,为了克服该缺点,需计算总体中每个观察情况,为了克服该缺点,需计算总体中每个观察值值值值x x x x与总体均数与总体均数与总体均数与总体均数 的差值(的差值(的差值(的差值(x-x-x-x-),称为),称为),称为),称为离均差离均差离均差离均差。vv由于由于由于由于(x-x-x-x-)=0=0=0=0,不能反映变异的大小,而用,不能反映变异的大小,而用,不能反映变异的大小,而用,不能反映变异的大小,而用离均差平方和离均差平方和离均差平方和离均差平方和 (x-x-x-x-)2 2 2 2(sum of deviation sum of deviation sum of deviation sum of deviation from meanfrom meanfrom meanfrom mean)反映。同时还要考虑到观察值个数)反映。同时还要考虑到观察值个数)反映。同时还要考虑到观察值个数)反映。同时还要考虑到观察值个数N N N N的影响,用其均数,即得到的影响,用其均数,即得到的影响,用其均数,即得到的影响,用其均数,即得到总体的方差总体的方差总体的方差总体的方差,用,用,用,用 2 2 2 2表表表表示。示。示。示。vv公式为:公式为:公式为:公式为:三、方差与标准差2024/5/242024/5/24周五周五3838 1.方差(方差(variance)是离均差平方和的均数,反映一是离均差平方和的均数,反映一组数据的平均离散水平。组数据的平均离散水平。l由于在实际工作中,往往得到的样本资料,总体均数由于在实际工作中,往往得到的样本资料,总体均数 是未知是未知的,所以只能用样本均数的,所以只能用样本均数 作为作为 的估计值,即用的估计值,即用 代替代替 ,用样本例数,用样本例数n代替代替N。但按公式计算的结果通常。但按公式计算的结果通常比实际的比实际的 低。所以用低。所以用n来代替来代替n进行校正。得到进行校正。得到样本方差样本方差 离均差平方和SS总体方差总体方差样本方差样本方差自由度自由度自由度自由度2024/5/242024/5/24周五周五3939标准差(standard deviation)vv方差可以比较全面地反映变量值的变异情方差可以比较全面地反映变量值的变异情况,但其方差的单位是原单位的平方,故况,但其方差的单位是原单位的平方,故引入标准差的概念。引入标准差的概念。vv标准差:将方差开平方,恢复成原度量单标准差:将方差开平方,恢复成原度量单位,得到总体的标准差位,得到总体的标准差 和样本标准差和样本标准差S。2024/5/242024/5/24周五周五4040n n 样本标准差用样本标准差用表示表示,其度量单位与均数一致,其度量单位与均数一致,所以最常用。所以最常用。离均差平方和SS3.总体标准差 用表示公 式:公 式:2024/5/242024/5/24周五周五4141 n标准差的公式还可以写成:n利用频数表计算标准差的公式为:2024/5/242024/5/24周五周五4242四、变异系数n变异系数(coefficient of variation,CV)常用于比较度量单位不同度量单位不同或均数相差悬殊均数相差悬殊的两组(或多组)资料的变异程度。2024/5/242024/5/24周五周五4343例:某地例:某地7岁男孩身高的均数为岁男孩身高的均数为123.10 cm,标准差为,标准差为4.71cm;体重均数为;体重均数为22.29kg,标准差为,标准差为2.26kg,比较其变异度?比较其变异度?2024/5/242024/5/24周五周五4444小结小结:正态分布正态分布偏态分布偏态分布集中趋势集中趋势算术平均数算术平均数(几何平均数几何平均数)中位数中位数离散趋势离散趋势标准差、标准差、变异系数变异系数四分位间距四分位间距2024/5/242024/5/24周五周五4545第四节 正态分布2024/5/242024/5/24周五周五4646一、正态分布的概念和特征当当X X服从正态分布服从正态分布n n记作记作X XN N(,2 2)n n其中其中为总体均数,为总体均数,2 2为总体方差为总体方差2024/5/242024/5/24周五周五4747二、标准正态分布用N(0,1)表示,即u值的均数为0,标准差为1。标准正态变换 2024/5/242024/5/24周五周五4848 正态分布 标准正态分布2024/5/242024/5/24周五周五4949正态分布的特征正态分布的面积分布有一定的规律性,正态分布的面积分布有一定的规律性,总面积总面积=1。正态曲线(正态曲线(normal curve)在横轴上方,且均数)在横轴上方,且均数所在处最高;所在处最高;正态分布以均数为中心,左右对称;正态分布以均数为中心,左右对称;正态分布有两个参数,即均数与标准差(正态分布有两个参数,即均数与标准差(与与),标准正态分布的均数和标准差分别为),标准正态分布的均数和标准差分别为0和和1;正态曲线在正态曲线在 1,标准正态分布在,标准正态分布在 1处各有一处各有一个拐点;个拐点;2024/5/242024/5/24周五周五50502024/5/242024/5/24周五周五5151累积面积可通过对概率密度函数累积面积可通过对概率密度函数f(X)积分求得积分求得(累积)分(累积)分(累积)分(累积)分布函数:布函数:布函数:布函数:2024/5/242024/5/24周五周五5252图图2-7 正态曲线面积分布示意图正态曲线面积分布示意图 2024/5/242024/5/24周五周五5353vv参考值范围(参考值范围(reference rangesreference ranges)vv医学参考值是指正常人的各种生理、生化医学参考值是指正常人的各种生理、生化数据,组织或排泄物中各种成分的含量。数据,组织或排泄物中各种成分的含量。vv正常人测定值的波动范围,称为正常人测定值的波动范围,称为参考值范参考值范围。围。参考值范围在诊断方面可用于划分正参考值范围在诊断方面可用于划分正常或异常。常或异常。第五节 医学参考值范围2024/5/242024/5/24周五周五5454n n医学参考值范围是指正常人指标测定值的波动范围,参考值范围在诊断方面可用于划分正常或异常。一、意义一、意义正常人:排除了影响被研究指标的疾病或因素的人。2024/5/242024/5/24周五周五5555二、制定参考值的基本步骤1 1、从正常人总体中抽样;、从正常人总体中抽样;2 2控制测量误差控制测量误差 ;3 3判定是否需要分组确定参考值范围判定是否需要分组确定参考值范围 ;4.4.决定取单侧还是双侧;决定取单侧还是双侧;5.5.选定合适的百分界限选定合适的百分界限 ;6 6对资料的分布进行正态性检验对资料的分布进行正态性检验 ;7 7根据资料的分布类型选定适当的方法进行参根据资料的分布类型选定适当的方法进行参考值范围的估计。考值范围的估计。2024/5/242024/5/24周五周五56561、正态分布法、正态分布法2、百分位数法、百分位数法计算医学参考值范围的常用方法计算医学参考值范围的常用方法2024/5/242024/5/24周五周五5757公式(正态分布)公式(正态分布)双侧参考值范围双侧参考值范围:XuS:XuS单侧参考值范围:单侧参考值范围:XXuS(uS(下限值下限值)或或 XXuS(uS(上限值上限值)其中其中X X为均数,为均数,S S为标准差,为标准差,u u值可从表中查到值可从表中查到2024/5/242024/5/24周五周五5858例例 利用例利用例1某地某地5558岁健康成人的血糖岁健康成人的血糖值,求值,求95%的参考值范围。的参考值范围。n n正态分布法 x=4.653,S=0.401n n双侧95%的参考值范围:x1.96S=4.6531.96*0.401=(3.875.44)n n某地5558岁健康成人的血糖值95%的参考值范围为3.875.44(mol/L)2024/5/242024/5/24周五周五5959单侧下限单侧下限单侧上限单侧上限2024/5/242024/5/24周五周五6060小结 数值变量资料统计描述 集中趋势指标集中趋势指标集中趋势指标集中趋势指标 算术均数、几何均数、算术均数、几何均数、算术均数、几何均数、算术均数、几何均数、中位数(百分位数)中位数(百分位数)中位数(百分位数)中位数(百分位数)离散趋势指标离散趋势指标离散趋势指标离散趋势指标 极差、四分位数间距极差、四分位数间距极差、四分位数间距极差、四分位数间距 方差、标准差、方差、标准差、方差、标准差、方差、标准差、变异系数变异系数变异系数变异系数 各类指标的含义、应各类指标的含义、应各类指标的含义、应各类指标的含义、应用条件用条件用条件用条件n正态分布正态分布n正态曲线下面积分布正态曲线下面积分布规律规律n医学参考值范围估计医学参考值范围估计 2024/5/242024/5/24周五周五6161
展开阅读全文