资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,(一)连续型定量变量频数表的编制:,频数,(frequency),:指对一个随机变量做重复观察,其中某变量值出现的次数。,频数分布表(,frequency distribution table,),:指用于反映变量值(或各频段)频数分布的表格。,例4-2-1某地101例3049岁骨科病人血清胆固醇值(mmolL,-1,)测定结果如下,试编制频数表。,一、定量变量的频数分布,101名,骨科病人血清胆固醇值(mmolL,-1,)测定结果,4.77,3.37,6.14,3.95,3.56,4.23,4.31,4.21,5.69,4.12,4.56,4.37,5.39,6.30,5.21,7.22,5.54,3.93,5.21,6.51,5.18,5.77,4.79,5.12,5.20,5.10,4.70,4.74,3.50,4.69,4.38,4.89,6.25,5.32,4.50,4.63,3.61,4.44,4.43,4.25,4.03,5.85,4.09,3.35,4.08,4.79,5.30,4.97,3.18,3.97,5.16,5.10,5.86,4.79,5.34,4.24,4.32,4.77,6.36,6.38,4.88,5.55,3.04,4.55,3.35,4.87,4.17,5.85,5.16,5.09,4.52,4.38,4.31,4.58,5.72,6.55,4.76,4.61,4.17,4.03,4.47,3.40,3.91,2.70,4.60,4.09,5.96,5.48,4.40,4.55,5.38,3.89,4.60,4.47,3.64,4.34,5.18,6.14,3.24,4.90,3.05,步骤:,(1)求全距(极差):R=7.22-2.70=4.52(2)定组数与组距:通常设 815个组;则,组距i=全距/组段数,一般取10个组左右,组距取整数 本例极差的1/10为0.452,取整数为0.5,mmolL,-1,(3)划组段:下限:每个组段的起点(最小值)上限:每个组段的终点(近似最大值)注:,第一个组段的起点数据必须为小于或等于最小值的整数,最后一个组段应同时写出上限和下限来。(4)绘制整理表 “下限x上限”,注:各组段的频数之和应等于总的观察例数。,两端的组段应分别包含最小值或最大值;,尽量取较整齐的数值作为组段的端点,便于对数据进行表述;,组距以相等为宜。,频率:各组的频数除以总例数 n 所得的比值。频率描述了各组频数在全体中所占的比重,各组频率之和等于100%。,累计频数:本组段的频数与以前各组段的频数相加;累计频率:每组段的累计频数除以总例数。,(三)频数分布的两个特征,集中趋势:血清总胆固醇含量向中央部分集中,,即中等含量者居多,集中在4.05.5这3个组段,,这种现象为集中趋势。,离散趋势:从中央部分到两侧的频数分布,逐渐减少,而且血清血清总胆固醇含量的值,参差不齐,最低的为2.7,最高的为7.22,,这种现象称为离散趋势。,由于同质性,所有实测值趋向同一数值的趋势称为集中趋势。,离散趋势或变异程度是指观察值之间参差不齐的程度。,频数分布,(四)频数分布的类型,对称分布型:指集中位置在正中,左右,两侧频数分布大体对称,。,偏态分布型:指集中位置偏向一侧,频数,分布不对称。,偏态分布型,正偏态分布:集中位置偏向数值小的一侧。,负偏态分布:集中位置偏向数值大的一侧,。,(五)频数表的用途,1.揭示频数分布的分布特征和分布类型,。文献中常将频数表作为,陈述资料的形式,。,2.便于进一步计算统计指标和进行统计分析处理。,3.便于发现某些特大或特小的可疑值。,平均数是医学统计中应用最为广泛、最重要的一个指标体系。用于描述一组同质计量资料的集中趋势或平均水平。,常用的平均数有算术均数,几何均数和中位数。,(一)算术均数(mean),:简称均数,总体均数用希腊字母表示,样本均数用拉丁字母 表示。1.计算方法 1)直接法:适用于样本例数n较少的资料。,其中X,1,X,2,X,n,为各变量值,n为样本例数,公式中是求和符号。,二、描述定量资料集中趋势的统计指标:平均数,2)加权法:适用于变量值较多的资料。,f,1,,f,2,f,n,分别为各组段的频数,X,1,,X,2,X,n,为各组段的组中值,组中值=(本组段下限+下组段下限)/2。,即频数多,权数大,作用也大,频数小,权数小,作用也小。,试求例4-2-1中某地101例3049岁骨科病人血清,总胆固醇含量的均数。,例4-2-2 5名17岁女中学生的肺活量(L)分别是2.45,2.87,1.98,2.56,2.33。求平均肺活量。,表4-2-2 101例3049岁骨科病人血清总胆固醇均数的计算,组段(mmolL,-1,),(1),频数,f,(2),组中值,X,(3),f,X,(4)=(2)(3),2.5,1,2.75,2.75,3.0,8,3.25,26,3.5,9,3.75,33.75,4.0,23,4.25,97.75,4.5,25,4.75,118.75,5.0,17,5.25,89.25,5.5,9,5.75,51.75,6.0,6,6.25,37.5,6.5,2,6.75,13.5,7.07.5,1,7.25,7.25,合计,101,478.25,2.,均数的两个重要特性,1)各离均差的总和等于0。(总体中各变量值X与均数之差称为离均差),或,(X )=0,2)离均差的平方和最小,即小于各观察值X与任何数a之差的平方和。,(X ),2,(Xa)2 (a ),3.均数的应用 但它最适用于,对称分布资料,,尤其是,正态分布资料,。因为这时均数位于分布的中心,最能反映资料的集中趋势。,(,二)几何均数(,geometric mean,),:,几何均数也称为倍数均数,用G表示。,适用于呈对数正态分布的资料,或呈等比关系的资料。如医学中常用的抗体滴度、血清效价等。,1.几何均数的计算方法,1)直接法:,适用于样本例数n较少的资料。将n个观察值X,1,,X,2,,X,3,X,n,的乘积开n次方,对数形式:G=lg,-1,(lgX,1,+lgX,2,+lgX,3,+lgX,n,)/n=,lg,-1,(lgX/n),例4-2-4 3人血清抗体效价分别为110,1100,11000,,求其平均效价。,3人血清抗体效价的平均效价为1100。,2)加权法:,适用于样本,例数n较多,的资料,。,X,1,,X,2,X,n,为各组段的滴度或滴度倒数。,f,1,,f,2,f,n,分别为各组段的频数。,=lg,-1,1.2041,=16.0,46例正常人血清的HBsAg滴度的几何均数为1:16,例4-2-5 测得46名正常人的血清乙型肝炎表面抗原(HbsAg)滴度如下,求其平均滴度。,滴度 18 116 132 164 1128,人数 17 15 11 3 0,2.几何均数应用的注意事项:1)几何均数常用于等比级数资料或资料呈倍数关系或对数正态分布资料。2)观察值中不能有0。3)观察值中不能同时有正值和负值。,4)同组资料,G 12,其潜伏期的平均水平约为(),A 9天 B 9.5天 C 10天 D 11天,
展开阅读全文