收藏 分销(赏)

医学统计学第3章-定量资料的统计描述.ppt

上传人:精**** 文档编号:12626940 上传时间:2025-11-14 格式:PPT 页数:62 大小:672KB 下载积分:8 金币
下载 相关 举报
医学统计学第3章-定量资料的统计描述.ppt_第1页
第1页 / 共62页
医学统计学第3章-定量资料的统计描述.ppt_第2页
第2页 / 共62页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,表3-1 某年某市120名1岁男童乳牙数(,离散型),的频数分布,乳牙数 频数f 频率()累计频数 累计频率(),(1)(2)(3)(4)(5),0,1,2,3,4,5,6,7,8,合计,2 1.67 2 1.67,4 3.33 6 5.00,7 5.83 13 10.83,9 7.50 22 18.33,14 11.67 36 30.00,21 17.50 57 47.50,28 23.33 85 70.83,24 20.00 109 90.83,11 9.17 120 100.00,120 100.00 ,一、离散型定量资料,第一节 频数分布表和频数分布图,图3-1 某年某市120名1岁男童乳牙数的频数分布,二、连续型定量资料,例3-2,某市2000年l20名6岁女孩的身高(cm)资料(,连续型),105.4 113.2 118.7 119.0 107.0 106.8 114.2,101.2,114.9 114.1 119.5104.3 113.3 112.2 110.7 112.7 110.8 115.6 109.2 116.0 105.7 127.8 115.8 118.5 115.7 116.7 110.3 118.0 113.0 118.5 105.8 118.9 124.0 117.5 123.1 113.7 124.1 125.3 117.8 108.7,106.2103.8 122.6 104.0 126.5 116.0 117.5 110.3 120.1 113.2 123.4 112.4 115.0 128.1 110.9 125.1 114.4 110.2 112.0 116.4 108.3 110.9 120.4 108.2 121.2 112.3 121.8 117.0 111.4 117.2 113.9 116.1 114.4 118.8 116.1 108.4 114.5 109.0 116.8 110.8,119.8114.1 118.8 116.7 113.4 122.2 118.1 121.2 114.0 116.7 112.3 121.1 116.5 110.3 119.1 118.4 106.3 115.3 121.0 107.5 112.8 121.6 119.2 113.5 112.5 123.1 116.6,129.5,112.3 126.8 122.8 121.1 124.6 125.7 122.5 121.0 124.4 120.9 111.3 112.5,定组距:组距极差/组数,1、确定组数:一般在815组左右,2、确定组距(等距或不等距):,组距,极差,/组数28.3/10=2.833,3、确定各组段的上下限:,连续型资料,各组段写为半开半闭型;离散型资料,既可写成上限开口型,也可写成上限闭口型,(二)划分组段:,表3-2 某市120名6岁女孩身高频数分布,组段 划记 频数f 累计频率(),(1)(2)(3)(4),99,102,105,108,111,114,117,120,123,126,129132,合计,一 1 0.83,干 3 3.33,正干 8 10.00,正正正 15 22.50,正正正正 20 39.17,正正正正王 24 59.17,正正正王 19 75.00,正正正 15 87.50,正正 10 95.83,王 4 99.17,一 1 100.00,120 ,(三),列表划记,正偏态分布集中位置偏向于左侧,负偏态分布集中位置偏向于右侧,分布类型,对称分布,最常见的是正态分布,不对称分布:正偏态分布和负偏态分布,1,、便于发现特大和特小的可疑值;,2,、揭示资料的分布类型;,3,、可以看到频数分布的两个特征:,集中趋势 和 离散趋势,频数分布表的用途,第二节,集中趋势的描述,一、算术均数(,mean,),总体均数用表示,样本均数用 表示。,适用条件:对称分布,特别是正态分布。,(二)加权法:,计算公式,(一)直接法:,,,,,,,。,,,表3-3 某市120名6岁女孩身高(cm)均数的计算(加权法),组段,频数,f,组中值,X,fx,(,1,),(,2,),(,3,),(,4,)(,2,)(,3,),99,102,105,108,111,114,117,120,123,126,129132,合计,1 100.5100.5,3 103.5310.5,8 106.5852.0,15 109.5 1642.5,20 112.5 2250.0,24 115.5 2772.0,19 118.5 2251.5,15 121.5 1822.5,10 124.5 1245.0,4 127.5 510.0,1 130.5 130.5,120 13887,(cm),适用条件:变量值的变化呈倍数变化关,系,特别是对数对称分布、,对数,正态分布。,二、几何均数,(geometric mean,),几何均数用 G 表示。,(一)直接法:,对数形式:,几何均数,,变量值对数之和,,反对数符号,(二)加权法:,(1)偏态分布资料,变量分布规律不清,有少数特小值或特大值,变量值一端或两端无确定值。,三、中位数和百分位数,(一)中位数(median,M),适用资料:,(2)所有资料。理论上对称分布资料的算术均数,与M相等,对数对称资料宜用几何均数,n,,1.直接由原始数据计算中位数,当变量值较少时,将n个变量值从小到大排列后记为x,i,,即有 x,1,x,2,x,n,n为奇数时,,n为偶数时,,例3-6.,测定7名成年男性红细胞数(10,12,/L):3.83,4.25,4.58,4.83,5.17,5.60,5.95,例3-7.,测得某市某大学8名正常女子总胆固醇(mmol/L):2.58,3.02,3.41,3.87,,4.25,4.73,5.13,5.71,2.用频数表计算中位数,适用条件是:样本含量(n)足够大(n100),M所在组段的频率,i,M,该组段的组距,,小于该组段的各组累计频数。,L 该组段的下限,,计算,公式,:,众数:一组数据中出现的频数最多的数据,,描述集中趋势的指标。,(二)百分位数(percentile)P,X,将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为P,x,。有x的数据比,P,x,小,有(100X)的数据比,P,x,大,故百分位数是一个位置指标。,第三节,离散程度的描述,例310:,三组同性别、同年龄儿童的体重(kg)资料如下:,甲组 16 18 20 22 24,乙组 14 17 20 23 26,丙组 16 19 20 21 24,均数相同,都是20kg,然而这3组数据间参差,不齐的程度(即变异)是不相同的,适用于各种分布类型,R=极大值,极小值,极差可用于反映各种分布资料的变异程度,简单明了;缺点:只涉及最大值和最小值,不能反映组内其他数据的变异程度;样本较大时,抽样误差大,因此抽到最大值和最小值的可能性也越大,。,一、极差,(range),亦称全距,两端无确切值或分布不明确资料的离散程度。,相对比较稳定,但只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。,二、四分位数间距,(,inter-quartile range),四分位数间距Q Q,U,Q,L,。,适用条件,:各种分布类型,特别是偏态分布资料、,适用条件:对称分布资料,特别是正态分布资料(同均数)。,三、方差,(variance),四、标准差,(standard deviation),总体标准差 ,样本标准差 s,(二)加权法:,变量值平方和,变量值和的平方,(一)直接法:,总体标准差,(1)描述变量值分布的离散程度,标准差大,变量值分散,标准差小,变量值集中。,(2)概括地估计变量值的频数分布,(3)计算正常值范围,(4)计算标准误(统计推断中常用统计指标),应用:,适用于:多组资料之间变异程度的比较时,1.单位不同,2.均数相差较大,。,五,、变异系数,(,coefficient of variation),计算公式:,data,li3_2;,input x;,cards;,105.4 113.2 118.7 119.0 107.0 106.8 114.2 101.2 114.9 114.1,119.5 104.3 113.3 112.2 110.7 112.7 110.8 115.6 109.2 116.0,105.7 127.8 115.8 118.5 115.7 116.7 110.3 118.0 113.0 118.5,105.8 118.9 124.0 117.5 123.1 113.7 124.1 125.3 117.8 108.7,106.2 103.8 122.6 104.0 126.5 116.0 117.5 110.3 120.1 113.2,123.4 112.4 115.0 128.1 110.9 125.1 114.4 110.2 112.0 116.4,108.3 110.9 120.4 108.2 121.2 112.3 121.8 117.0 111.4 117.2,113.9 116.1 114.4 118.8 116.1 108.4 114.5 109.0 116.8 110.8,119.8 114.1 118.8 116.7 113.4 122.2 118.1 121.2 114.0 116.7,112.3 121.1 116.5 110.3 119.1 118.4 106.3 115.3 121.0 107.5,112.8 121.6 119.2 113.5 112.5 123.1 116.6 129.5 112.3 126.8,122.8 121.1 124.6 125.7 122.5 121.0 124.4 120.9 111.3 112.5,;,proc,univariate normal;,run;,The SAS System 10:33 Friday,September 9,2012 3,The UNIVARIATE Procedure,Variable:x,Moments,N 120 Sum Weights 120,Mean 115.756667 Sum Observations 13890.8,Std Deviation 5.94305941 Variance 35.3199552,Skewness -0.0120427 Kurtosis -0.4261725,Uncorrected SS 1612155.78 Corrected SS 4203.07467,Coeff Variation 5.13409688 Std Error Mean 0.54252462,Basic Statistical Measures,Location Variability,Mean 115.7567 Std Deviation 5.94306,Median 115.9000 Variance 35.31996,Mode 110.3000 Range 28.30000,Interquartile Range 7.85000,NOTE:The mode displayed is the smallest of 3 modes with a count of 3.,Tests for Location:Mu0=0,Test -Statistic-p Value-,Students t t 213.3667 Pr|t|=|M|=|S|.0001,Tests for Normality,Test -Statistic-p Value-,Shapiro-Wilk W 0.994312 Pr D 0.1500,Cramer-von Mises W-Sq 0.018424 Pr W-Sq 0.2500,Anderson-Darling A-Sq 0.133502 Pr A-Sq 0.2500,Quantiles(Definition 5),Quantile Estimate,100%Max 129.50,99%128.10,95%125.50,90%123.70,75%Q3 119.95,50%Median 115.90,Quantile Estimate,25%Q1 112.10,10%107.85,5%105.75,1%103.80,0%Min 101.20,Extreme Observations,-Lowest-Highest-,Value Obs Value Obs,101.2 8 126.5 45,103.8 42 126.8 110,104.0 44 127.8 22,104.3 12 128.1 54,105.4 1 129.5 108,第四节 正态分布及其应用,一、正态分布的概念和特征,正态分布(normal distribution)是一种重要的,连续型分布。在医学卫生领域中,有许多变量都,近似服从正态分布,如测量误差、许多生化指标,的值和人的身高、体重等。此外,许多分布可用,正态分布近似,如大样本偏态资料的样本均数近,似正态分布,还有些分布可由正态分布导出,因,此,正态分布可以说是最重要的一种分布。,表,3-7,某地某年,120,名,12,岁女孩身高(,cm,)的频数分布,组段,x,频数,f,频率,(,1,),(,2,),(,3,),125,1,0.01,129,4,0.03,133,9,0.08,137,28,0.23,141,35,0.29,145,27,0.23,149,11,0.09,153,4,0.03,157161,1,0.01,合计,120,1.00,频率,(a),125,129,133,137,141,145,149,153,157,161,0,1,2,3,4,身高(cm),(b),(c),图3-3 频数分布逐渐接近正态分布示意图,正态分布的概率密度函数:,正态分布具有下列特性:,(1)正态密度函数曲线在横轴上方,且曲线,在均数处最高。,(2)正态分布以均数为中心,左右对称。,(3)曲线下面积为1。,(4)正态分布的两个参数,和,分别决定分,布的位置和形状。,图3-4 不同均数,、,不同标准差,的正态分布示意图,二、正态曲线下面积的分布规律,若,x,N,(,,,),则 ,N,(0,1),(,z,)=1,(,z,),例3-17.,z1=1.50,z2=0.31,求标准正态分布曲线下(1.50,0.31)区间内面积D。,查附表1得,(1.50)=0.0668和 (0.31),=0.3783,,则面积,例3-18.,已知某地某年120名7岁女孩身高 =122.0,cm,,,s,=4.7,cm,,试估计该地7岁女孩身高介于118,cm,和124,cm,范围内的比例及120名7岁女孩介于此范围内的人数。,(z1)=(-0.8511)=0.1989,(z2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646,D=,(z1),(z2)=0.6646-0.1989=0.4657,故估计该地某年身高界于118,cm,124,cm,范围内的7岁女孩所占比例为0.4657,即46.57%。估计120名7岁女孩中身高界于118,cm,124,cm,范围内的人数为120,46.57%,56名。,三、参考值范围,参考值范围,(reference range)也称为正常值范围。医学参考值是指包括绝大多数正常人的某指标值范围,由于存在着个体差异,正常人的解剖,生理,生化等各种指标并非常数,而是在一定范围内波动,故采用医学参考值范围(medical reference range)作为判定正常和异常的参考标准。对于服从正态分布的指标,可根据正态分布的面积分布规律制定其参考值范围;对于不服从正态分布的指标,可先进行变量变换使之服从正态分布或直接利用百分位数法制定其参考值范围。,制定医学参考值范围的基本步骤,:,1.从正常人群中抽样,样本含量要足够大:所谓“正常人”并不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。,3.确定是否需要分组制定参考值范围,4.决定取双侧还是取单侧,5.选定合适的百分界限,6.对资料的分布作正态性检验,7.根据资料的分布类型选用适当的方法来估计参考值范围。,(1)正态分布法:适用于正态或近似正态分布的资料。,双侧参考值范围,单侧参考值范围上限,单侧参考值范围下限,例3-19,某地调查,156,名正常成年男子的红细胞数,资料近似正态分布,计算得均数,,,s,=0.44,1012,L,。,下限:1.96s=5.38.960.44=4.52,10,12,L,上限:1.96s=5.38+1.960.44=6.24,10,12,L,的,95%参考值范围为4.526.24(10,12,L)。,(2)百分位数法:适用于任何分布类型的资料。但常用于经过数据转换仍然不呈正态分布或分布不明的资料。,例3-20用硫酸高锰酸钾硝酸消化法和无火焰原子吸收光谱法测得某市238名正常人的发汞值,一、最佳选择题1,1.以下指标中()可用来描述定量资料的离散程度。,A.算术平均数 B.几何平均数,C.极差 D.中位数,2.偏态分布资料宜用()描述其分布的集中趋势。,A.算术平均数 B.中位数,C.四分位数间距 D.方差,3.用均数和标准差可全面描述()资料的分布特征。,A.正态分布 B.偏态分布,C.对称分布 D.任何计量资料分布,4.()可用于比较身高与体重的变异度。,A.方差 B.标准差,C.变异系数 D.全距,5.正态分布曲线下,在横轴上从均数,到+的面积占总面积的比例为()。,A.97.5 B.95 C.50,D.不能确定(与标准差的大小有关),6.准正态分布的均数与标准差分别为()。,A.0与1 B.1与0,C.1.96与2.58 D.1与1,7.各观察值均加(或减)同一个数后,()。,A.均数不变,标准差不一定变,B.均数不变,标准差变,C.均数变,标准差不变,D.均数变,标准差也变,8.各观察值同乘以一个不等于0的常数后,,()不变。,A.均数 B.标准差,C.中位数 D.变异系数,9.()分布的资料,均数等于中位数。,A.对称 B.左偏态,C.右偏态 D.对数正态,10.正态分布有两个参数,和,,()曲线的形状越扁平。,A.,越大 B.,越小,C.,越大 D.,越小,最佳选择题2,1.描述一组偏态分布资料的变异度,以()指标较好。,A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差,2.用均数和标准差可全面描述()资料的特征。,A.正偏态分布 B.负偏态分布 C.正态分布 D.对称分布,E.对数正态分布,3.各观察值均加(或减)同一数后,()。,A.均数不变,标准差变 B.均数变,标准差不变,C.两者均不变 D.两者均变 E.以上都不对,4.比较身高和体重两组数据变异度大小宜采用()。,A.变异系数 B.方差 C.全距 D.标准差 E.四分位数间距,5.偏态分布宜用()描述其分布的集中趋势。,A.算术均数 B.标准差 C.中位数 D.几何均数 E.平均值,6.各观察值均乘以同一不等于0的数后,()不变。,A.算术均数 B.标准差 C.中位数 D.几何均数 E.,变异系数,7.()分布资料,均数等于,中位数。,A.正偏态 B.负偏态 C.正态 D.偏态 E.对数正态,8.对数正态分布是一种()分布。,A.偏态 B.负偏态 C.正态,D.右偏态 E.对称,9.最小(大)组段无下(上)限的频数分布资料,可用()描,述其集中趋势。,A.均数 B.标准差 C.中位数 D.几何均数 E.四分位数间距,10.血清学滴度资料常用来表示其平均水平的指标是()。,A.算术均数 B.标准差 C.中位数 D.几何均数 E.变异系数,11.以下指标中()可用来描述定量资料的离散程度。,A.算术平均数 B.几何平均数,C.极差 D.中位数,12.偏态分布资料宜用()描述其分布的趋势。,A.算术平均数 B.中位数,C.四分位数间距 D.方差,13.用均数和标准差可全面描述()资料的分布特征。,A.正态分布 B.偏态分布,C.对称分布 D.任何计量资料分布,14.()可用于比较身高与体重的变异度。,A.方差 B.标准差,C.变异系数 D.全距,5.正态分布曲线下,在横轴上从均数,到+的面积占总面积的比例为()。,A.97.5 B.95,c.50 D.不能确定(与标准差的大小有关),16.标准正态分布的均数与标准差分别为()。,A.0与1 B.1与0,C.1.96与2.58 D.1与1,17.各观察值均加(或减)同一个数后,()。,A.均数不变,标准差不一定变 B.均数不变,标准差变,C.均数变,标准差不变 D.均数变,标准差也变,18.各观察值同乘以一个不等于0的常数后,()不变。,A.均数 B.标准差,C.中位数 D.变异系数,19.()分布的资料,均数等于中位数。,A.对称 B.左偏态,C.右偏态 D.对数正态,20.正态分布有两个参数,和,,()曲线的形状越扁平。,A.,越大 B.,越小,C.,越大 D.,越小,SAS,绘制的图像复制粘贴到,Word,中:,1.在,SAS,绘制输出图的窗口:,Edit Graph图标 选中图(黑框),copy;,2.Word 粘贴,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服