收藏 分销(赏)

定量数据的统计描述.ppt

上传人:w****g 文档编号:13179852 上传时间:2026-01-30 格式:PPT 页数:49 大小:355.04KB 下载积分:8 金币
下载 相关 举报
定量数据的统计描述.ppt_第1页
第1页 / 共49页
定量数据的统计描述.ppt_第2页
第2页 / 共49页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章定量数据的统计描述,优选第二章定量数据的统计描述,:希腊字母(西格马,sigma),求和符号,每个组段的起点称为下限,lower limit;,L 为该组段的下限,,甲组 26 28 30 32 34 标准差 3.,例:1,3,5,7,18 (奇数),推而广之,任何统计量的自由度n-k,k为限制条件的个数。,使用Frequencies,优选第二章定量数据的统计描述,自由度:是随机变量可以“自由”取值的个数。,均数是算术均数的简称。,数理统计证明,如用样本的变量个数n来代替N,计算出的样本方差比实际2低,需要用n-1校正,得样本方差S2。,丙组 26 29 30 31 34,指变量值围绕中心数值或中心位置的分布情况。,指数据参差不齐的程度,反映资料的离散趋势。,X=26+28+30+32+34=150,2.35,4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41,4.78 3.95 3.923.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91,3.91 4.59 4.192.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91,4.15 4.55 4.803.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84,3.60 3.51 4.063.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96,4.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87,5.71,3.30 4.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28,4.06 5.26 5.253.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25,4.15 4.36 4.953.00 3.26,试编制频数分布表。,1、频数表的编制,找全距,(range),定组距,(class interval),:一般分为,1015,组,如组距约为全距,/10,写组段:,每个组段的起点称为下限,,lower limit,;,每个组段的终点称为上限,,upper limit,;,下限,X50,或,10,),资料的分布不清。,注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,,Mean=Median,中位数的优缺点,优点:,不受个别特大或特小的观察值影响;,其它平均数不宜使用时,中位数就显示出它的优越性。,缺点:,掉失了大量信息,其敏感性不够。,百分位数,(Percentile,,,Px),百分位数,位置指标;界值;,分布数列的百等份分割值。,有,x%,的比,Px,小,有,(100-x)%,的比,Px,大。,中位数是一个特定的百分位数,P50,。,百分位数的计算,f,X,为,P,X,所在组段的频数,,i,为该组段的组距,,L,为该组段的下限,,f,L,为小于,L,各组段的累计频数。,某传染性疾病的潜伏期(天)如下表,求其 中位数和百分位数,P,95,潜伏期,(,天,),人数,f,累计频数,f,累计频率,%,4,26,26,24.04,8,48,74,68.52,12,25,99,91.67,16,6,105,97.22,20,3,108,100.00,百分位数的应用,描述一组观察值在某百分位置上的水平。,用于确定医学正常值范围。,用一组百分位数描述一组观察值的变异度,如四分位数。,应用平均数时的注意事项,同质的变量值才能求平均数;,根据资料的分布特点,选用适应的平均数指标。,平均水平SPSS统计描述命令,Analyze Descriptive Statistics,Frequencies,Descriptives,注意:频数表资料要用,weight,命令,使用频数表资料时,SPSS,操作中应注意的事项,频数表资料要用,weight,命令;,进行数据输入时要使用组中值;并且在,Frequencies,命令中要选择,Values are group midpoints:,根据分组资料计算百分位数。,优选第二章定量数据的统计描述,用于确定医学正常值范围。,第二节 集中趋势的描述,Frequencies,101名正常成年女子的血清总胆固醇均值为:,例 有3组同龄男孩体重(kg)如下,其体重均数 都是30(kg),试分析离散程度。,掉失了大量信息,其敏感性不够。,Xj 为各组的组中值。,集中趋势,central tendency,06(mmol/L),多用于观察值之间呈倍数关系,如抗体滴度,Frequencies,将各效价的倒数代入公式,得该8份血清的平均抗体效价为1:56.,使用Frequencies,总体均数用希腊字母(缪,mu)表示,SPSS,操作求几何均数时有三种方法:,1.,是先计算对数的均数,然后求其反对数,得出几何均数;,2.,直接用,Report Case Summaries,命令;,3.,用,Compare Means,命令,但要个增加分组变量。,第三节 变异程度的统计指标,例 有,3,组同龄男孩体重(,kg,)如下,其体重均数 都是,30,(,kg,),试分析离散程度。,甲组,26 28 30 32 34,乙组,24 27 30 33 36,丙组,26 29 30 31 34,离散程度(或变异程度),指数据参差不齐的程度,反映资料的离散趋势。,将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分布规律。,一、全距(或极差,,Range,),全距=最大值 最小值,优点:简单明了,缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用极差比较分布的离散程度。,二、四分位数间距,(,inter-quartile range),百分位数:指把数据从小到大排列后处于第,X,百分位置的数值。它将全部数据分为两部分,在不包括,P,X,的全部数据中有,X%,数据小于,P,X,,有,1-X%,的数据大于,P,X,%,。中位数是一个特定的百分位数,P,50,。,四分位数:,下四分位数,P,25,;上四分位数,P,75,P,0,P,25,P,50,P,75,P,100,四分位数间距:,P,75,-P,25,或,Q,U,-Q,L,比极差稳定,但仍未考虑每个数据的大小。常和中位数结合使用描述数据的分布规律。,三、离均差平方和,(sun of square),、方差(,variance,)和标准差(,standard deviation,),平均偏差(,mean difference,),:,离均差平方和,(sun of square,SS),方差和标准差,离均差平方和,:,考虑每个观察值,但受,N,的影响。,对离均差平方和求均数,得总体方差,2,,开根号得标准差,。,一般,未知,常常用 来估计之,,数理统计证明,如用样本的变量个数,n,来代替,N,计算出的样本方差比实际,2,低,需要用,n-1,校正,得样本方差,S,2,。开根号得样本标准差,s,。,自由度,,degree of freedom,方差计算公式中的,n-1,被称为自由度,它描述了当 选定时,,n,个,X,中能自由变动的,X,(变量值)的个数。,例:某样本含有,3,个数据,要求,X=10,。则在自由确定了,2,个数据后,第,3,个数据只能是,10-(x1+x2),。即有,2,个数据可以自由变动,其自由度,=2,。,推而广之,任何统计量的自由度,n-k,,,k,为限制条件的个数。,自由度:是随机变量可以“自由”取值的个数。,总体标准差,样本标准差,标准差,standard deviation,应用于频数表资料:,标准差的计算,甲组,26 28 30 32 34,标准差,3.16,乙组,24 27 30 33 36 4.74,丙组,26 29 30 31 34 2.92,甲组:,X=26+28+30+32+34=150,X,2,=26,2,+28,2,+30,2,+32,2,+34,2,=4540,用频数表法计算标准差,见下表计算,组段,频数,f,组中值,X,f X,f X,2,2.30,1,2.45,2.45,6.00,2.60,3,2.75,8.25,22.69,2.90,6,3.05,18.30,55.82,3.20,8,3.35,26.80,89.78,3.50,17,3.65,62.05,226.48,3.80,20,3.95,79.00,312.05,4.10,17,4.25,72.25,307.06,4.40,12,4.55,54.60,248.43,4.70,9,4.85,43.65,211.70,5.00,5,5.15,25.75,132.61,5.30,2,5.45,10.90,59.41,5.605.90,1,5.75,5.75,33.06,合计,101,409.75,1705.09,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服