收藏 分销(赏)

第二章定量数据的统计描述.ppt

上传人:w****g 文档编号:13179901 上传时间:2026-01-30 格式:PPT 页数:50 大小:331.04KB 下载积分:8 金币
下载 相关 举报
第二章定量数据的统计描述.ppt_第1页
第1页 / 共50页
第二章定量数据的统计描述.ppt_第2页
第2页 / 共50页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第二章定量数据的统计描述,4.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87,试编制频数分布表。,1、频数表的编制,找全距,(range),定组距,(class interval),:一般分为,1015,组,如组距约为全距,/10,写组段:,每个组段的起点称为下限,,lower limit,;,每个组段的终点称为上限,,upper limit,;,下限,X50,或 50,或,10,),资料的分布不清。,注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,,Mean=Median,中位数的优缺点,优点:,不受个别特大或特小的观察值影响;,其它平均数不宜使用时,中位数就显示出它的优越性。,缺点:,掉失了大量信息,其敏感性不够。,第二章定量数据的统计描述,中位数是一个特定的百分位数P50。,自由度:是随机变量可以“自由”取值的个数。,例:有8份血清的抗体效价为为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640。,注意:频数表资料要用weight命令,Descriptives,Frequencies,将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分布规律。,数理统计证明,如用样本的变量个数n来代替N,计算出的样本方差比实际2低,需要用n-1校正,得样本方差S2。,推而广之,任何统计量的自由度n-k,k为限制条件的个数。,其它平均数不宜使用时,中位数就显示出它的优越性。,用一组百分位数描述一组观察值的变异度,如四分位数。,应用平均数时的注意事项,Values are group midpoints:根据分组资料计算百分位数。,样本均数 (X bar)表示。,百分位数,(Percentile,,,Px),百分位数,位置指标;界值;,分布数列的百等份分割值。,有,x%,的比,Px,小,有,(100-x)%,的比,Px,大。,中位数是一个特定的百分位数,P50,。,百分位数的计算,f,X,为,P,X,所在组段的频数,,i,为该组段的组距,,L,为该组段的下限,,f,L,为小于,L,各组段的累计频数。,某传染性疾病的潜伏期(天)如下表,求其 中位数和百分位数,P,95,潜伏期,(,天,),人数,f,累计频数,f,累计频率,%,4,26,26,24.04,8,48,74,68.52,12,25,99,91.67,16,6,105,97.22,20,3,108,100.00,百分位数的应用,描述一组观察值在某百分位置上的水平。,用于确定医学正常值范围。,用一组百分位数描述一组观察值的变异度,如四分位数。,应用平均数时的注意事项,同质的变量值才能求平均数;,根据资料的分布特点,选用适应的平均数指标。,平均水平SPSS统计描述命令,Analyze Descriptive Statistics,Frequencies,Descriptives,注意:频数表资料要用,weight,命令,使用频数表资料时,SPSS,操作中应注意的事项,频数表资料要用,weight,命令;,进行数据输入时要使用组中值;并且在,Frequencies,命令中要选择,Values are group midpoints:,根据分组资料计算百分位数。,SPSS,操作求几何均数时有三种方法:,1.,是先计算对数的均数,然后求其反对数,得出几何均数;,2.,直接用,Report Case Summaries,命令;,3.,用,Compare Means,命令,但要个增加分组变量。,第三节 变异程度的统计指标,例 有,3,组同龄男孩体重(,kg,)如下,其体重均数 都是,30,(,kg,),试分析离散程度。,甲组,26 28 30 32 34,乙组,24 27 30 33 36,丙组,26 29 30 31 34,离散程度(或变异程度),指数据参差不齐的程度,反映资料的离散趋势。,将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分布规律。,一、全距(或极差,,Range,),全距=最大值 最小值,优点:简单明了,缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用极差比较分布的离散程度。,二、四分位数间距,(,inter-quartile range),百分位数:指把数据从小到大排列后处于第,X,百分位置的数值。它将全部数据分为两部分,在不包括,P,X,的全部数据中有,X%,数据小于,P,X,,有,1-X%,的数据大于,P,X,%,。中位数是一个特定的百分位数,P,50,。,四分位数:,下四分位数,P,25,;上四分位数,P,75,P,0,P,25,P,50,P,75,P,100,四分位数间距:,P,75,-P,25,或,Q,U,-Q,L,比极差稳定,但仍未考虑每个数据的大小。常和中位数结合使用描述数据的分布规律。,三、离均差平方和,(sun of square),、方差(,variance,)和标准差(,standard deviation,),平均偏差(,mean difference,),:,离均差平方和,(sun of square,SS),方差和标准差,离均差平方和,:,考虑每个观察值,但受,N,的影响。,对离均差平方和求均数,得总体方差,2,,开根号得标准差,。,一般,未知,常常用 来估计之,,数理统计证明,如用样本的变量个数,n,来代替,N,计算出的样本方差比实际,2,低,需要用,n-1,校正,得样本方差,S,2,。开根号得样本标准差,s,。,自由度,,degree of freedom,方差计算公式中的,n-1,被称为自由度,它描述了当 选定时,,n,个,X,中能自由变动的,X,(变量值)的个数。,例:某样本含有,3,个数据,要求,X=10,。则在自由确定了,2,个数据后,第,3,个数据只能是,10-(x1+x2),。即有,2,个数据可以自由变动,其自由度,=2,。,推而广之,任何统计量的自由度,n-k,,,k,为限制条件的个数。,自由度:是随机变量可以“自由”取值的个数。,总体标准差,样本标准差,标准差,standard deviation,应用于频数表资料:,标准差的计算,甲组,26 28 30 32 34,标准差,乙组,丙组,甲组:,X=26+28+30+32+34=150,X,2,=26,2,+28,2,+30,2,+32,2,+34,2,=4540,用频数表法计算标准差,见下表计算,组段,频数,f,组中值,X,f X,f X,2,2.30,1,2.45,2.45,6.00,2.60,3,2.75,8.25,22.69,2.90,6,3.05,18.30,55.82,3.20,8,3.35,26.80,89.78,3.50,17,3.65,62.05,226.48,3.80,20,3.95,79.00,312.05,4.10,17,4.25,72.25,307.06,4.40,12,4.55,54.60,248.43,4.70,9,4.85,43.65,211.70,5.00,5,5.15,25.75,132.61,5.30,2,5.45,10.90,59.41,5.605.90,1,5.75,5.75,33.06,合计,101,409.75,1705.09,标准差的用途:,反映一组观察值的离散程度;,计算变异系数;,计算标准误;,估计参考值范围。,标准差与算术均数之比,,反映了相对离散程度,常用于比较,度量衡单位不同的多组资料的变异度,均数相差悬殊的多组资料的变异度,四、,变异系数,CV,(,coefficient of variation,),
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服