1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,SPSS,数据正态性检验解析,1,2024/11/22 周五,例:请对某大学学生的身高资料进行分析,是否符合正态分布,2,2024/11/22 周五,1.,2.,3.,3,
2、2024/11/22 周五,结果部分:,解析:,偏度,0,,尾部向右延伸,偏度,0,比正态分布的高峰更加陡峭,尖顶峰(瘦)峰度,2000,,以,Kolmogorow-Smirnov(D,检验,),为准,如果整个图逆时针转,90,度,就变成变相的直方图,也是反映分布形态的,但信息含量远大于直方图(分布及数值大小)。,以倒数第二行为例,最左边的,17,是指右边的小数点后面有,17,个数字。,17,是茎,,0001114,是,17,个树叶,最后一行主干宽度是,10,,意味上面数字得放大,10,倍,意思是有,3,个,180,3,个,181,。,&,为零碎叶子的标志。因叶子太小或太大无法在图中显示,用,
3、&,表示。,6,2024/11/22 周五,解读:,P-P,图反映了变量的实际累积概率与理论累积概率的符合程度,,Q-Q,图反映了变量的实际分布与理论分布的符合程度,两者意义相似,都可以用来考察数据资料是否服从某种分布类型。若数据服从正态分布,则数据点应与理论直线(即对角线)基本重合。,本例数据很多不在参考线上,不符合正态分布,与前,W,检验结果一致。,P-P,图,Q-Q,图,7,2024/11/22 周五,注意:,事实上,,Shapiro-Wilk,检验及,Kolmogorov-Smirnov,检验从实用性的角度,远不如图形工具进行直观判断好用。在使用这两种检验方法的时候要注意:,当样本量较
4、少的时候,检验结果不够敏感,即使数据分布有一定的偏离也不一定能检验出来;,当样本量较大的时候,检验结果又会太过敏感,只要数据稍微有一点偏离,,P,值就会,0.05,,检验结果倾向于拒绝原假设,认为数据不服从正态分布。,如果样本量足够多,即使检验结果,P0.05,,数据来自的总体也可能是服从正态分布的。,因此,在实际的应用中,往往会出现这样的情况,明明直方图显示分布很对称,但正态性检验的结果,P,值却,0.05,,拒绝原假设认为不服从正态分布。此时建议不要太刻意追求正态性检验的,P,值,一定要参考直方图、,P-P,图等图形工具来帮助判断。很多统计学方法,如,T,检验、方差分析,等,与其说要求数据
5、严格服从正态分布,不如说“数据分布不要过于偏态”更为合适。,经验法:,一般正态分布的标准差不会大于均值的,1/3,这是目测判断法,最终还是要经过检验,但如果标准差都大于均数,一般不太可能正态分布。,8,2024/11/22 周五,发现异常值!,P75,P50,P25,虽然箱式图一般用于判定数据是否存在异常值,但如果细心,上方很多离群值,数据像大的方向拖尾,结果与直方图判读一致。,按照,SPSS,默认选项,如果所有数据都在四分位点,1.5,倍盒子长度内,则线的端点为最大值和最小值,否则线长度就是,1.5,倍盒子长度(盒子长度等于四分位间距),在其外的值单独点出(,1.5,倍用圈圈表示可疑值,,3,倍用,*,表示异常值),9,2024/11/22 周五,部分案例参考精鼎数据分析联盟、医咖会,详细文章请参考相关微信公众号,10,2024/11/22 周五,