资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,GB/T4883 正态样本离群值的判断和处理,离群值outlier,样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。,注:离群值按显著性的程度分为歧离值和统计离群值。,别名:可疑值、异常值,离群值的判断,1,第一章 格拉布斯(Grubbs)检验法,第一节 上侧离群值的判断,1、将样本数据排列成次序统计量,2、计算样本均值,3、计算样本标准差,4、计算Grubbs上统计量G,n,5、当G,n,大于临界值,判定x,(n),为离群值;否则判未发现离群值。若发现了离群值,去掉,一个,离群值后,进入下一轮的检验,直到未发现离群值为止。,2,对某种砖的抗压强度测试10个样品,其数据经排列后为(单位:MPa):,4.7,5.4,6.0,6.5,7.3,7.7,8.2,9.0,10.1,14.0,经验表明这种砖的抗压强度服从正态分布,检查这些数据中是否存在上侧离群值。,本例中,样本量n=10,计算得:,3,确定检出水平,在附录A表A2中查出临界值2.176,因,判定14.0为离群值。,仅有一个歧离值。,样本均值、样本标准差和Grubbs统计量的保留位数至少要比原始数据多一位;即原始数据的修约间隔为10,n,、10,-n,时,样本均值、样本标准差和Grubbs统计量的修约间隔为10,n+1,、10,-n-1,。(n为正整数和零)。比原始数据多几位,要在相关的文件中作出明确规定。,4,第二节 下侧离群值的判断,1、将样本数据排列成次序统计量,2、计算样本均值,3、计算样本标准差,4、计算Grubbs下统计量G,n,当G,n,大于临界值,判定x,(1),为离群值;否则判未发现离群值。若发现了离群值,去掉,一个,离群值后,进入下一轮的检验,直到未发现离群值为止。,5,第三节 双侧离群值的判断,1、将样本数据排列成次序统计量,2、计算样本均值,3、计算样本标准差,4、同时计算Grubbs上下统计量G,n、,G,n,;,5、判断,当G,n,G,n,且G,n,大于临界值,G,n,不大于临界值,判定x,(n),为离群值;去掉x,(n),后进入下一轮的检验。,当G,n,G,n,且G,n,大于临界值,G,n,不大于临界值,,判定x,(1),为离群值;去掉x,(1),去后进入下一轮的检验。,6,当G,n,G,n,且G,n,大于临界值,判定x,(1),与x,(n),两个均为离群值;去掉x,(1),和x,(n),后进入下一轮的检验。,当G,n,G,n,且G,n,大于临界值,判定x,(1),与x,(n),两个均为离群值;去掉x,(1),和x,(n),后进入下一轮的检验。,当G,n,=G,n,,且G,n,大于临界值时,判定x,(1),与x,(n),两个均为离群值;去掉x,(1),和x,(n),后进入下一轮的检验。,否则判未发现离群值。,7,第二章 狄克逊(Dixon)检验法(2nD,n,且D,n,大于临界值,D,n,不大于临界值,判定x,(n),为离群值;去掉x,(n),后进入下一轮的检验。,当,D,n,D,n,且,D,n,大于临界值,D,n,不大于临界值,,判定x,(1),为离群值;去掉x,(1),去后进入下一轮的检验。,10,当,D,n,D,n,且,D,n,大于临界值,判定x,(1),与x,(n),两个均为离群值;去掉x,(1),和x,(n),后进入下一轮的检验。,当,D,n,D,n,且,D,n,大于临界值,判定x,(1),与x,(n),两个均为离群值;去掉x,(1),和x,(n),后进入下一轮的检验。,当,D,n,=,D,n,,,且,D,n,大于临界值时,判定x,(1),与x,(n),两个均为离群值;去掉x,(1),和x,(n),后进入下一轮的检验。,否则判未发现离群值。,11,第三章 偏度一峰度检验法,第一节 上侧离群值的判断,1、将样本数据排列成次序统计量,2、计算偏度统计量b,s,3、用 统计量b,s,与临界值相比较,当b,s,大于临界值,判定x,(n),为离群值,否则未发现离群值;若发现了离群值,剔除,一个,离群值后,进入下一轮的检验,直到未发现离群值为止。,12,第二节 下侧离群值的判断,1、将样本数据排列成次序统计量,2、计算偏度统计量b,s,3、用 统计量-b,s,与临界值相比较,当-b,s,大于临界值,x判定x,(1),为离群值,否则未发现离群值;若发现了离群值,剔除,一个,离群值后,进入下一轮的检验,直到未发现离群值为止。,13,第三节 双侧离群值的判断,1、将样本数据排列成次序统计量,2、计算峰度统计量b,k,3、用 统计量b,k,与临界值相比较,当b,k,大于临界值,判定离均值最远的观测值为离群值;否则判未发现离群值;若发现了离群值,去掉,一个,离群值后,进入下一轮的检验,直到未发现离群值为止。,14,当x,(n),与均值的距离等于x,(1),与均值的距离,同时去掉x,(n),和x,(1),,进入下一轮的检验。,15,第四章 三种方法的选择:,一、限定检出离群值的个数不超过1时,A、n30,正态概率纸上线性好,使用偏度-峰度检验法,C、,n30,正态概率纸上线性不好,使用Grubbs检验法,二、限定检出离群值的个数可以超过1时,A、n30,正态概率纸上线性好,使用偏度-峰度检验法,C、,n30,正态概率纸上线性不好,使用Grubbs检验法,16,正态概率纸,横坐标x,(i),纵坐标(i-3/8)/(n+1/4),17,A、n31,限定检出离群值的个数不超过1时,使用Grubbs检验法,B、n30,正态概率纸上线性好,使用偏度-峰度检验法,D、n30,正态概率纸上线性不好,使用Grubbs检验法,18,练习1:,A、n30,限定检出离群值的个数可以超过1时,正态概率纸上线性好,使用 检验法。,B、n30,限定检出离群值的个数不可以超过1时,正态概率纸上线性好,使用检验法,C、n30,限定检出离群值的个数可以超过1时,正态概率纸上线性不好,使用 检验法,D、n30,限定检出离群值的个数不可以超过1时,正态概率纸上线性不好,使用 检验法,E、n31,限定检出离群值的个数可以超过1时,使用 检验法。,F、n31,限定检出离群值的个数不可以超过1时,使用 检验法。,19,练习1:,A、Grubbs检验法的上统计量是。,B、Grubbs检验法的下统计量是。,C、偏度-峰度检验法中的偏度统计量是。,D、当n=9时,Dixon检验法的上统计量是。,E、当n=9时,Dixon检验法的下统计量是。,20,第五章 假设检验的原理,21,
展开阅读全文