1、在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。第第6 6章章 SPSSSPSS的非参数检验的非参数检验1 SPSS 中进行非参数检验由【Analyze(分析)】菜单中的【Nonparametric Tests(非参数检验)】菜单项导出。其中包括以下命令。Chi-square test:卡方检验。Binomial test:二项分布检验。Runs test:游程检验。1-Simple K-S test:单样本K-S检验。2 Independent Sample test:两个独立样本非
2、参数检验。K Independent Samples test:多个独立样本非参数检验。2 Related Sample test:两个相关样本非参数检验。K Related Sample test:多个相关样本非参数检验。26.1 6.1 非非参数检验概参数检验概述述6.1.1 非参数检验的提出 非参数检验是不依赖总体分布的统计推断方法。它是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数假设检验方法少得多,也容易满足,适用于计量信息较弱的资料且计算方法也简便易行,所以在实际中有广泛的
3、应用。36.1.2 6.1.2 非非参数检验参数检验的特点的特点 和参数方法相比,非参数检验方法的优势如下:(1)稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。(2)对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。(3)适用于小样本、无分布样本、数据污染样本、混杂样本等。4表6-1 参数检验和非参数检验的效率比较应 用参数检验非参数检验对正态总体的非参数检验的效率评价配对样本数据两个独立样本多个独立样本相关随机性t检验或者z检验t检验或者z检验方差分析(F检验)线性相关无可用的参数检验符
4、号检验Wilcoxon检验Wilcoxon检验K-W检验秩相关检验游程检验0.630.950.950.950.91没有可比较的基础56.2 SPSS6.2 SPSS在卡方在卡方检验检验中的中的应应用用1.使用目的 卡方检验(Chi-Squar Test)也称为卡方拟合优度检验,是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。2.基本原理 进行卡方检验时,首先提出零假设:样本X来自的总体分布服从期望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它
5、描述了观察值和理论值之间的偏离程度。3.软件使用方法 SPSS会自动计算出2统计量及对应的相伴概率P值。66.2.2 6.2.2 卡方卡方检验检验的的SPSSSPSS操作操作详详解解Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令,弹出【Chi-Square Test(卡方检验)】对话框。7Step02:选择检验变量 在【Chi-Square Test(卡方检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Vari
6、able List(检验变量列表)】列表框中,表示需要进行进行卡方检验的变量。Step03:确定检验范围 在【Expected Range(期望全距)】选项组中可以确定检验值的范围,对应有两个单选项。Step04:选择期望值 在【Expected Values(期望值)】选项组中可以指定期望值,对应有两个单选项。8Step05:选择计算精确概率 单击【Exact】按钮,弹出【Exact Tests(精确检验)】对话框,该对话框用于选择计算概率P值的方法。9Step06:其他选项选择 单击【Options】按钮,弹出【Options(选项)】对话框,该对话框用于指定输出内容和关于缺失值的处理方法
7、.Step07单击【OK】按钮,结束操作,SPSS软件自动输出结果。106.2.3 6.2.3 实实例例图图文分析:人文分析:人员结构员结构的的调动调动1.实例内容 某公司经营多年,形成了一套成熟的企业文化和管理体系,例如根据多年的运营经验,经理层、监察员、办事员三种职务类别人员比例大约在15:5:80为宜,这样运行效率最高。目前公司进行人事调整,公司人员结构发生变动,有员工担心是否人事调整已经导致职务类型比例的失调。请利用数据文件6-1.sav来解决该问题。三种职务的期望构成比为15、5和80。而目前样本中观察到的三种职务的人数比为84:27:363,构成比分别是17.7、5.7和76.6,
8、和理论值有差异。那么这种差异是由随机误差造成的,还是真的构成比和以前有所变化?该问题就可以用2检验来实现。相应的假设检验如下。H0:目前三个职业的总体构成比仍然是15、5和80。H1:目前三个职业的总体构成比不再是15、5和80。112.2.实实例操作例操作Step01:打开对话框 打开数据文件6-1.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令,弹出【Chi-Square Test(卡方检验)】对话框。其中,“jobcat”变量表示职业类型,“1”表示办
9、事员,“2”表示监察员,“3”表示经理。Step02:选择检验变量 在左侧的候选变量列表框中选择“jobcat”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。12Step03:选择期望值 在【Expected Values(期望值)】选项组中点选【Values】单选钮,以指定期望概率值。接着在Values的文本框中分别输入0.8、0.05和0.15这三个数值,并且单击【Add】按钮加以确定。Step04:完成操作 最后,单击【OK(确定)】按钮,操作完成。133 3 实实例例结结果及分析果及分析 SPSS的结果报告中列出了期望频数和实际频数。显然
10、残差值越小,说明实际频数与期望频数越接近。Observed NExpected NResidualClerical363379.2-16.2Custodial2723.73.3Manager8471.112.9Total474(1)频数表14(2)卡方检验表 具体包括 统计量(Chi-Square)、自由度(df)和近似概率P值(Asymp.Sig.)。可见,统计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍然是15、5和80,人数的调动只是随机误差造成的,公司人员结构没有显著性改变。Employment Cate
11、goryChi-Square3.492adf2Asymp.Sig.174156.3 SPSS6.3 SPSS在二在二项项分布分布检验检验中的中的应应用用6.3.1 二项分布检验的基本原理1.方法概述事件要服从二项分布,则应该具备下列基本的条件。(1)各观察单位只能具有相互对立的一种结果。(2)已知发生某一结果(阳性)的概率为,其对立结果的概率为1-。(3)n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。162.软件使用方法 SPSS二项分布检验过程是推断总体的分布是否等于指定的某个二项分布。其假设检验过程如下。H0:样本来自的总
12、体与某个指定的二项分布无显著性差异。H1:样本来自的总体与某个指定的二项分布有显著性差异。SPSS会自动计算出二项分布检验相应的检验统计量及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为总体与某个指定的二项分布有显著性差异;相反的,如果概率P值大于显著性水平,则接受零假设。需要注意的是,二项分布检验过程要求变量必须是数值型的二元变量(只取两个可能值的变量)。假如变量是字符型的,可以使用重编码功能将其转化为数值型变量;假如变量不是二元变量,需要设置断点将数据分为两个部分,将大于断点值的归为一组,其余归为另一组。176.3.2 6.3.2 二二项项分布分布检验检验的
13、的SPSSSPSS操作操作详详解解 Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令,弹出【Binomial Test(二项式检验)】对话框。18Step02:选择检验变量 在【Binomial Test(二项式检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行进行二项分布检验的变量。Step03:定义二元变量 在【Define Dichotomy(定
14、义二分法)】选项组中可以定义二元变量。Step04:指定检验概率值 在【Test Proportion(检验比例)】选项组中可以指定二项分布的检验概率值。系统默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。如果所要检验的二项分布不是同概率分布,参数框中要键入第一组变量所对应的检验概率值。19Step05:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。206.3.3 6.3.3 实实例例图图文分析:灯泡是否
15、合格文分析:灯泡是否合格1.1.实实例例内内容容 某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求,其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候,该厂的这种产品合格品率为95,为检验产品质量,今从新生产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数据资料,试根据这些样品数据检验该批产品的合格率是否等于95。1070 1073 958 958 975 969 1079 964 968 947962 970 1054 987 967 969 967 1001 994 9931084 1012 985 994 964 952 951 987 963 957212.2.实实例操作例
16、操作Step01:打开对话框 打开数据文件6-2.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令,弹出【Binomial Test(二项式检验)】对话框。22Step02:选择检验变量 在左侧的候选变量列表框中选择“time”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。23Step03:定义二元变量 在【Define Dichotomy(定义二分法)】选项组中点选 【Cut point(割点)】,以指定断点。接
17、着在其文本框中输入“960”,表示以它作为分界点将原始样本分为两组。Step04:指定检验概率值 在【Test Proportion(检验比例)】文本框中输入指定概率值“0.05”。24Step05:描述性统计量输出 单击【Options】按钮,弹出【Options(选项)】对话框。在【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。再单击【Continue】按钮,返回【Binomial Test(二项式检验)】对话框。25Step06:完成操作 最后,单击【OK(确定)】按钮,操作完成。263.3
18、.实实例例结结果及分析果及分析(1)基本统计量 SPSS首先输出了样本的描述性统计量表。这里共选择了30个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13小时,标准差等于40.968小时,灯泡寿命最小值等于947小时,寿命最大值等于1084小时。同时其25、50和75分位点等于 962.75、969.50和996.75小时。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th灯泡寿命30989.1340.9689471084962.75969.50995.7527(2)二项分布检验表 首先根据断点“960”将原
19、始数据划分为两部分:“Group 1”和“Group 2”,它们各自的样本容量等于6和24,所占总体的比例为20和80。由于这里要检验合格率是否等于95,也就是要检验“Group 1”组所占比例是否等于0.05。但根据单尾概率P值(0.003)小于显著性水平 (0.05),可以判断这批样本的合格率不等于95,即这批产品没有合格。CategoryNObserved Prop.Test Prop.Asymp.Sig.(1-tailed)灯泡寿命Group 1 96024.80Total301.00286.4 SPSS6.4 SPSS在游程在游程检验检验中的中的应应用用6.4.1 游程检验的基本原理
20、1.方法概述 游程检验是一种利用游程数所作的单样本随机性的检验方法,它可以用来判断观察值的顺序是否为随机。许多统计模型的假设中都要求观察值都是独立的,也就是说,收集到的数据样本的顺序是不相关的。如果样本顺序影响到统计结果,那么样本就可能不是随机的,这将使研究者不能得出关于抽样总体的准确结论。因此,研究者可以使用游程检验来检验数据的随机性。292.基本原理 游程检验可用来检验任何序列的随机性,而不管这个序列是怎样产生的;此外还可用来判断两个总体的分布是否相同,从而检验出它们的位置中心有无显著差异。3.软件使用方法 SPSS中利用游程数构造Z统计量,利用Z统计量的分布来检验序列是否具有随机性。软件
21、将自动计算出Z统计量的取值及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为变量不具有随机性;相反的,如果概率P值大于显著性水平,则认为变量出现是随机的。306.4.2 6.4.2 游程游程检验检验的的SPSSSPSS操作操作详详解解Step01:打开对话框 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs(游程)】命令,弹出【Runs Test(游程检验)】对话框。31Step02:选择检验变量 在【Runs Test(游程检验)】对话框左侧的候选变量列表框中选
22、择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行游程检验的变量。Step03:确定断点 在【Cut point(割点)】选项组中指定计算游程数的分界值。小于分界值的观察值归为一组,其余的归为另一组,然后计算游程数。32Step04:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中的相应按钮相同的。Step05:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。336.4.3 6.4.3 实实例例图图文分析:企
23、文分析:企业业盈亏盈亏预测预测1.实例内容实例内容 已知某企业在过去20年的盈亏情况为“0 0 0 0 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1”。其中“0”表示亏损,“1”表示盈利。现根据财务统计预测今年该企业盈利,请问这个结果对企业明年的经营状况有无影响?2.实例操作实例操作 根据过去20年的经营情况看到该企业的盈亏情况经常逐年发生变化。已知今年企业盈利,要判断明年企业的盈亏状态,其实就是要分析今年企业的盈利是否会对明年它的盈亏带来一定的影响。也就是说,要判断不同年份之间的盈亏情况有无影响性,即盈亏情况是否是随机的。这样就可以通过游程检验来分析历史数据。如果历史数据是
24、随机的,说明今年的盈利不会对明年企业的生产产生影响;反之,表明今年的盈利会对明年生产有影响。所以采用SPSS具体操作步骤如下。34Step01:打开对话框 打开数据文件6-3.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs Test(游程检验)】命令,弹出【Runs Test(游程检验)】对话框。其中“x”变量表示企业盈亏状态,“0”表示亏损,“1”表示盈利。35Step02:选择检验变量 在候选变量列表框中选择“x”变量作为检验变量,将其添加至【Test Variable List
25、(检验变量列表)】列表框中。Step03:确定断点 在【Cut point(割点)】选项组中取消勾选【Median(中位数)】复选框,勾选【Mean(均值)】复选框。36Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。373.3.实实例例结结果及分析果及分析 首先“Test Value0.65”表示游程检验以0.65作为断点将原始数据分为两组。在过去20年中,企业亏损的年份数共有7年,而在剩下的13年里该企业都是盈利的。整个历史数据的游程数等于4。接着计算游程检验的Z统计量等于-2.843,相伴概率P值0.004显然小于显著性水平0.05。所以,认为企业盈亏历史数据并不是随机的
26、,其中有一定的规律性。因此,今年企业的盈利会对明年企业的经营状况产生显著影响。盈亏Test Valuea.65Cases=Test Value13Total Cases20Number of Runs4Z-2.843Asymp.Sig.(2-tailed).004386.4.4 6.4.4 实实例例进阶进阶分析:工分析:工业业和商和商业业企企业业的的负债负债水平水平1.实实例例内内容容 在我国的工业和商业企业中随机抽取22家企业进行资产负债率行业差异分析,其1999年底的资产负债率()如下,请问两个行业的负债水平是否有显著性差异?工业企业647655825982707561647383商业企业
27、77808065939184918486392.2.实实例操作例操作 要检验工业和商业企业的负债水平是否有差异,可以将两组数据混合起来,同时用“1”表示数据来自工业企业,“2”表示数据来自商业企业。接着将这些序列按照升序或降序重新排列。这样可以得到由1和2构成的数列,如1221122。如果两个行业的负债水平没有差异,它们的资产负债率按大小应该是随机混合排列的,则构成的这组数列应该是随机的;否则说明工业和商业企业的负债水平有一定的规律性,即两个行业有一定的差异性。40SPSS具体操作步骤 Step01:打开数据文件6-4.sav,其中“fzl”变量表示企业的资产负债率;“indicate”变量表
28、示企业类型,“1”表示工业企业,“2”表示商业企业。Step02:选择菜单栏中的【Data(数据)】【Sort Cases(排序个案)】命令,弹出【Sort Cases(排序个案)】对话框。在候选变量列表框中选择变量“fzl”,添加至【Sort by(排序依据)】列表框中。这步的目的就是要按照企业负债率的高低对“indicate”变量重新排序。41Step03:接着利用游程检验分析“indicate”变量的随机性。选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs Test(游程检验)】命令,弹
29、出【Runs Test(游程检验)】对话框。在候选变量列表框中选择“indicate”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。Step04:在【Cut point(割点)】选项组中取消勾选系统默认的【Median(中位数)】复选框,勾选【Mean(均值)】复选框。Step05:单击【Runs Test(游程检验)】对话框中的【OK】按钮,完成操作。423.3.实实例例结结果及分析果及分析 根据第二步操作,数据文件6-5.sav的“indicate”变量进行了重新排列,形成了序列:1 1 1 1 1 2 1 1 1 1 2 2 2 1 1 1
30、 2 2 2 2 2 2 这个序列是按照资产负债率的高低将企业类型“indicate”进行重新排列得到的。下面表6-9是这组序列的游程检验结果。游程检验的Z统计量值等于-2.384,概率P值0.017小于显著性水平0.05,说明这组数据不是随机序列,数据的排序呈现一定的规律性。因此,工业企业和商业企业的负债水平有显著性差异。43indicateTest Valuea1.45Cases=Test Value10Total Cases22Number of Runs6Z-2.384Asymp.Sig.(2-tailed).017446.5 SPSS6.5 SPSS在在单样单样本本K-SK-S检验检
31、验中的中的应应用用6.5.1 单样本K-S检验的基本原理1.方法概述 K-S检验是以两位前苏联数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的,是一种拟和优度的非参数检验方法。单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,一般来说它是比卡方检验更精确的非参数检验法。452.基本原理基本原理 K-S检验的理论分布可以为正态分布、均匀分布、指数分布和泊松分布等。其零假设是:样本来自的总体与指定的理论分布无显著差异。它的基本思想是:根据样本数据和用户的指定构造出理论分布,查分布表得到相应的理论累计概率分布函数F0(x);利用样本数据计算各样本数据点的累计概率,得
32、到经验累计概率分布函数S0(x);计算S0(x)和F0(x)在相同变量值点x上的差D(x),得到差值序列D。单样本K-S检验主要对差值D序列进行研究。3.软件使用方法软件使用方法 SPSS将自动计算K-S检验中的Z统计量,依据K-S分布表(小样本)或正态分布表(大样本)给出相应的相伴概率P值。如果P值小于或等于用户指定的显著性水平,则拒绝原假设H0;反之,不能拒绝H0,可以认为样本来自的总体与指定的分布无显著差异。466.5.2 6.5.2 单样单样本本K-SK-S检验检验的的SPSSSPSS操作操作详详解解Step01:打开对话框 选择菜单栏中的【Analyze(分析)】【Nonparame
33、tric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【1-samples K-S(1样本K-S(1)】命令,弹出【One-Sample K-S Test(单样本K-S检验)】对话框,这是K-S检验的主操作窗口。47Step02:选择检验变量 在【One-Sample Kolmogorov-Smirnov Test(单样本K-S检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行K-S检验的变量。Step03:选择待检验理论分布 在【Test Distribution(检验分布
34、)】选项组中,用户需要选择待检验的理论分布。系统提供了四种统计中常见的分布。48Step04:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中相关按钮是相同的。Step05:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。496.5.3 6.5.3 实实例分析:商品例分析:商品销销售收益的分布售收益的分布1.1.实例内容实例内容 零售商希望了解某商品销售收益(零售商希望了解某商品销售收益(Revenue)的大致分布)的大致分布情况。依据其他销售商已有的资料,他认为
35、其销售收益情况。依据其他销售商已有的资料,他认为其销售收益可能服从正态分布。为了检验其假设,考虑是否与其他可能服从正态分布。为了检验其假设,考虑是否与其他零售商一样,销售收益服从正态分布,收集到相关的销零售商一样,销售收益服从正态分布,收集到相关的销售收益数据,请使用售收益数据,请使用SPSS软件分析样本数据是否服从正软件分析样本数据是否服从正态分布。态分布。502.2.实实例操作例操作 本案例的目的就是要检验文件6-5.sav中的“revenue”变量是否服从正态部分,因此可以采用非参数K-S检验来判断。首先,通过描述性统计功能绘制了“revenue”变量的直方图及其拟合的正态曲线,具体见图
36、6-19。从图形特征看到,“revenue”变量的分布非常接近正态分布,但需要采用K-S检验来诊断。51Step01:打开对话框 打开数据文件6-4.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【1-samples K-S(1样本K-S(1)】命令,弹出如下图所示的对话框。52Step02:选择检验变量 在候选变量列表框中选择“revenue”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。提示:可以在【Test Distribution(检验分
37、布)】选项组中选择检验分布类型;系统默认为正态分布。53Step03:确定断点单击【Options】按钮,在弹出的对话框的【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。单击【Continue】按钮返回主对话框。54Step04:完成操作 最后,单击【OK(确定)】按钮,操作完成。553.3.实实例例结结果及分析果及分析(1)描述性统计量输出 SPSS首先给出了“revenue”变量的基本统计量。样本总数N等于1488,收益均值等于$2,516.58,收益标准差等于$994.586,收益最小值和最
38、大值分别是$13和$6,213,收益25、50和75的分位数是$1,830.96、$2,490.68和$3,183.54。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75thRevenue1488$2,516.58$994.586$13$6,213$1,830.96$2,490.68$3,183.5456(2)K-S检验结果表给出了原假设:销售收益服从均值为2516.58、标准差为994.586的正态分布。给出了K-S检验关键结果:实际分布和检验分布之间的正向最大频数差为0.019,负向最大频数差为-0.010,因此用于
39、计算统计量的绝对值最大频数差为0.019。随后的K-S统计量Z值等于0.75,相应的概率P值为0.627,大于显著性水平0.05。所以接受零假设,认为该厂商的销售收益服从正态分布。RevenueN1488Normal ParametersaMean$2,516.58Std.Deviation$994.586Most Extreme DifferencesAbsolute0.019Positive0.019Negative-0.010Kolmogorov-Smirnov Z0.750Asymp.Sig.(2-tailed)0.627572024/3/11 周一58P-P图 除了采用上述非参数K-
40、S检验来判断单样本的分布外,还可以利用P-P图和Q-Q图直观判别样本的分布。选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述统计)】【P-P Plots(P-P图)】命令,即可生成P-P图。596.6 6.6 SPSSSPSS在在两独两独立立样样本非本非参数检验参数检验中的中的应应用用6.6.1 两独立样本非参数检验的方法原理1.方法概述 两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过分析样本数据,推断样本来自的两个独立总体的分布是否存在显著差异。这种检验方法一般通过独立总体的均值或中位数是否存在显著差异来推断。关于样本之间是否独立,主要
41、看在一个总体中抽取样本对在另一个总体中抽取样本有无影响。如果没有影响,则可以认为这两个总体是独立的。2.基本原理 SPSS提供了四种相关的非参数检验方法:曼-惠特尼U检验、K-S检验、极端反应检验、游程检验。606.6.2 6.6.2 两独两独立立样样本非本非参数检参数检验验的的SPSSSPSS操作操作详详解解Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【2 Independent Samples(2个独立样本)】命令,弹出【Two-Independent-Samples
42、Tests(两个独立样本检验)】对话框。61Step02:选择检验变量 在【Two-Independent-Samples Tests(两个独立样本检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,这里表示需要进行两独立样本检验的变量。Step03:选择分组变量 在【Two-Independent-Samples Tests(两个独立样本检验)】对话框左侧的候选变量中选择分组变量,将其添加至【Grouping Variable(s)(分组变量)】文本框中,目的是要区分检验变量的不同组别。单击【Grouping V
43、ariables】按钮,在弹出的对话框的【Group1(组1)】和【Group2(组2)】文本框中分别输入整数值,这两个值确定的分组将选择的检验变量的观测值分为两组或者分成两个样本,并将检验变量的其他数值排除在检验分析之外。设置完成后,单击【Continue】按钮,返回主对话框。62Step04:选择检验方法 在【Test Type(检验类型)】选项组中,用户需要选择两独立样本检验的方法。系统提供了四种常用方法:Mann-Whitney U(曼-惠特尼U检验)、Kolmogorov-Smirnov Z(K-S检验)、Moses Extreme Reactions(极端反应检验)和Wald-Wo
44、lfwitz Runs(游程检验)。63Step05:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。646.6.3 6.6.3 实实例例图图文分析:日本和文分析:日本和美美国国公司的市盈率公司的市盈率1.实实例例内内容容 一个公司的市盈率是指这家公司股票的当前价格除以最近12个月的每股收益。下表列出了10家日本公司和12家美国公司的市盈率,这两个国家公司的市盈率之间是否存在显著差异?日本美国公司市盈率公司市盈率Sumit
45、omo Corp.KindenHeiwaNCP JapanSuzuki MotorFuji BankSumitomo ChemicalSeibu RailwayShiseidoTodo Gas153211812531213646663368GannetMotorolaSchlumbergerOracle SystemsGapWinn-DixieIngersoll-RandAmerican Electric PowerHerculesTimes MirrorWellPoint HealthNorthern States Power192424432214211421381514652.2.实实例
46、操作例操作 本案例的目的就是要检验日本和美国公司的市盈率是否有显著差异。由于这里样本量较少,难以确定这两个总体的分布,因此可以引入非参数的检验方法。由于讨论的两个样本相互独立,故引入两独立样本非参数检验方法。于是建立如下假设检验。H0:日本公司和美国公司的市盈率没有显著差异。H1:日本公司和美国公司的市盈率存在显著差异。主要是比较日本和美国公司的平均市盈率是否相同,所以采用曼-惠特尼U检验方法。66Step01:打开对话框 打开数据文件6-6.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【2
47、 Independent Samples(2个独立样本)】命令,弹出如下图所示的对话框。67Step02:选择检验变量 在左侧的候选变量列表框中选择“PE”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。Step03:选择分组变量 选择分组变量x,将其添加至【Grouping Variable(s)(分组变量)】文本框中。68Step04:确定分组标号 单击【Grouping Variables】按钮,弹出相应对话框,在【Group1(组1)】文本框中输入“1”,在【Group2(组2)】文本框中输入“2”,分别表示分组的标号。输入完成后,单击【C
48、ontinue】按钮返回主对话框。69Step05:完成操作 最后,单击【OK(确定)】按钮,操作完成。703.3.实实例例结结果及分析果及分析(1)描述性统计量 NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th市盈率2275.5000141.6019714.00666.0018.750024.000065.0000国家221.5455.509651.002.001.00002.00002.0000713.3.实实例例结结果及分析果及分析(2)曼-惠特尼U检验的秩统计表 国家NMean RankSum of Rank
49、s市盈率日本1015.70157.00美国128.0096.00Total22723.3.实实例例结结果及分析果及分析(3)曼-惠特尼U检验结果表 市盈率Mann-Whitney U18.000Wilcoxon W96.000Z-2.776Asymp.Sig.(2-tailed)0.005Exact Sig.2*(1-tailed Sig.)0.004a736.7 SPSS6.7 SPSS在多在多独独立立样样本本非非参数检验参数检验中的中的应应用用6.7.1 多独立样本非参数检验的基本原理多独立样本非参数检验的基本原理1.方法概述方法概述 多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的分布是否存在显著差异。这里样本间的独立是指在一个总体中抽取样本对在其他总体中抽取样本无影响。2.基本原理基本原理 SPSS提供的多独立样本非参数检验的方法主要包括:Kruskal-Wallis H检验、中位数检验(Median检验、Joneckheere-Terpstra检验。746.7.2 6.7.2 多多独独立立样样本非本非参数检验参数检验的的SPSSSPSS操作操作详详解解Step01:打开对话框 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【K Independent