第三节---非参数假设检验.ppt

资源描述

第三节非参数假设检验.我们已讨论的假设检验是建立在假定样本来自的总体是正态分布的。当没有这个假定或不成立时，这些检验的结论就可能被质疑。为了解决该问题，统计学家发展了无需上述假定的非参数检验。.一、非参数假设检验1.定义：它泛指参数假设检验以外的各种检验。2.特点:(1)非参数检验不依赖于总体分布。(2)非参数假设检验适用于较低的计量水平，如等级、顺序的计量等。(3)常常用于参数以外的检验，如随机变量是否服从某种规律、某种分布的拟合优度检验，数据是否随机的游程检验等。.1.如何探讨数据规律（一）分类数据的拟合优度检验（一）分类数据的拟合优度检验显示数据规律性的方法：频数分布表，能否了解数据来自某一分布或与某一理论分布相一致的程度如何？直方图和统计量的检测可能给出了一些探索性的假设。然而，这些应该用一些较为正规的方式来加以论证。拟合优度检验给出了统计意义上的证据来检验有关分布的假设。最为通用的拟合优度检验是卡方检验卡方检验。.拟合优度的卡方检验的假设为：抽样数据来自于一个特殊的分布（如正态分布）：抽样数据不是来自于这个特殊的分布.2.利用进行拟合优度检验的步骤：第一步：先将观测到的数据分类，假设分成m类，每类中的频数为第二步：根据观测结果似乎服从某一理论分布的规律，需要进一步检验。按照理论分布，各类的频数应为：根据理论分布，观测发生在第i类的概率。第三步：计算统计量.如果理论分布的参数是预先给定的（已知的），则统计量服从自由度为m-1的分布。若理论分布的参数是未知的，需要用样本观测值来估计时，统计量服从自由度为m-r-1的分布，其中r为需要估计的参数的个数。.第四步：根据显著性水平a查分布表求相应的临界值时，拒绝原假设，说明样本观测并非来自该理论分布。.【例6.10】某百货公司的电器部下半年各月洗衣机的销售数量如下：该电器部经理想了解洗衣机的销售数量是否在各月是均匀分布的，也就是说各月中销售数量的差别可以归结为随机原因，这样可以为以后的进货提供依据。要求以a=0.05 的显著性水平进行检验。.解：本例中的观测值以月为组，共分为m=6组，每月的销售台数即为观测的频数，观测的总次数为n=150。现欲检验是否服从（离散的）均匀分布，即每月的销售量是否为为此，设：洗衣机销售量服从均匀分布；：并不服从均匀分布；.计算统计量的值：，说明下半年各月销售量与均匀分布有差别，这些差别尚不能完全归结为随机原因。在本例的情况下，统计量的自由度为m-1=6-1=5。查表得知，.【例6.11】在高速公路收费站100分钟内观测到通过收费站的汽车共190辆，每分钟通过的汽车辆数分布如下表：用显著性水平a=0.05检验这些数据是否来自泊松分布。解：设：汽车通过收费站的辆数服从泊松分布；：不服从泊松分布。观测值分为5组，且有.回忆泊松分布其中为泊松分布的期望值，是未知的，需要用样本观测值来估计。由于100分钟内观测到190辆汽车，所以平均每分钟观测到190/100=1.9辆汽车，故取。据此，我们可以用参数的泊松分布来计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3辆、4辆或更多的概率。.计算统计量的值：自由度为m-1-1=5-1-1=3，临界值，说明每分钟通过收费站的汽车辆数不服从泊松分布。各概率乘以观测总数n=100，便得到理论频数，具体结果见下表：.在应用分布拟合优度检验时，应注意每一类中理论频数不宜过小，通常应不小于5。如果出现理论频数太低，就应当与邻近的类进行合并。.（二）（二）分布的独立性检验分布的独立性检验拟合优度检验是根据样本观测值与一个理论值进行比较来检验的，但是有些数值并不知道服从何种理论分布。因此在双边量的分布中，有时想了解两个变量是相依的还是独立的。卡方检验可用于这样的检验，称作卡方的独立性检验。这种情况下可以使用列连表进行分析，并用卡方进行独立性检验。列连表是一个表示两个分类变量的r行c列的矩阵。.1.如何探讨两个变量是相依的还是独立的的独立性检验2.检验的基础列联表列联表的构成理论频数的计算独立性检验的统计量.P187表6.2 表6.2是最简单的2行2列的列联表，它可以扩展到rc列联表。代表行的第1类和列的第1类所出现的实际频数，依次类推。那么相应于理论值如何计算呢？因为位于第1行，整个样本量为n，落入第1行的概率根据样本估计应该是，又同时位于第1列，落入第1列的概率根据样本计算应该是.根据概率论的原理，如果行和列的变量是独立的，那么落入第1行和第1列的概率应该是，由于样本量为n，则落入第1行第1列的理论频数应该是由此可以推广到在独立性检验中的统计量为.【例6.12】某副食品商店欲研究顾客的性别与购物金额大小之间是有关系，还是没有关系（意味着相互独立）。在该商店内随机调查了548位顾客，按金额大小和性别进行分类，取得如下数据（见表6.3）：表6.3顾客的性别与购买金额列联表（括号内是理论频数）要求用a=0.05的显著性水平检验顾客的性别和购买金额是否独立。解：购物的金额大小与性别无关（独立）；：购物的金额大小与性别有关。.计算列联表各格的理论值：.并列入列联表各格的括号内。计算值.23列联表的自由度为(r-1)(c-1)=2,当a=0.05时,拒绝，接受，即购物的金额大小与性别有关。22列联表的2值计算还可以简化，为了说明方便，将列联表每格的数字用字母表示.【例6.13】某市场调研机构，调查某种光盘的购买者和性别之间是否有关系取得如下数据：令a=0.05，用独立性检验推断购买某种光盘与性别是否有关？解：购买与性别无关，：购买与性别有关。现采用两种方法计算值。.两种方法的计算结果相同当a=0.05，接受，说明买该光盘与性别的关系不显著。.三、秩和检验（等级和检验）三、秩和检验（等级和检验）参数中均值检验在小样本时是如何处理的要求总体服从正态分布，当总体不符合正态分布时如何处理？转换成等级，然后检验，这一类的检验统称为秩和检验。（一）曼（一）曼-惠特尼惠特尼U检验检验1.什么是曼-惠特尼U检验。它假设两个样本分别来自两个总体，目的是检验这两个总体的均值是否有显著的差别。2.具体步骤。第一步：把两组数据混和在一起，按照大小顺序编排等级。最小的为1，其次为2等等，两个数据和三个数据相等如何处理?.若有两个数据相等，且它们在按大小顺序编排好的数列里是第m和第m+1个数据，则它们的等级（也称作秩）都是m+（m+1）/2=2m+1/2。同理，若有3个数据相等，且它们在按大小顺序编排好的数据列里第m，第m+1和第m+2位数据，则它们的等级都是3m+3/3=m+1。第二步：分别求两个样本的等级和。设第一个样本的等级和为，第二个样本的等级和为，则有第三步：计算曼-惠特尼U检验统计量从和中选择较小者并称其为。.第四步：作出判断对于都比较小的情形，可以查附表6得到临界值，在时,拒绝。在原假设为真的情况下,可以证明随机变量U的均值和方差分别为并且当和都不小于10时，随机变量近似地服从标准正态分布。.设第一个总体的均值为，第二总体的均值为，则对于.【例6.14】为了比较两个小学贯彻素质教育的情况，现从甲学校抽15名学生，乙学校抽25名学生，按素质教育的要求进行测试并评分，按评分高低顺序排队并编上等级，其结果如下：要求以显著性水平a=0.05检验两学校的素质教育有没有差别。解：解：我们假设两个学校的素质教育除了平均水平以外在其他方面没有差异。我们需要检验：两校素质教育水平无差异。：两校素质教育水平有差异。.计算U值：U的均值和标准差分别为，所以我们不能拒绝，说明两个学校素质教育的水平没有显著性的差异。.（二）威尔科克森带符号的秩检验（二）威尔科克森带符号的秩检验1.什么是威尔科克森带符号的秩检验？它只要求数据之差所服从的分布是对称分布。目的是检验成对观测的数据之差是否来自均值为0的总体，或产生数据的两个总体是否具有相同的均值。2.具体步骤。第一步：求出成对观测数据的差，并将其绝对值按照大小顺序编排等级。最小的为1，其次为2等等。两个数据和三个数据相等如何处理?同曼-惠特尼U检验。.第三步：作出判断对于小样本，根据显著性水平a查数表7，得到临界值，若则拒绝；对于大样本（观测不少于20对），可以证明统计量T的均值和方差分别为其中n为成对观测的个数，并且近似地服从标准正态分布因此，对于单侧检验，若，则拒绝；对于双侧检验，若 ,则拒绝。第二步：编码等级后再恢复其正负号，并将正号的等级与负号的等级分别相加，分别用表示。取较小的一个为威尔科克森检验统计量。.【例6.15】为比较两种轮胎的平均使用里程，在6辆汽车的后轮分别用两种不同的牌号的轮胎，直到用坏后加以记录里程，取得的数据如表6.5。要求a=0.05，检验两种轮胎的平均行驶里程是否有显著差别。.解：解：两种轮胎的平均行驶里程无显著差别，：两种轮胎的平均使用里程有差别。将成对的差列于表6.5的第4列（），根据的绝对值由小到大顺序编号，然后恢复正负号，再将不同符号的等级分别相加，见表6.5最后一列。计算得到正负号的等级和，用较小的T与临界值Ta相比较，由附表7得到：对于a=0.05的双侧检验，n=6时，T已超过临界值，因此不能推翻，可认为两种轮胎的行驶里程无显著差别。.【例6.16】某饮料商用两种不同的配料方法推出了两种新的饮料，现抽取了20个消费者，让其分别品尝两种饮料并加以评分，从不喜欢到喜欢，评分由110，其评分结果如下：要求以a=0.05的显著性水平检验对两种饮料的评分是否有显著差别。解：应用威尔科克森带符号的成对检验，将评分之差变换为等级，再恢复正负号，其计算过程见计算表6.6。将评分相同的样本加以剔除，因此样本量就由20变为18。.最后得到，取其中较小的来检验，在大样本的情况下T近似正态分布表6.6.当a=0.05时双侧检验，因此拒绝接受，说明两种饮料的评分有差别。.四、等级相关系数及其检验四、等级相关系数及其检验主要用于测量两组变量之间是否存在相关以及相关程度数值型和非数值型：（一）测定两组等级变量之间的相关系数1.斯皮尔曼等级相关系数其中表示两组数据的等级之差，n为样本量。.【例6.17】有一家公司招聘打字员，采用口试与实际操作两种方式。现有6个申请人的口试与实际操作的评分记录如下：要求测定这些申请人实际操作成绩与口试成绩之间是否存在关系及关系的密切程度。解：首先需要将口试成绩与操作成绩变换为等级，然后计算等级相关系数，见计算表6.7。.应用斯皮尔曼等级相关系数说明口试与操作成绩之间存在着相关，其相关程度0.8857。和一般的相关系数一样，当斯皮尔曼等级相关系数等1时表示完全正相关，当为0时为完全不相关，当等于-1时为完全的负相关。.（二）等级相关系数的检验（二）等级相关系数的检验1.假设检验的问题2.小样本和大样本情况的处理和其他的推断一样，当以样本的数据来说明总体时，由于样本带有随机性，在小样本时有时看来相关，但总体之间则不一定相关。因此也同样有一个假设检验的问题：研究的总体之间无相关（）：研究的总体之间有相关（）检验的样本估计量为样本的相关系数，在小样本的情况下通常临界值的r已编制成表可以直接查阅（见附表8），但在大样本的情况下可以通过变换服从t（n-2）的t分布，采用t检验。本章主要讨论了假设检验的基本原理，参数检验和非参数检本章主要讨论了假设检验的基本原理，参数检验和非参数检验的问题。验的问题。.

展开阅读全文