资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第七章 假设检验,*,第,*,页,第七章 假设检验,7.1,假设检验的基本思想与概念,7.2,正态总体参数假设检验,7.3,其它分布参数的假设检验,7.4,似然比检验与分布拟合检验,7.5,正态性检验,7.4 似然比检验与分布拟合检验,7.4.1 似然比检验,设 是来自密度函数(或分布率),为 的总体的简单样本,,考虑检验,问题:,一个比较直观且自然方法是考虑似然比,当 较大时,拒绝原假设 ,,这种检验方法称为,似然比检验,。,例1,对正态总体,方差已知,检验问题,似然比为,否则,接受 ,,令,则,因为 均已知且 ,,拒绝域为,的单调增函数,故由等式,所以 是,可得 。,这样检验统计量可取为,这是通常的单边 检验。,对一般的假设检验问题,检验的拒绝域为,定义似然比检验统计量为,其中临界值 可由,确定。,下面也通过例子说明其具体应用。,似然比,对正态总体,方差未知,检验问题,这里,当 未知时,其极大似然估计分别为,当 已知时,极大似然估计为,所以似然比为,若令 ,,则,当 成立时,,且 是 单调增函数,因此由,可得临界值为,这样检验统计量为,拒绝域为,当 成立时,,且 是 单调增函数,因此由,当然也可令,,则,这是通常的双边 检验。,拒绝域为,这样检验统计量也可以为,可得临界值为,可以证明这时的 检验和 检验是等价的。,从上述两个例子可得求似然比检验的一般步骤:,(1),在 内求 的极大似然估计 ,,在 内求 的极大似然估计,增函数时,由 求临界值,(2),计算并化简,使成形式 ,,满足两个要求,,是 的单调增函数或单调减函数;,当 成立时,的分布完全已知。,(3),减函数时,由 求临界值,(4),检验统计量取为,增函数时,拒绝域为,减函数时,拒绝域为,其一:,其二:,注:,(1),正态总体下参数的检验基本都是似然比检验,(2),似然比检验可用于检验样本来自两个不同类,型分布之一,,样本来自正态总体族,样本来自双参数指数分布族,其中,如,(3),似然比检验适应面广,,(4),一般情形下,,难获得,,总体均可以构造,,且构造的检验常具有一,些优良性质,,如在某种意义下具有最有性。,因此临界值的求法有两种。,其一,,利用Monte-Carlo模拟计算;,其二,,当样本,容量 很大时,,利用似然比统计量的极限,分布近似给出。,正态总体和非正态,似然比统计量的精确分布很,先考虑总体分布只取有限个值的情况,设总体,X,可以分成,k,类,记为,,现对该总体作了,n,次观测,,k,个类出现的频数分别为:,检验如下假设:,n,1,n,k,且,其中诸,且,7.4.2 分布拟合检验,一 总体分布离散情况,在之前的比例问题的假设检验中,对于大样本的数据,1、诸,p,i,均已知时,对于比例问题:,P,(,X,=1)=,p,,,P,(,X,=0)=1,p,假设检验:,H,0,:,p,=,p,0,;,H,1,:,p,p,0,。,样本统计:1的频数为,k,,,0的频数为,n,k,。,我们有,从二项分布(01数据)的情形入手,与之对应地,我们有如下等价的检验统计量,注意到,即,也可以写成:,总体分类,A,1,(,X,=1),A,2,(,X,=0),合计,理论频数,E,1,=,np,0,E,2,=,n,(1,p,0,),n,观测频数,O,1,=,k,O,2,=,nk,n,该检验的检验统计量及其分布:,再考虑更一般的情形,对于多项分布问题:,假设检验:,数据结构:,总体分类,A,1,(,X,=1),A,k,(,X,=,k,),合计,理论频数,E,1,=,np,10,E,k,=,np,k,0,n,观测频数,O,1,O,s,n,英国统计学家,K.Pearson,提出如下检验统计量:,在近似计算方面,尽可能要求所有观测频数,O,i,5,,容许个别为3或4;否则,对某些类进行合并。,(7.4.2,),并证明在,H,0,成立时对充分大的,n,(7.4.2),给出的检验统计量近似服从自由度为,k,-,1,的 分布。,如果,H,0,成立,则对每一类,A,i,,其频率,n,i,/n,与概率,p,i,应较接近。即观测频数,n,i,与理论频数,np,i,应相差不大。,反之,若,观测频数,n,i,与理论频数,np,i,相差较大,则应,拒绝原假设。,据此,我们可以得到如下的拒绝域形式,拒绝域为:,例7.4.1,为募集社会福利基金,某地方政府发,行福利彩票,中彩者用摇大转盘的方法确定,最后中奖金额。大转盘均分为,20,份,其中金,额为,5,万、,10,万、,20,万、,30,万、,50,万、,100,万,的分别占,2,份、,4,份、,6,份、,4,份、,2,份、,2,份。,假定大转盘是均匀的,则每一点朝下是等可,能的,于是摇出各个奖项的概率如下:,概率,0.1,0.2,0.3,0.2,0.1,0.1,额度,5,万,10,万,20,万,30,万,50,万,100,万,现,20,人参加摇奖,摇得,5,万、10万、,20,万、,30,万、,50,万和,100,万的人数分别为,2,、,6,、,6,、,3,、,3,、,0,,由于没有一个人摇到,100,万,于是有人怀疑大转盘是不均匀的,那么该怀疑是否成立呢?这就需要对转盘的均匀性作检验。,解:,这是一个典型的分布拟合优度检验,总体,共有,6,类,其发生概率分别为,0.1,、,0.2,、,0.3,、,0.2,、,0.1,和,0.1,,选用如下卡方检验统计量,检验拒绝域为:,这里,k,=6,,,由本例数据可以算出,若取,=0.05,,则查附表,3,知,=,由于 未落入拒绝域,故接受原假设,,没有理由认为转盘不均匀。,本例中,以,T,记服从,的随机变量,则使用统计软件可以算出,这个,p,值就反映了数据与假设的分布拟合程度的高低,,p,值越大,拟合越好。,在分布拟合检验中使用,p,值也是方便的。,2、,诸,p,i,不完全已知时,若诸,由,r,(,r,k,),个未知参数,确定,即,首先给出,的极大似然估计,然后给出诸,的极大似然估计,Fisher,证明了,在,H,0,成立时近似服从自由度,为,k,-,r,-,1,的,分布,于是检验拒绝域为,例7.4.2,卢瑟福在,2608,个等时间间隔内观测一,枚放射性物质放射的粒子数,X,,表,7.4.1,是观测,结果的汇总,其中,n,i,表示,2608,次观测中放射粒,子数为,i,的次数。,n,i,57 203 383 525 532 408 273 139 45 27 10 6,i 0 1 2 3 4 5 6 7 8 9 10,11,试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。,解:,本例中,要检验总体是否服从泊松分布。,观测到,0,1,11,共,12,个不同取值,这相当于把总体分成k=,12,类。这里有一个未知参数,,采用极大似然估计,,=,将,代入可以估计出诸,。,选用检验统计量,列表如下。,0,1,2,3,4,5,6,7,8,9,10,11,57,203,383,525,532,408,273,139,45,27,10,6,0.0209,0.0807,0.1562,0.2015,0.1950,0.1509,0.0973,0.0538,0.0260,0.0112,0.0043,0.0022,54.5,210.5,407.4,525.5,508.6,393.5,253.8,140.3,67.8,29.2,11.2,5.7,0.1147,0.2672,1.4614,0.0005,1.0766,0.5343,1.4525,0.0120,7.6673,0.1658,0.1258,0.0158,合计,2608,1.0000,2068,=12.8967,i,若取,=0.05,,则,本例中,=12.896718.307,,故接受原假设。,拒绝域为,使用统计软件可以计算出此处检验的,p,值是0.2295,。,自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震,共162次,统计如下:,二、,连续情形的离散化,我们通过一个例子来看怎么利用卡方拟合检验处理,连续总体的情形,例7.4.3,(,X,表示相继两次地震间隔天数,Y,表示出现的频数),试检验相继两次地震间隔天数,X,服从指数分布.,由最大似然估计法得,因,X,为连续型随机变量,将,X,的可能取值区间分为,k,=9,个互不重叠的子区间如下,的概率密度,:,0,X,H,解:,=163.5633,50,31,26,17,10,8,6,6,8,0.2788,0.2196,0.1527,0.1062,0.0739,0.0514,0.0358,0.0248,0.0568,45.1656,35.5752,24.7374,17.2044,11.9718,8.3268,5.7996,4.0176,9.2016,55.3519,27.0132,27.3270,16.7980,8.3530,7.6860,6.2073,14.8269,13.2192,例3的,拟合检验计算表,在,H,0,为真的前提下,X,的分布函数的估计为,故在水平 0.05 下接受,H,0,认为样本服从指数分布.,有估计,概率,),(,i,i,A,P,p,=,Kolmogorov的D检验,当我们需要检验一组观测值是否来自某一已知总体时,,我们常采用所谓kolmogorov的D检验法。,假设检验:,这里 为一事先给定的完全已知的连续分布函数,检验统计量:,1933年kolmogorov证明了当 成立时,有,该极限与 无关。,该检验方法与连续情形的卡方检验方法相比要好,,灵敏度较高。,该检验方法只适用于总体理论分布 完全已知的情形,若总体理论分布含有未知参数,即为 的情形,,虽然我们也可以采用 的估计量 类似于前面作替换,,但此时的kolmogorov的检验方法就不如卡方拟合检验了。,列联表是将观测数据按两个或更多属性,(,定性变量,),分类时所列出的频数表。例如,对随机抽取的,1000,人按性别(男或女)及色觉,(,正常或色盲,),两个属性分类,得到如下二维列联表,又称,22,表或四格表。,7.4.2,列联表的独立性检验,男,535,65,女,382,18,性别,视觉,正常,色盲,一般,若总体中的个体可按两个属性,A,与,B,分类,,A,有,r,个类 ,,B,有,c,个类,从总体中抽取大小为,n,的样本,设其中有 个个体既属于 类又属于 类,称为频数,将,r,c,个 排列为一个,r,行,c,列的二维列联表,简称,r,c,表(表7.4.3)。,表7.4.3,r,c,列联表,列联表分析的基本问题是:考察各属性之间有无关联,即判别,两属性是否独立。,如在前例中,问题是:一个人是否色盲与其性别是否有关?在,r,c,表中,若以,和,分别表示总体中的个体仅属于,,仅属于,和同时属于,与,的概率,可得一个二维离散分布表(表,7.4.4,),则,“,A、B,两属性独立,”,的假设可以表述为,表,7.4.4,二维离散分布表,这就变为上一小节中诸,不完全已知时的分布拟合检验。这里诸,共有,rc,个参数,在原假设,H,0,成立时,这,rc,个参数,由,r,+,c,个参数,和,决定。在这,r,+,c,后个参数中存在两个约束条件:,所以,此时,实际上由,r,+,c,-,2,个独立参数所确定。据此,检验统计量为,在,H,0,成立时,上式服从自由度为,rc,-,(,r,+,c,-,2),-,1,的,分布。,其中诸,是在,H,0,成立下得到的,的极大似然估计,其表达式为,对给定的显著性水平,,检验的拒绝域为:,例7.4.3,为研究儿童智力发展与营养的关系,某,研究机构调查了,1436,名儿童,得到如表,7.4.5,的,数据,试在显著性水平,0.05,下判断智力发展与,营养有无关系。,表,7.4.5,儿童智力与营养的调查数据,营养良好,营养不良,合计,智 商,合计,342,367,266,329,1304,56,40,20,132,16,423,382,286,345,1436,80,80,90,90,99,100,解:,用,A,表示营养状况,它有两个水平:表示,营养良好,,表示营养不良;,B,表示儿童智商,它有四个水平,,分别表示表中四种,情况。沿用前面的记号,首先建立假设,H,0,:营养状况与智商无关联,即,A,与,B,独立的。,统计表示如下:,在原假设,H,0,成立下,我们可以计算诸参数的极大似然估计值:,进而可给出诸,,如,其它结果见表,7.4.6,表,7.4.6,诸,的计算结果,营养良好,384.1677,346.8724,259.7631,313.3588,0.9081,0.2946,0.2660,0.1992,0.2403,营养不良,38.8779,35.1036,26.2881,31.7120,0.0919,7.815,,故拒绝原假设,认为营养状况对智商有影响。,本例中检验的,p,值为,0.0002,。,
展开阅读全文