1、v游程检验亦称连贯检验或串检验,是一种随机性检验方法,应用范围很广。例如:奖劵的购买是否随机,期货价格的变换是否随机,一个机械流程中产品误差的出现是否存在规律等等。若事件的发生并非随机,而是有规律可循,则可作出相应的对策。关于随机性的检验,从参数统计的角度,研究这一问题是相当困难。从非参数的角度来看,如果数据有上升或下降的趋势,或有呈现周期性变化的规律等特征时,均可能表示数据不是随机出现的。v例2.8 假定我们掷23次硬币,以概率p得正面(记为1),以概率1p得反面(记为0);这是一个Bernoulli试验,得到结果如下:0 0 0 0 0 0 0 1 1 1 1 1 1 0 0 0 0 1
2、1 1 1 0 0问这个试验是不是随机的?利用0和1出现的集中程度来判断这个试验是否是随机的。v基本概念1.游程:在一个二元0-1序列里,一个由0或1连续构成的串。2.游程长度:一个游程里数据的个数。3.一个序列里游程个数用R表示。例如下面的一个01序列:1 1 0 0 0 0 1 1 1 0 1 1 0 0 0 0 1 1 1 1 0 0共22个数,0的个数为11,1的个数为11,共8个游程,4个0游程,4个1游程。v游程检验的基本思想:固定样本量下,通过游程多少来判断。具体而言:在固定样本量下,若游程个数过少,则说明0和1比较集中,序列存在成群的倾向;若游程个数过多,则说明0和1交替频繁,
3、周期特征明显,序列具有混合倾向。v假设检验 Mood在1940年提出如下假设检验问题,设X1,Xn是一列由0或1构成的序列,H0:样本出现顺序随机 H1:样本出现顺序不随机 若关心序列是否具有某种倾向,则可建立单侧假设检验,H0不变,H1为序列具有混合倾向或H1为序列具有成群倾向。v检验统计量R及其分布 取一个序列里的游程总数作为检验统计量,记为R。设样本总数为N,其中0的个数为m个,1的个数为n个,即mnN。在H0成立的条件下,出现多少0和1,出现多少游程都与概率p有关,但在已知m和n时,R的条件分布就与p无关了。vR的条件分布。H0成立的条件下,Xi b(N,p),则在有m个0和n个1的条
4、件下,R的条件分布为 v检验p值。考虑双边假设检验,给定水平,设r是由样本算出来的检验统计量的值,则 p值2 min P(Rr),P(R r)。vR分布的进一步讨论在零假设下,可以证明:当样本量很大,且当 时,vR分布的进一步讨论 于是有 给定水平后,可以用近似公式得到拒绝域的临界值为:v例2.8中,总试验次数为N23,0出现次数为m13,1出现的次数为n10。如果称连在一起的0或1为游程,则上面这组数中有3个 0游程,2个1游程,共5个游程。经计算,p值0.0022,所以在水平 0.0022时,拒绝原假设,即认为该数列不是随机的。v注:一个可以两分的总体,如按性别区分的人群,按产品是否为次品
5、区分的总体等,随机从中抽取一个样本,样本也可以分为两类:类型 I 和类型 II。若凡属类型 I 的,用0表示;凡属类型 II的,用1表示。所以样本出现是否随机的问题,就转化为一个二元01序列出现的顺序是否随机的问题。v 对于连续型数据,也关心数据是否随机出现,这时可将连续的数据二元化,将连续数据的随机性问题转化成为二元数据的离散化问题。v例2.5 某品牌消毒液质检部要求每瓶消毒液的平均容积为500ml,现从流水线上的某台装瓶机上随机抽取21瓶,测得其容量如下所示。509,505,502,501,493,498,497,502,504,506,505,508,498,495,496,507,506,507,508,505 试检查这台机器装多装少是否随机?假设检验问题 H0:机器装多装少是随机的;H1:机器装多装少不是随机的v这里采用中位数法,计算样本中位数为503,令,则相应的Y样本为:1,1,0,0,0,0,0,0,1,1,1,1,1,0,0,0,1,1,1,1,1则0的个数m9,1的个数n12,R5。v 对于0.05,查表得到对应的R为6,而56,拒绝原假设,认为这台机器装多装少并非随机。