资源描述
随机性检验
【化12 2011011804 马路遥】 【化11 2011011792 李瑾】
摘要:本文采用游程检验的方法,检验π的小数位的随机性,并与无理数3 的小数位进行比较,并对该结果进行分析和总结。
关键词:随机性 游程检验
一. 问题的提出
1996 年《国际统计评论》(《International Statistical Review》)杂志发表了一篇关于π的 有趣文章[1],其中讨论了π的小数点后的位数是否构成一个随机序列的问题。
理论是讲,真正的随机序列是不能用比自身形式更简单的规则表达的序列,即是不可预
测的。在这个意义下, 不构成一个随机序列。因为人们已经发现很多公式,例如印度天
才数学家拉马努扬的神秘公式,可以有效地将π计算到n 位,这里n 是任意给定的正整数。
请用概率统计方法验证π的小数位的随机性,并与无理数3 的小数位进行比较。看起来更“复杂”的无理数π是否比感觉比较“简单”的3 更“随机”一些?
二.解决方案
1.游程检验简介
游程检验亦称“连贯检验”,是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。
游程指的是一个没有间断的相同数序列,即游程或者是“1111…”或者是“0000…”。一个长度为k 的游程包含k 个相同的数。游程检测的目的是判定不同长度的“1”游程的数目以及“0”游程的数目是否跟理想的随机序列的期望值相一致。具体的讲,就是该检验手段判定在这样的“0” 和“1”子块之间的振荡是否太快或太慢。
2.游程检验过程
(1)前提:频数检验
即在判断“0” 和“1”子块之间的振荡之前应先从直观上观察0和1的个数在总序列中所占比例,即若0和1比例差得过多,显然不为随机序列,则无需进行下一步的游程检验即可给出判断。
例如:
序列:1111111111100
明显可看出1的比例远超0的比例,即 “频数检验”显然不成立,那么就没有必要进行下一步的游程检验,直接可得出该序列不为随机序列的结论。
这里给出判断“频数检验”的定性规则:
令序列中“1”或“0”的个数为ε,序列数字总个数为n
令φ=εn,Ω=2n
若|φ-12|≥Ω,频数检验不成立,则该序列不为随机序列,游程检验无须进行;
若|φ-12|<Ω,频数检验不成立,接下来进行游程检验。
(2)游程检验
令ζ为“0” 和“1”子块的总数(即总的游程数),则在一个序列中较大的ζ值 就意味着在序列中的0” 和“1”子块的转变频率太快;而一个较小的ζ则意味着转变频率太慢。也就是说,若该序列为随机数列,定性地说ζ必须满足“既不能过大也不能过小”,具体的定量判断规则如下:
P-value=erfc{|ζ-2nφ(1-φ)|22nφ(1-φ)} 其中,
在决策水平为1%的情况下,
若P-value≥0.01,则判定该序列为随机的,否则判定该序列非随机.且P-value的值越大说明其随机性越强。
Ps:每个待检验序列至少应包含 100字节,即n 不小于 100。
三.π与3小数部分的随机性检验
根据附录给出数据仅检验π与3的前1000位数值,随机抽取连续的200个数字为一组(即n=200),分别分成10组分别进行检验。根据上述游程检验思想,应先将每组中的200个数字从小到大排列找出其中位数,再令原序列中大于等于中位数的数字为上述检验过程中的“1”,小于中位数的为“0”之后排列成新数列,依次进行上述频数检验过程与游程检验过程,判断其随机性。
(此过程中“找中位数”、“重排数列”、“统计游程数”全由计算机程序模拟运算,具体程序见附件)
(1)π的随机性检验
①第一组:
0的个数为82,1的个数为118,游程数为85,
φ=0.41,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|85-2x200x0.41(1-0.41)|22x2000.41(1-0.41)}=0.08565>0.01
判定为随机序列
②第二组:
0的个数为96,1的个数为104,游程数为113
φ=0.48,
|φ-12|<Ω ,满足频数检验
P-value= erfc{|113-2x200x0.48(1-0.48)|22x2000.48(1-0.48)}=0.06231>0.01
③第三组:
0的个数为85,1的个数为115,游程数为98
φ=0.43,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{98-2x200x0.43(1-0.43)|22x2000.43(1-0.43)}=0.9995>0.01
④第四组:
0的个数为100,1的个数为100,游程数为93
φ=0.5,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|93-2x200x0.50(1-0.50)|22x2000.50(1-0.50)}=0.3222>0.01
⑤第五组:
0的个数为88,1的个数为112,游程数为107
φ=0.44,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|107-2x200x0.44(1-0.44)|22x2000.44(1-0.44)}=0.2259>0.01
(2)3的随机性检验
①第一组:
0为83,1为107,游程数为88,
φ=0.42,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|88-2x200x0.42(1-0.42)|22x2000.42(1-0.42)}=0.1707>0.01
②第二组:
0为91,1为109,游程数为101
φ=0.46,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|101-2x200x0.46(1-0.46)|22x2000.46(1-0.46)}=0.8154>0.01
③第三组:
0为95,1为105,游程数为103
φ=0.48,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|103-2x200x0.48(1-0.48)|22x2000.48(1-0.48)}=0.6544>0.01
④第四组:
0为89,1为111,游程数为103
φ=0.45,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|103-2x200x0.45(1-0.45)|22x2000.45(1-0.45)}=0.5678>0.01
⑤第五组:
0为93,1为107,游程数为104
φ=0.47,
|φ-12|<Ω ,满足频数检验;
P-value= erfc{|104-2x200x0.47(1-0.47)|22x2000.47(1-0.47)}=0.5360>0.01
(一点补充:从上述抽样可以看出“1”的数量始终多于“0”,这是由于在编程模拟的时候把序列中的中位数归到了“1”,但不影响最终对随机性的判断和二者随机性的对比)
(3)π与3小数部分序列的随机性比较
由(1)、(2)抽样计算结果可知:
在决策水平为1%的情况下,π与3小数部分序列均可视为随机序列
(1) 中P-value的平均值为0.3391
(2) 中P-value的平均值为0.5489,明显高于(1)中的P-value值,则可推知3小数序列的随机性大于π
展开阅读全文