收藏 分销(赏)

二项双侧检验不同拒绝域选取研究_方红燕.pdf

上传人:自信****多点 文档编号:300765 上传时间:2023-07-25 格式:PDF 页数:6 大小:1.40MB
下载 相关 举报
二项双侧检验不同拒绝域选取研究_方红燕.pdf_第1页
第1页 / 共6页
二项双侧检验不同拒绝域选取研究_方红燕.pdf_第2页
第2页 / 共6页
二项双侧检验不同拒绝域选取研究_方红燕.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第40卷第2期2023年06月Vol.40,No 2Jun.2023阜阳师范大学学报(自然科学版)Journal of Fuyang Normal University(Natural Science)方红燕,靳立帅,朱颖,等:二项双侧检验不同拒绝域选取研究收稿日期:2022-07-02基金项目:国家自然科学基金(11801003);安徽省自然科学基金(2008085MA14);安徽大学大学生创新创业训练项目(X202210357001)资助。作者简介:方红燕(1985-),女,博士,副教授,研究方向:生物统计,统计计算,Email:。二项双侧检验不同拒绝域选取研究方红燕*,靳立帅,朱颖,李晓

2、琴(安徽大学 大数据与统计学院,安徽 合肥 230601)摘要:假设检验理论是数理统计知识体系中很重要的一环。在双侧假设检验问题中,对于拒绝域的构造通常是采用二分法的形式来得到,其优点是理论简单并且容易操作。但在零假设下统计量的分布为非对称分布情形下,由区间估计理论知通过二分法构造的区间长度并非最优。已知概率参数不等于 0.5 的二项分布并非对称分布,以二项检验中的双侧假设检验问题为例,分别用二分法和最短距法构造双侧检验的拒绝域进行研究,模拟比较二者的 I 型错误和检验功效情况。实验结果表明:最短距法构造的拒绝域对应的检验其 I 型错误更加稳健,检验的功效也更高。关键词:假设检验;拒绝域;p

3、值;二项检验;双侧检验;检验功效中图分类号:O212.1文献标识码:A文章编号:2096-9341(2023)02-0001-06DOI:10.14096/34-1069/n/2096-9341(2023)02-0001-06The different rejection region study of two-sided binomial testFANG Hongyan,JIN Lishuai,ZHU Ying,LI Xiaoqin(School of Big Data and Statistics,Anhui University,Hefei Anhui 230601,China)Abs

4、tract:Hypothesis Testing Theory is an important part in statistic theory.In two-sided hypothesis testing problems,theconstruction of the rejection domain is usually obtained in the form of a dichotomy,which has the advantage of being simple the-oretically and easy to manipulate.Nevertheless,the inte

5、rval length constructed by the dichotomy is not the optimal one accord-ing to the interval estimation theory,especially when the distribution of the test statistic under the null hypothesis is not symmet-ric.Given that the binomial distribution whose probability parameter is not equal to 0.5 is not

6、symmetrical,the binomial hypothe-sis testing problem is taken as an example,and the rejection domain of the binomial test is constructed by the dichotomy methodand the shortest distance method respectively to simulate and compare their type I errors and test efficacy.The simulation resultshow that t

7、he test with rejection region generated by the shortest length method has more precise type I error rate and higher test-ing power.Key words:hypothesis test;rejection region;p value;binomial test;two-sided test;testing power假设检验是统计推断的主要形式之一,是数理统计知识体系中很重要的一环,是数理统计基础理论与实际问题应用的桥梁纽带。随着当今社会的快速发展,数据的急速膨胀带

8、来的数据挖掘任务使得假设检验在经济、医学、管理、心理学、质量管控、农业、体育等等领域都有了越来越广泛的应用1-4。其中,双侧检验是假设检验问题中最常用和最普遍的检验问题,通过对双侧检验的结果第40卷阜阳师范大学学报(自然科学版)2推导变换很容易得到单侧的检验结果。由此,双侧假设检验问题是现代数据分析问题中的非常重要的统计问题。显著性假设检验理论中,通常把样本空间划分成拒绝域和接受域,当观测的样本落入拒绝域的时候就拒绝原假设。因此,对于双侧假设检验问题,通常的作法是用二分法来划分拒绝域5。由于二分法划分拒绝域的方式在零假设的分布是对称的情形下是最优的,相对来说形式简单易于使用,因此通常的拒绝域的

9、选取都采用此类方法6-15。假设检验理论和区间估计理论是相通的。由区间估计理论可知,当统计量在零假设下的分布是对称时,由二分法确定的置信区间的长度是最短的,此时的置信区间最优。但是当零假设的分布非对称时,由二分法得到的置信区间长度并非最短,此时的置信区间并非最优16。实际问题中,虽然拒绝域的选取通常选用二分法,也有不是采用二分法构造拒绝域的例子。譬如,统计软件R 中二项检验的运算命令 binom.test 就不是采用二分法来构造拒绝域。对于同一个假设检验问题,通常通过构造不同的检验统计量进行检验,一个好的检验统计方法需要在控制 I 型错误的前提下拥有更高的检验功效。默认情况下对于拒绝域的划分采

10、用相同的构造方式。事实上,对同一个检验统计量,不同的拒绝域划分方式也可以得到不同的结果。本文在给定显著性水平下,研究不同的拒绝域的设置方式下同一检验方法的检验情况,包括检验的 I 型错误和检验功效。在统计量的分布是对称分布时,两种检验方法的设置机制是相同的,因此主要比较非对称分布的检验情况。由于二项检验当概率参数不等于 0.5 时,该项分布是非对称的,本文就以二项分布为例进行介绍和比较。1拒绝域的两种不同设置方法1.1拒绝域的一般提法对于一个常见的参数假设检验问题,原假设为H0,对立假设为H1。针对该假设检验问题,提出某一个检验统计量T,对于一个样本量为n的样本空间,划分样本空间为拒绝域W和接

11、受域S两个不相交的集合。在给定一组观测样本x1,xn时,判断这组样本是落入拒绝域还是落入接受域,如果样本落入拒绝域则拒绝原假设,否则就接受原假设。不同的拒绝域的确定方式就对应了不同的检验方法。通常,拒绝域W的确定采用二分法,也叫双侧等尾拒绝域17,即根据小概率发生的原则,在给定显著性水平的前提下,根据检验统计量T在原假设下的分布函数F(x)确定下式:W1=(x1,xn):Tc2,其中常数c1,c2满足c1c2且c1=maxx:F(x)2,c2=minx:F(x)1-2.对于连续型分布函数F(x),括号中不等式可以取等式。譬如,对于正态分布函数,给定显著性水平,二分法的拒绝域的确定如图 1 所示

12、。拒绝域拒绝域0c1c2/2/2双侧检验图 1二分法拒绝域确定的示意图根据区间估计理论,由常数c1,c2确定的置信区间满足P(c1Tc2)=1-,这样处理的优点是简单实用。但是对于非对称的分布函数F(x),这样确定的置信区间长度c2-c1并非最短。以连续型分布函数为例,对于F(x)对应的概率密度函数f(x),最优的置信区间应满足下列两个方程:c1c2f(x)dx=1-,f(c1)=f(c2).由于置信区间理论和假设检验理论是相通的,按照最优的置信区间的确定方法来确定拒绝域 的 临 界 值c1和c2,得 到 的 拒 绝 域W2=(x1,x2):Tc216,被称为最短距方法。虽然两种拒绝域的形式相

13、同,但是临界值的取值在概率密度函数f(x)为非对称分布时不同。因此,不同的临界值的选取得到了不同的拒绝域,第2期方红燕,靳立帅,朱 颖,等:二项双侧检验不同拒绝域选取研究3理论上,相应的检验方法也有所不同。以二项检验为例,对二项检验的同一个检验方法分别采取二分法和最短距法确定检验的拒绝域,比较两种方式的检验是否存在区别。1.2二项检验的拒绝域和 p 值提法二项检验是非参数检验方法中一种非常重要的检验方法,在数据的分布不能确定是正态的情况下有着很重要的应用,包括符号检验、分位数检验、Cox-Staut 趋势存在性检验等18,在实际中也有众多的应用研究19-21。对于一个双侧检验问题,当一个统计量

14、T在原假设下的分布是二项分布。即TB(n,p)时,由二分法确定的二项检验的拒绝域的临界值为c1=arg maxK(k=0KP(T=k)2),c2=arg minK(k=KnP(T=k)2).(1)记pk=P(T=k),对应最短距法的拒绝域的临界值由下式确定p0=arg maxpk(pipkpi),i:pip0=0,1,c1,c2,n.(2)由于实际问题中,通常人们采用 p 值的形式进行假设检验判断22,23,因此,对实际观测样本x1,xn,计算得到检验统计量的观测值T0,根据拒绝域的确定方式,分别得到对应两种拒绝域的 p值的计算方式pv1=2min(F(T0),1-F(T0-1),(3)pv2

15、=piP(T0)pi.(4)当计算得到的 p 值小于等于给定的显著性水平时,拒绝原假设,否则接受原假设。例如,对于服从二项分布TB(28,0.25)的检验统计量,设=0.05,则由二分法确定的拒绝域的临界值为c1=2,c2=13。而由最短距法确定的临界值为c*1=2,c*2=12。假设观测统计量为T0=5,二项检验的二分法和最短距法所对应的拒绝域和 p 值计算分别见图 2 所示的上图和下图。2模拟研究由于二项分布中参数p=0.5时,二项分布的概率分布是对称的,二分法和最短距法确定拒绝域相同,因此选择p0.5概率分布不对称时进行研究。因此采用非参数检验中的分位数检验进行分析比较研究。T B(28

16、,0.25)=0.050.150.100.050.00036912 1518 21 24 270.01660.0112T=50pv1=2(5)=0.5276F0.150.100.050.00036912 1518 21 24 27T B(28,0.25)=0.050.150.100.050.00036912 1518 21 24 270.01660.0112T=50pv2i=0.5136p0.150.100.050.00036912 1518 21 24 270.01660.0112pp15M0,S-=i=1nIXiM0。这里I表示示性函数。记N=S+S-,则S-B(N,0.25)。对于假设检

17、验问题(5),分别用二分法和最短距法公式(3)和(4)计算检验的 p 值进行假设检验。生 成 数 据 的 分 布,当 取 正 态 分 布 时,取N(,2),取两种不同的值 1 和 5。当取均匀分布时,设置XU(-2+,2+)。M0取值为各分布当=0时对应的四分位点。当参数选取=0时,对应的是原假设下的模拟情况。在对立假设下,分别选取-3-0.1 和 0.13 的若干数据进行分析。对于 I 型错误的分析比较,选取样本量从20 到 1 000 不等,其中 20,30 到 100 对应小样本的数据分析,150,200,250,300 到 1 000 对应大样本的数据分析。在对立假设下,样本量选取n=

18、50和 100 两种情形进行比较分析。原假设和对立假设下的显著性水平分别选取 0.001,0.01 和 0.05 三种情况。在原假设下,对每一种参数设置重复模拟 100 000 次得到 I 型错误率。在对立假设下,重第40卷阜阳师范大学学报(自然科学版)4复模拟 10 000 次得到检验的功效。2.2模拟结果2.2.1I 型错误率=0.00120 60 100 350 600 8500.00000.00050.00150.0010nTypel error rates二分法最短距法=0.0120 60 100 350 600 8500.0000.0050.0150.010nTypel error

19、 rates=0.0520 60 100 350 600 8500.000.040.080.06nTypel error rates0.02(a)标准差为 1 的正态分布=0.00120 60 100 350 600 8500.00000.00050.00150.0010nTypel error rates二分法最短距法=0.0120 60 100 350 600 8500.0000.0050.0150.010nTypel error rates=0.0520 60 100 350 600 8500.000.040.080.06nTypel error rates0.02(b)标准差为 5 的

20、正态分布图 3 二分法和最短距法在正态分布下的 I 型错误率比较图 3 显示的是从正态分布生成数据做分位数检验得到的 I 型错误率的比较结果。其中,图 3(a)的 3 幅分别代表标准差为 1 的正态分布在显著性水平 0.001,0.01 和 0.05 下的 I 型错误率,图 3(b)的 3 幅代表的是标准差为 5 的相应 I 型错误率。图 4 表示均匀分布数据下的 I 型错误率比较结果。图中的直线表示相应的显著性水平。从比较的结果可以看出,二分法和最短距法都可以很有效地控制任意水平的 I 型错误,其中最短距法的 I型错误结果更靠近显著性水平,而二分法相对来说较为保守。样本量越大,两种方法对应的

21、 I 型错误率都越接近于名义水平,效果越好。正态分布标准差为 1 的二分法和最短距法的 I 型错误大小比较趋势和标准差为 5 的 I 型错误比较趋势基本一致,可以看出原假设下正态分布的方差大小对 I 型错误的影响很小。=0.00120 50 80200 500 8000.00000.00050.00150.0010nTypel error rates二分法最短距法=0.010.0000.0050.0150.010nTypel error rates=0.050.000.040.080.06nTypel error rates0.0220 50 80200 500 80020 50 80200

22、500 800图 4二分法和最短距法在均匀分布下的 I 型错误率比较表 1 标准差为 1 的正态分布下二分法和最短距法的功效比较样本量50100-0.6-0.4-0.20.20.40.6-0.6-0.4-0.20.20.40.6水平方法0.001二分法0.50050.13430.01270.00730.06240.24840.90400.39690.03410.02360.23600.6909最短距法0.50050.13430.01270.00730.06240.24840.90400.39690.03410.02360.23600.69090.01二分法0.71840.29230.04920

23、.02700.14690.42700.97260.63350.10810.07360.44750.8719最短距法0.80530.39490.08620.02710.14690.42700.98140.70520.14900.07360.44750.8719二分法0.050.87500.50610.14050.13600.43570.76630.99550.82650.27080.26560.76270.9771最短距法0.92570.62790.21360.13730.43580.76630.99820.87180.33990.26570.76270.97712.2.2功效比较在对立假设下,

24、选取 50 和 100 两种样本量,在 正 态 分 布N(,1),N(,52)和 均 匀 分 布U(-2+,2+)下比较两种拒绝域下的功效情况。正态分布N(,1)下原假设的四分位点为-0.6745,N(,52)下原假设的四分位点为-3.3724,而均匀分布U(-2+,2+)在原假设下四分位点取值为-1。均值参数的取值离 0 越远,说明越容易得到对立假设的结果,功效越高。对正态模型N(,1)和均匀分布模型U(-2+,2+),选取-11 的若干取值进行比较,而对于模型N(,52),选取-33 的若干取值进行比较。表 1 和表 2 分别代表标准差分别为 1 和 5 的正态分布下数据的功效比较结果,表

25、 3 显示的是均匀分布下的功效比较结果。表 2 标准差为 5 的正态分布下二分法和最短距法的功效比较从各个表的功效结果比较可以看出,样本量为 100 的检验功效在同样的参数下比样本量为 50的功效高,因此样本量越大,检验的功效越高。不同标准差的正态分布数据结果相比较可知,标准差为 5 的正态分布的功效结果相对于标准差为 1的同等大小的非零均值的功效要低很多。事实上,当/的取值相同时,各方法的功效结果接近。如当=1时=0.2与=5,=1,的功效结果相近。由于原假设下=0,这与大样本下二项分布的正态近似结果相一致。从二分法与最短距法的结果比较来看,水平为 0.001 下的功效结果相一致。由于二项分

26、布是离散分布,这说明在对立假设证据很明显的情况下,两种划分法得到的特别小的 p 值相同。而水平 0.01 和 0.05 下的结果,或者最短距法的功效等于或者高于二分法的检验结果,说明最短距法表现更好。表 3均匀分布下二分法和最短距法的功效比较第2期方红燕,靳立帅,朱 颖,等:二项双侧检验不同拒绝域选取研究52.2.2功效比较在对立假设下,选取 50 和 100 两种样本量,在 正 态 分 布N(,1),N(,52)和 均 匀 分 布U(-2+,2+)下比较两种拒绝域下的功效情况。正态分布N(,1)下原假设的四分位点为-0.6745,N(,52)下原假设的四分位点为-3.3724,而均匀分布U(

27、-2+,2+)在原假设下四分位点取值为-1。均值参数的取值离 0 越远,说明越容易得到对立假设的结果,功效越高。对正态模型N(,1)和均匀分布模型U(-2+,2+),选取-11 的若干取值进行比较,而对于模型N(,52),选取-33 的若干取值进行比较。表 1 和表 2 分别代表标准差分别为 1 和 5 的正态分布下数据的功效比较结果,表 3 显示的是均匀分布下的功效比较结果。表 2 标准差为 5 的正态分布下二分法和最短距法的功效比较样本量50100-3-2-1123-3-2-1123水平方法0.001二分法0.49490.12520.01150.00840.06070.23900.9060

28、0.39250.03100.01980.21950.6832最短距法0.49490.12520.01150.00840.06070.23900.90600.39250.03100.01980.21950.68320.01二分法0.71260.28370.04550.02700.14340.42410.97390.63640.10420.06890.43390.8623最短距法0.80080.38840.08010.02700.14340.42410.98330.71100.14990.06890.43390.8623二分法0.050.86860.50270.13400.13060.43180.

29、75810.99370.83590.27750.25000.74950.9778最短距法0.92230.61440.20710.13130.43180.75810.99630.88030.35490.25030.74950.9778从各个表的功效结果比较可以看出,样本量为 100 的检验功效在同样的参数下比样本量为 50的功效高,因此样本量越大,检验的功效越高。不同标准差的正态分布数据结果相比较可知,标准差为 5 的正态分布的功效结果相对于标准差为 1的同等大小的非零均值的功效要低很多。事实上,当/的取值相同时,各方法的功效结果接近。如当=1时=0.2与=5,=1,的功效结果相近。由于原假设下

30、=0,这与大样本下二项分布的正态近似结果相一致。从二分法与最短距法的结果比较来看,水平为 0.001 下的功效结果相一致。由于二项分布是离散分布,这说明在对立假设证据很明显的情况下,两种划分法得到的特别小的 p 值相同。而水平 0.01 和 0.05 下的结果,或者最短距法的功效等于或者高于二分法的检验结果,说明最短距法表现更好。表 3均匀分布下二分法和最短距法的功效比较样本量50100-0.6-0.4-0.20.20.40.6-0.6-0.4-0.20.20.40.6水平方法0.001二分法0.15660.03760.00610.00590.04340.25390.46060.12730.0

31、1450.01230.16050.7091最短距法0.15660.03760.00610.00590.04340.25390.46060.12730.01450.01230.16050.70910.01二分法0.32820.12200.02340.01800.11120.44130.69970.30180.05340.04610.34380.8825最短距法0.44320.18610.04880.01810.11120.44130.76510.37790.07910.04610.34380.8825二分法0.050.54950.26860.09090.1023036510.77830.8679

32、0.53470.16750.19080.67830.9807最短距法0.66100.36920.14540.10390.36510.77830.90710.61730.22500.19100.67830.9807第40卷阜阳师范大学学报(自然科学版)63总结本文以二项检验为例,研究了双侧检验拒绝域的不同设置方法二分法和最短距法对检验结果的影响。从不同的模拟实验结果来看,对于零假设下不是对称分布的零分布检验,最短距法能更好地控制 I 型错误,并且拥有更好的功效表现。对于二项检验来说,最短距法的 p 值的求解比较容易,这也可以解释统计软件 R 中的二项检验命令 binom.test 采用最短距法来

33、实现 p 值的求解的原因。事实上在很多连续分布中要按照最短距法得到 p 值的求解并非易事,而二分法则简单易实现,因此人们通常约定习俗地采用二分法来得到双侧检验的结果。本研究结果表明最短距法构造的检验拒绝域比二分法有更好的表现。用最短距法构造拒绝域或者计算 p 值在一定程度上可以提高检验的功效。参考文献1张新媛,邱冰洁,王艳红,等.正常人脉络膜厚度分布特征及肥厚型脉络膜诊断界线值J.中华实验眼科杂志,2022,40(06):548-555.2罗燕,龚晓明,陈彦庆,等.体智能课程对幼儿体质的影响研究J.四川体育科学,2022,41(04):52-53+86.3朱家琦,陈金波.品牌标识设计对 00

34、后消费群体影响的实验研究J.商业经济研究,2022,846(11):50-54.4汪静,余许友.融资约束视角下供应商集中度对企业研发投入的影响研究J.阜阳师范大学学报(自然科学版),2022,39(01):91-98.5韦来生.数理统计(第 2 版)M.北京:科学出版社,2022,174-192.6郭三刚,张琳.一种求解假设检验拒绝域和计算 p-值的系统化方法J.陕西理工大学学报(自然科学版),2018,34(06):71-77.7杨刚.统计学中参数假设检验拒绝域的确定J.长春工程学院学报(自然科学版),2012,13(2):126-128.8DING S S,FANG H Y,DONG X,

35、et al.The CU-SUM statistics of change point models based on depen-dentsequencesJ.Journalof AppliedStatistics,2022,49(10):2593-2611.9LIU Z Y,LIU B S,ZHENG S R,et al.SimultaneousTesting of Mean Vector and Covariance Matrix forHigh-dimensional DataJ.Journal of Statistical Plan-ning and Inference,2017,1

36、88:82-93.10GREGORY K B,CARROLL R J,BALADANDA-YUTHAPANI V,et al.ATwo-Sample Test for Equal-ity of Means in High DimensionJ.Journal of theAmerican statistical association,2015,110(510):837-849.11石则强,师颖,曹宁,等.假设检验在汽车排放实验室比对中的应用研究J.汽车技术,2021,55(12):48-51.12乔静.假设检验在工业产品质量判断中的应用J.机电信息,2020,633(27):142-143.

37、13武淑琴,李灵珊,陶宏娟.参数检验在企业财务预算编制中的应用J.统计与决策,2020,36(15):185-188.14魏立力,张定强.确定假设检验拒绝域的证据原理J.数学的实践与认识,2018,48(16):196-200.15谭波涛.检测结果的质量控制与可接受性核查J.阜阳师范学院学报(自然科学版),2004,21(02):41-44.16陈家鼎,孙山泽,李东风,等.数理统计学讲义(第 3版)M.北京:高等教育出版社.2015.17杨艳秋,王 磊,宋立新.离散型分布参数假设检验的最优拒绝域J.吉林师范大学学报(自然科学版),2012,33(03):82-83.18王星,褚挺进.非参数统计(第 2 版)M.北京:清华大学出版社.2014.19王怀亮.二项分布总体的假设检验及 R 语言实现J.现代商贸工业,2011,23(2):192-193.20陆运清.符号检验中样本间一致部分的影响及连续性矫正J.统计与决策,2017,472(04):90-92.21李雯静.基于二项检验的庾信五言诗篇调四声研究J.湖北理工学院学报(人文社会科学版),2015,32(3):57-60+77.22高娟.假设检验中 p 值的深入分析J.统计理论与实践.2021,506(06):17-19.23吕佳,任芳玲,赵子墨.二项分布参数的 p-值检验J.河南科学,2015,33(3):324-326.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服