收藏 分销(赏)

P值检验法在实际生活中的应用.doc

上传人:pc****0 文档编号:9439989 上传时间:2025-03-26 格式:DOC 页数:15 大小:637KB 下载积分:10 金币
下载 相关 举报
P值检验法在实际生活中的应用.doc_第1页
第1页 / 共15页
P值检验法在实际生活中的应用.doc_第2页
第2页 / 共15页


点击查看更多>>
资源描述
假设检验中的P值法在实际生活中的应用 摘 要 假设检验是统计判断的重要内容,在很多情况下大多采用临界值法,而在现代统计软件中假设检验多是采用计算P值的方法进行推断的。检验时需要由样本观测值计算出检验统计量的观测值和衡量观测结果极端的值,然后通过比较P值和显著性水平的大小作判断,当时,拒绝原假设;当时,不能拒绝原假设。论文列举了P值检验法在生活中一些应用案例,并和临界值法的做了优势比较。 关键词:假设检验;临界值法;P值法;SAS The application of Hypothesis test P-value method in real life Abstract Hypothesis test is an important content of statistical judgment; the critical value method is used in many cases. However, in modern statistical software in hypothesis testing, the method of calculating the P value of extrapolation is used here and there. Inspection need by the value of the sample observations calculate the test statistic of the observation value and measure observations of extreme value, and then compare P values and a significant level of their size, to determine, when refuse the null hypothesis; when can not refuse the null hypothesis. The paper presents some application cases of the value of P test in life, and also to do some comparative advantage. Key Words:Hypothesis test, the critical value method, the P-value method, SAS 目 录 引言........................................................1 1.P-值的定义................................................1 1.1临界值法.................................................1 1.2 P-值法...................................................2 2.计算公式介绍..............................................2 3.双边检验P值与单边检验P值的关系...........................3 3.1 检验统计量为对称连续分布时..............................3 3.2 检验统计量为非对称分布时................................3 4. 应用实例.................................................5 5. P-值法的优势..............................................11 结束语......................................................11 参考文献...................................................12 引言 假设检验法是统计判断中的重要内容,在平时的很多情况下多习惯采用临界值法做出判断原假设是否成立的方法,但是由于计算机的普及以及现代统计软件的出现在很多问题的计算中多采用假设检验的值法。用这种方法在检验时需要有相应的样本观测值,并用这个观测值计算出检验的统计量在相应的观测值和衡量观测值结果中所出现的极端值,之后再通过比较值大小和显著性水平的大小来作出具体的判断。当时,则拒绝原假设;当时,则不能拒绝原假设。本文先介绍了值法的定义,和一些计算方法再列举了P值检验法在生活中一些应用案例,最后和传统的临界值法做了优势比较。 1.P-值的定义 在介绍值法之前,我们首先要介绍一种比较传统的用来做假设检验的方法-临界值法(也可以叫做显著性水平法)。 1.1临界值法 设样本总体为,并且其中为一个已知常数,现在想要检验出是否会大于某给定常数。再设原假设为,备选假设为,如下所示:。从总体中抽取一些简单随机样本,并记录样本的均值为。 易知 (1) 从而有 (2) 当成立时 (3) 其中称为临界值,满足显著性水平为一较小的正数如。式(3)说明当成立时,检验统计量大于等于临界值是个小概率事件,对于某具体样本,若该小概率事件发生,则拒绝原假设。否则就没有比较充分的理由去拒绝原假设。 1.2 P-值法 而对于上述问题,值法的定义如下: 对于某些具体的样本,其均值可以记为,设 (4) 若,则拒绝原假设,否则就没有充分的理由去拒绝原假设。 式(4)中的就是在原假设成立的前提下所计算出的样本值,也可以说成是更极端情况的概率大小,简称为值。 2.计算公式介绍 若为检验统计量,而为的观测值,通常值可以用下面公式计算得到。 I:单边检验值 (i)拒绝域在右边区域的检验 假设 (ii)拒绝域在左边区域的检验 假设 Ⅱ:双边检验P值 假设: (i)当检验的统计量为对称分布的双边检验时 由于 又 故可以得到以下结论: (ii)当检验统计量为非对称分布的双边检验时,可以得到以下结论: 3.双边检验中P值与单边检验中P值间的关系 根据上面值的计算公式不难推出如下性质: 设为检验统计量,为的观察值,为的中位数,,和分别为双边检验:,右边检验和左边检验的值,则它们有下面关系: 3.1 检验统计量为对称连续分布时 3.2 检验统计量为非对称分布时 证:1.检验统计量为对称连续分布时,由于 且统计量为联系对称分布,故有以下结论: 及, 所以 (i)拒绝域为右边区域的检验, 若,则; 若,则. (ii)拒绝域为左边区域的检验, 若,则; 若,则。 2.检验统计量为非对称分布时,由于 ,, 所以 (i)拒绝域为右边区域的检验, 若,则; 若,则==。 (ii)拒绝域为左边区域的检验 若,则; 若,则。 当知道了双边检验的P值法和单边检验的P值法的关系后,三种不同检验法就可以一次性地完成。事实上,在实际应用中如果只作一次双边检验或者单边检验时候,得到的拒绝原假设的结论下,有时还需要进行进一步的检验来判定是能否可以认为或者才可以得到更为准确的结论。即使是在得到不可以拒绝原假设的结论下,如果双边检验的P值还不够大,也可以说是拒绝备择假设的证据较弱,经常也需要再进一步作单边检验,以方便得到更为合理的或的结论。对于以上两种情形,再利用以上所述的双边检验的P值法和单边检验的P值法之间的关联,那么三种检验方法的同时进行就将变得会有必要了。 在我们研究双边检验的P值法和单边检验的P值法之间的关系时,有时当检验的统计量为非对称分布的时候还要用到检验统计量分布中常用的中位数,我们可以查阅有关资料中给出的分位数表,或者用一些统计软件调用相应分位数函数来进行计算。 4. 应用实例 例1 在某次投掷一元硬币的重复试验中,假如你投掷一元硬币1000次,并记录下相应的一元硬币出现字的次数。如果每次出现字的次数都是500,那么你就有把握认为这枚一元硬币是均匀的; 如果出现字的次数小于450或者大于550,那么你就会有一点怀疑它是不是均匀的; 如果出现字的次数小于300或者大于700,那么你就比较怀疑是不是均匀的;如果出现字的次数小于100或者大于900,那么你就非常怀疑是不是均匀的。 如上所述,如果出现字的次数和出现花的次数的差异越大,你就越有把握认为这枚硬币不是均匀的,即拒绝原假设。再重新叙述下P值的基本定义,“P值就是当原假设为真时,比得到的相应样本的观察结果出现更加极端的现象所得的概率”。把这个基本定义再代入上面所述的投掷一元硬币的重复试验的中去,好比说目前你所观察到的情况是“一元硬币投掷出现字的次数是100或者900。以致出现字和出现花的次数差异是800”: 若原假设为真(一元硬币是均匀的),P值就是你投掷1000次一元硬币。所得的出现字和花的次数的差异大于800的概率。 若这个P值很大,则表明每次投掷均匀的一元硬币1000次,经常会有出现字和花的次数差异大于800的情形。 若这个P值很小,则表明每次投掷均匀的一元硬币1000次,你将很难看到出现字和花的次数差异会超过800。 若一枚一元硬币投掷出字和花的次数差异大于800。这是一个“极端”的情况,只好认为原假设不对,一元硬币是不均匀的。在这里我们所用到的基本逻辑思维是:在假定原假设为真的前提条件下,出现我们所观察到的偏差(投掷出字和花的差异为800),是如此的不可能,即P值很小,以至于我们不能再继续相信原假设成立的真确性与否。 例2 一项关于某品牌巧克力的抽样调查结果显示,在个曾吃过该品牌巧克力的被访者中,有个人喜欢该品牌巧克力。生产该饮料的厂家声称“五分之一的消费者喜欢该品牌巧克力”。检验该厂家说法的合理性。 从样本看,喜欢该品牌巧克力的被访者的比例为,低于厂家的声称。这种差异可能是由于抽取样本的随机性导致的,也有可能是因为厂家的声称有误。 由于样本的结果小于厂家的声称,所以设立与如下: 其中,为实际喜欢该品牌巧克力的消费者比例。 容易知道,在抽取的个曾吃过该品牌巧克力的被访者中,喜欢该品牌巧克力的被访者人数X服从二项分布,即,那么出现样本值或者更极端值的概率为 即值为0.017.那么对于任何大于等于0.017的显著性水平,我们拒绝,即可以认为厂家的声称是错误的。作出此结论(厂家的声称是错误的)所犯弃真错误的概率为0.017。 例3 某公司从奶牛厂购买牛奶。公司管理人员怀疑奶牛厂在牛奶中掺水以谋利。通过公司检验检验人员对牛奶的冰点温度进行测定可以检验出牛奶中是否掺了水。查阅有关物理化学资料可以知道我们生活中天然牛奶的冰点温度的数值常常是近似地服从正态分布的,并且它平均值为,标准差为。假如牛奶掺了水将会导致牛奶的冰点温度升高以致接近于水的冰点温度()。检验检疫人员检测奶牛厂所提供的5桶牛奶的冰点温度,记录下来,并且计算出其均值,问你是否可以认为奶牛场在牛奶中惨了水呢?取 解:用值法检验 的观察值为: 值=,其中P值为是否可认为奶牛厂在牛奶中掺了水,对于任何大于的显著性水平,可以拒绝。即可以认为奶牛厂在提供的牛奶中掺了水。 例4一家食盐厂以生产袋装食盐为主,其每天大约可以生产8000袋,每袋重量规定为50克。为了分析厂家生产的每袋食盐重量是否达到要求,有关质检部门经常进行随机抽查检验。现在从某天生产的一批食品中随机抽检了25袋,测得每袋重量如表4-1所示。试以抽样的样本数据为依据,检验袋装食盐的平均重量与50克是否有显著性的差异。 表4-1 25袋食盐的重量(单位:克) 55.6 46 55.5 50.4 52.8 52.8 53.7 50.3 53.2 57.9 46.8 55.6 51.6 48.2 47.9 46.5 56.7 50.8 52.2 54.2 55.7 53.6 47.2 50.6 54.2 分析与解答 设重量变量为weight,本题是要求做原假设为50的双边检验。但是由于根据双边检验P值与单边检验P值的关系,我们还可以将三种检验同时地进行。 (i)双边检验。 在SAS中作t检验结果如图4-1。 The TTEST Procedure Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err Weight 25 50.12 51.6 53.08 2.8028 3.5896 4.9936 0.7179 T-Tests Variable DF t Value Pr>|t| weight 24 2.23 0.0365 图4-1 t检验结果 从图中软件计算结果可知原假设的值为,在的显著水平下,所以可以拒绝原先的假设。 (ii)右边区域检验( , )。 由于 拒绝右边检验的原假设 (3)左边区域检验()。 由于 , 所以不能拒绝左边区域检验的原假设。 综上,我们可以认为袋装食盐的平均重量与有显著差异,袋装食品的平均重量大于克。 例5 某药材生产商要检查包装机械的状态。根据规定,包装机正常工作时,每袋重量为克,方差为4.随机抽取当天生产的16袋样本称重后结果如表4-2所示,试检验药材包装机的工作状态是否正常。 表4-2 16袋药材重量(单位:克) 45 45 51 46 44 48 42 47 48 48 44 48 45 43 45 50 分析与解答 设重量的变量英文名为Weight,本题首先做出原假设为的双边检验,再根据双边检验的P值与单边检验的P值之间的关系,我们可以将三种检验同时进行,并且综合分析三种情况后作出判断。 (i)双边检验()。 在SAS中做方差的卡方检验结果如图4-2. Sample Statistics for WEIHGT N Mean Std. Dev. Variance ----------------------------------------------- 16 46.5 2.6583 7.0667 Hypothesis Test Null hypothesis: Variance of WEIGHT = 4 Alternative: Variance of WEIGHT^=4 Chi-square Df Prob ----------------------------------------------- 26.500 15 0.0661 图4-2 检验的结果 从图中软件的计算结果我们可以知道原假设的值为,在的显著性水平之下,所以不能拒绝原假设存在。 (ii)右边检验()。 由于自由度为15的分布中位数为14.339,由于,不能拒绝左边检验的原假设。 综上,我们可以认为包装药材重量的方差值大于等于4,即认为现在包装机工作状态不够稳定,需要维修。 例6 从机械厂的两台机器所加工的相同零件中,分别抽出8个和9个样品,经过测量得到的尺寸如表4-3所示,试检验两台机械所加工零件的稳定性哪个较好?() 表4-3 两台机器所加工同的相同零件的尺寸(单位:厘米) A机床 6.25 5.78 5.88 5.76 5.85 5.79 6.48 5.85 B机床 6.08 6.25 5.94 5.94 5.79 6.03 5.85 6.1 5.93 分析与解答 设尺寸变量名为Y,A机床加工该零件尺寸的方差为,B机床加工该零件尺寸的方差。本题首先做原假设为的双边检验,再根据检验P值与单边检验P值的关系,将三种检验同时进行,并进行综合分析作出判断。 (i)双边检验()。 在SAS中做两总体方差比F检验结果如图4-3. 从图中软件计算结果可以知道原假设的值为0.0897,在0.05的显著水平之下,所以不能拒绝原先的假设。 (ii)右边检验()。 由于自由度为(7,8)的F分布中位数为0.988,F=3.53>,,拒绝右边检验的原假设。 (iii)左边检验()。 由于,不能拒绝左边检验的原假设。 综上,我们可以认为A机床加工的零件尺寸的方差不比B机床加工的零件尺寸的方差小,即B机床加工的零件比A机床加工的零件尺寸更加稳定。 Sample Statistics Y Group N Mean Std. Dev. Variance ---------------------------------------------------- A 8 5.955 0.2635 0.069457 B 9 5.99 0.1404 0.0197 Hypothesis Test Null hypothesis: Variance 1 / Variance 2= 1 Alternative Variance 1 / Variance 2^=1 -Degrees of Freedom- F Numer. Denom. Pr>F --------------------------------------------- 3.53 7 8 0.0897 图4-3 F检验结果 例7在士兵射实弹射击训练中,某士兵每次击中靶子的概率为,在连续射击次后,一次都没有击中靶子的概率为。如果这名士兵每次击中靶的概率为正常水平,那么一次没有击中靶的概率为小概率事件,即。这个时候我们就可以做出两个相互对立的假设,即,如果成立,则士兵每次击中靶的概率是不正确的。其对立假设成立时,则可以认为这名士兵击中靶的概率是正确的。,若为第一次击中靶子前所需的次数,那么服从几何分布,可以记作。若在第一次击中靶子之前已经有次没有击靶子,则检验 对。 解:因为,所以它概率的分布为: 它的分布函数为: 显而易见,为的递增函数,所以是的某个检验统计量。又因为原假设,所以在原假设成立的基础上,越小那么拒绝: 的条件就越充分,所以这个实验的检验值为: ,上式中的为的观察值。由于值大于0.01,故这名士兵每次射击的中靶概率不属于正常水平。 5. P-值法的优势 值法与临界值法处理问题的思路方向不同。值法的核心是计算出样本值或者更极端值的概率,然而临界值法则侧重于与比较检验统计量的值与临界值的差值的大小。P-值法与临界值法相比具有许多优势。 1.值法使用方便。 在统计推断的内容中,只要是涉及到假设检验的相关问题,无论是涉及参数的假设检验(如方差分析或者回归分析等),还是涉及非参数的假设检验(如尺度检验或者总体分布的检验等),统计分析软件均能方便地给出值,从而可以很快捷地得出是否拒绝的结论。 2.值法所得到的结论更准确。 在值法中,值本质上是在拒绝时犯弃真错误的概率。事实上,在利用值法作检验时,对于任何大于等于的显著性水平,但确切的犯弃真错误的概率并不清楚。因此,值法所得到结论更加准确无误。 结束语 在对比传统的临界值法后引出P值法的准确定义。再在给出单双边检验P值的计算公式的基础上掌握统计推断中双边检验P值与单边检验P值的关系,不仅可以更加灵活地使用统计软件解决实际问题,而且可以让三种检验同时进行使推断结果更加乐观,符合实际。并可从实际生活的应用中体会会出P值法的方便和所得结论的准确性。 参考文献 [1] 陈希孺. 概率论与数理统计[M]. 中国科学技术大学出版社, 第1版.2009: 180-232 [2] 魏宗舒. 高等学校教材•概率论与数理统计教程[M]. 高等教育出版社, 第2版. 2010: 313-342 [3] 郭跃华. 概率论与数理统计[M].高等教育出版社; 第1版.2011:250-270 [4] 李从珠. 概率论与数理统计[M].北京:中国工商业出版社.2002:256-312 [5] Prem S Mann.Introductory statistica[M].美国:Johns Wiley & Son,2004:190-243 [6] 吴喜之. 非参数统计[M]. 北京: 中国统计出版社, 1999: 312-364 [7] 贾俊平, 金勇进. 统计学[M]. 北京: 中国人民大学出版社, 2004: 190-232 [8] 韩志霞,张玲.P值检验和假设检验[J].边疆经济与文化,2006,(4): 62-63 [9] 攀冬梅,假设检验中的P值[J].郑州经济管理干部学研学报,2002,(4): 70-71 [10] 汪远征, 徐雅静. SAS软件与统计应用教程[M].北京: 机械工业出版社, 2007; 198-234. [11] 薛薇, SPSS统计分析方法及应用[M]. 北京:电子工业出版社,2004: 247-285 [12]Gerald Keller, Brian Warrack. Statistics for management and economics [M]. 王琪延, 赫志敏等译. 北京: 中国人民大学出版社, 2006: 312-367 [13] 谢明文. 关于单侧检验拒绝的证明及假设检验的概率实质[J].北京:数学的实践与认识, 2004(10): 99-103 [14] 程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2005: 276-345 [15] 王嘉澜. 数理统计中关于假设检验问题的几个要点问题[J]. 高等理科教育, 2005, 23(3): 54-58
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服