收藏 分销(赏)

假设检验.ppt

上传人:a199****6536 文档编号:2049114 上传时间:2024-05-14 格式:PPT 页数:106 大小:2.55MB
下载 相关 举报
假设检验.ppt_第1页
第1页 / 共106页
假设检验.ppt_第2页
第2页 / 共106页
假设检验.ppt_第3页
第3页 / 共106页
假设检验.ppt_第4页
第4页 / 共106页
假设检验.ppt_第5页
第5页 / 共106页
点击查看更多>>
资源描述

1、统计假设检验统计假设检验假设检验假设检验第一节、假设检验概述第一节、假设检验概述第二节、总体平均数的假设检验(第二节、总体平均数的假设检验(Z、T)第三节、总体比率的假设检验(第三节、总体比率的假设检验(P)第四节、总体方差的假设检验(卡方、第四节、总体方差的假设检验(卡方、F)第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则 Ronald Ronald Aylmer Fisher,Aylmer Fisher,英国英国著名的统计学家,遗传学家,现著名的统计学家,遗传学家,现代

2、数理统计的奠基人之一。代数理统计的奠基人之一。他在抽样分布理论、相关回他在抽样分布理论、相关回归分析、多元统计分析、最大似归分析、多元统计分析、最大似然估计理论,方差分析和假设检然估计理论,方差分析和假设检验有很多的建树。验有很多的建树。女士品茶女士品茶20世纪世纪20年代后期在年代后期在英国剑桥英国剑桥一个夏日的下午,一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。坐在户外的桌旁享用下午的奶茶。奶茶奶茶一般是由牛奶和茶混合而成的,调制时候可一般是由牛奶和茶混合而成的,调制时候可以先倒茶后倒牛奶,也可以先倒牛奶后

3、倒茶。这以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。制出来的奶茶。那么如何检验这位女士的说法?为此那么如何检验这位女士的说法?为此Fisher进行进行了研究,从而提出了假设检验的思想。了研究,从而提出了假设检验的思想。1、推推广广素素质质教教育育以以后后,教教学学效效果果是是不不是是有有所所提提高高?(教育统计教育统计)2、某种新胃药是否比以前更有效?(某种新胃药是否比以前更有效?(卫生统计卫生统计)3、醉醉酒酒驾驾车车认认定定为为刑刑事事犯犯罪罪后后是是否否交交通通事事故故会会减减少少?(司法统计

4、司法统计)4、如何检测某批种子的发芽率?(、如何检测某批种子的发芽率?(农业统计农业统计)5、海海关关工工作作人人员员如如何何判判定定某某批批产产品品能能够够通通关关?(海海关统计关统计)6、红楼梦红楼梦后后40回作者的鉴定(回作者的鉴定(文学统计文学统计)。)。7、民间借贷的利率为多少?(、民间借贷的利率为多少?(金融统计金融统计)8、兴奋剂检测(、兴奋剂检测(体育统计体育统计)假设检验的应用假设检验的应用 1 1、假设检验的基本思想、假设检验的基本思想 为为研研究究某某山山区区的的成成年年男男子子的的脉脉搏搏均均数数是是否否高高于于一一般般成成年年男男子子脉脉搏搏均均数数,某某医医生生在在

5、一一山山区区随随机机抽抽查查了了25名名健健康康成成年年男男子子,得得其其脉脉搏搏均均数数x为为74.2次次/分分,标标准准差差为为6.0次次/分分。根根据据大大量量调调查查已已知知一一般般健健康康成成年年男男子子脉脉搏搏均均数数为为72次次/分分,能能否否据据此此认认为为该该山山区区成成年年的的脉脉搏搏均数均数高于一般成年男子的脉搏均数高于一般成年男子的脉搏均数0?问问题题1:造造成成这这25名名男男子子脉脉搏搏均均数数高高于于一一般般男男子子的的原原因因是是什么?什么?问题问题2 2、怎样判断以上哪个原因是成立的?、怎样判断以上哪个原因是成立的?若若x x与与0 0接近,其差别可用抽样误差

6、解释,接近,其差别可用抽样误差解释,x x来自于来自于0 0;若若x x与与0 0相相差差甚甚远远,其其差差别别不不宜宜用用抽抽样样误误差差解解释释,则则怀怀疑疑x x不不属于属于0 0 。由资料已知样本均数与总体均数不等,原因有二:由资料已知样本均数与总体均数不等,原因有二:(1 1)两者非同一总体,即两者差异由地理气候等因素造成,)两者非同一总体,即两者差异由地理气候等因素造成,也就是可以说高山成年人的脉搏比一般人的要高;也就是可以说高山成年人的脉搏比一般人的要高;(2 2)两者为同一总体,即两者差异由抽样误差造成)两者为同一总体,即两者差异由抽样误差造成。检验如下假设:检验如下假设:原假

7、设原假设:高山成年人脉搏与一般人的脉搏没有差异:高山成年人脉搏与一般人的脉搏没有差异:=0 0备择假设备择假设:高山成年人脉搏与一般人的脉搏有差异:高山成年人脉搏与一般人的脉搏有差异:0 0假设检验的基本概念假设检验的基本概念1.概念概念事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设然然后后利利用用样样本本信信息息来来以以一一定定的的概概率率判判断断原原假假设设是是否否成成立立参数检验和非参数检验(第参数检验和非参数检验(第8章的内容)章的内容)2.作用作用一一般般是是对对有有差差异异的的数数据据进进行行检检验验,判判断断差差异异是是否否显显著著(概率)(概率)如如果

8、果通通过过了了检检验验,不不能能拒拒绝绝原原假假设设,说说明明没没有有显显著著差差异异,那么这种差异是由抽样造成的那么这种差异是由抽样造成的如如果果不不能能通通过过检检验验,则则拒拒绝绝原原假假设设,说说明明有有显显著著差差异异,这种差异是由系统误差造成的这种差异是由系统误差造成的.证伪不能存真证伪不能存真.第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则二、假设检验的步骤二、假设检验的步骤1、根据具体的问题,建立原假设和备择假设、根据具体的问题,建立原假设和备择假设2、构造

9、一个合适的统计量,计算其抽样分布、构造一个合适的统计量,计算其抽样分布 (均值检验)(均值检验)3、给定显著水平、给定显著水平 和确定临界值和确定临界值。显著水平显著水平 通常取通常取0.1、0.05或或0.01。在确定了显著水平在确定了显著水平后,根据统计量的分布就可以确定找出接受区域和拒绝后,根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值。区域的临界值。4、根据样本的值计算统计量的数值并作出决策。、根据样本的值计算统计量的数值并作出决策。如果如果统计量的值落在拒绝域中统计量的值落在拒绝域中,那么就没有通过检验,那么就没有通过检验,说明有显著差异,拒绝原假设。说明有显著差异,拒绝原

10、假设。如果如果统计量的值落在接受域中统计量的值落在接受域中,通过了假设检验,说明,通过了假设检验,说明这种差异是由于抽样造成,这个样本不能拒绝原假设。这种差异是由于抽样造成,这个样本不能拒绝原假设。1、原假设与备择假设、原假设与备择假设原假设原假设(null hypothesis):一般研究者想收集证据予以反对一般研究者想收集证据予以反对的假设。表示为的假设。表示为H H0 0备择假设备择假设(alternative hypothesis):一般研究者想收集证据一般研究者想收集证据予以支持的假设。表示为予以支持的假设。表示为H H1 1由于假设检验中只有在小概率事件发生的情况下才拒绝原由于假设

11、检验中只有在小概率事件发生的情况下才拒绝原假设,因此在假设检验过程中是保护原假设的。假设,因此在假设检验过程中是保护原假设的。有三种形式:有三种形式:(1)双侧检验双侧检验 H0:0,H1:0(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0:0,H1:0(提高,增加)(提高,增加)采用哪种形式要根据实际问题。采用哪种形式要根据实际问题。某某种种饮饮料料的的易易拉拉罐罐瓶瓶的的标标准准容容量量为为335335毫毫升升,为为对对生生产产过过程程进进行行控控制制,质质量量监监测测人人员员定定期期对对某某个个分分厂厂进进行行检检查查,确确定定这这个个分分厂厂生生产产的的易易拉拉罐罐是是

12、否否符符合合标标准准要要求求。如如果果易易拉拉罐罐的的平平均均容容量量大大于于或或小小于于335335毫毫升升,则则表表明明生生产产过过程程不不正正常常。试试陈陈述述用用来来检检验验生生产产过过程程是否正常的原假设和备择假设是否正常的原假设和备择假设解解解解解解:研研研研究究究究者者者者想想想想收收收收集集集集证证证证据据据据予予予予以以以以证证证证明明明明的的的的假假假假设设设设应应应应该该该该是是是是“生产过程不正常生产过程不正常生产过程不正常生产过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0:335ml

13、335ml H H1 1:335ml335ml 消消费费者者协协会会接接到到消消费费者者投投诉诉,指指控控品品牌牌纸纸包包装装饮饮料料存存在在容容量量不不足足,有有欺欺骗骗消消费费者者之之嫌嫌。包包装装上上标标明明的的容容量量为为250毫毫升升。消消费费者者协协会会从从市市场场上上随随机机抽抽取取50盒盒该该品品牌牌纸纸包包装装饮饮品品进进行行假假设设检检验验。试陈述此假设检验中的原假设和备择假设。试陈述此假设检验中的原假设和备择假设。解解解解:消消消消费费费费者者者者协协协协会会会会的的的的意意意意图图图图是是是是倾倾倾倾向向向向于于于于证证证证实实实实饮饮饮饮料料料料厂厂厂厂包包包包装装装

14、装饮料小于饮料小于饮料小于饮料小于250ml 250ml。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0:250ml 250ml H H1 1:250ml H H1 1成立成立 小概率事件发生小概率事件发生 拒绝拒绝H H0 0成成立立没有发现矛盾没有发现矛盾 证明失败证明失败小概率事件没有发生小概率事件没有发生 不能不能拒绝拒绝H H0 0成立成立 小概率事件小概率事件在一次实验中不可能发生的事件,如果发生了,在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。那么就可以拒绝原来的假设。泰力布:等待黑天鹅的

15、人泰力布:等待黑天鹅的人显著性水平和拒绝域显著性水平和拒绝域(单侧检验单侧检验 )0 0临界值临界值 样本统计量样本统计量拒绝拒绝拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平拒绝域拒绝域接受域接受域显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样

16、本统计量显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量【例2】一一种种罐罐装装饮饮料料采采用用自自动动生生产产线线生生产产,每每罐罐的的容容量量是是255ml,标标准准差差为为5ml,服服从从正正态态分分布布。换换了了一一批批工工人人后后,质质检检人人员员在在某某天天生生产产的的饮饮料料中中随随机机抽抽取取了了16罐罐进进行行检检验验,测测得得每每罐罐

17、平平均均容容量量为为257.2ml。取取显显著著性性水水平平=0.05,检检验验该天生产的饮料容量是否增加了?该天生产的饮料容量是否增加了?右侧检验右侧检验右侧检验右侧检验H0:255 H1:255z z0 0拒绝拒绝H H0 00.050.051.6451.645决策:拒绝决策:拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料与与标标准准有有显显著著差差异异,可可以认为换工人后容量增加了。以认为换工人后容量增加了。显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 0

18、0抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝拒绝拒绝H HH0 00第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检

19、验的规则三、两类错误和假设检验的规则三、两类错误和假设检验的规则1.第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设原假设为真时拒绝原假设第第类错误的概率记为类错误的概率记为 被称为显著性水平被称为显著性水平2.第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设原假设为假时未拒绝原假设第第类错误的概率记为类错误的概率记为 (Beta)(Beta)H H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪有罪有罪错误错误正确正确无罪无罪正确正确错误错误H0 检验检验决策决策实际情况实际情况H0为真为真H0

20、为假为假拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-(1-)未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误()假设检验就假设检验就假设检验就假设检验就好像一场审判过程好像一场审判过程好像一场审判过程好像一场审判过程统计检验统计检验统计检验统计检验统计检验统计检验过程过程过程过程过程过程H H0 0:药品为真药药品为真药药品为真药药品为真药假设检验中的两类错误之间的关系假设检验中的两类错误之间的关系真药真药假药假药拒绝拒绝拒绝域大拒绝域大 大大弃真弃真正确正确不拒绝不拒绝 正确正确接受域小接受域小 小小取伪取伪宁可错杀三千,不可放过一个。宁可错杀三千,不可放过一个。H H0

21、0:某次面试为好机会某次面试为好机会某次面试为好机会某次面试为好机会好机会好机会不好的机不好的机会会拒绝拒绝(不去不去)拒绝域小拒绝域小 小小正确正确不拒绝不拒绝(去去)正确正确接受域大接受域大 大大 错误和错误和 错误的关系错误的关系 你不能同时减少你不能同时减少两类错误两类错误!只能只能增加样本容量。增加样本容量。和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小就小 四、置信区间与假设检验之间的关系四、置信区间与假设检验之间的关系1 1、根据置信度、根据置信度1-1-构造置信区间,如果统计量落在构造置信区间,如果统计量落在置信区间中,那么接受原假设,如果不在置信区间中

22、,置信区间中,那么接受原假设,如果不在置信区间中,那么拒绝原假设。那么拒绝原假设。2 2、根据显著水平、根据显著水平 ,可以构建置信度为,可以构建置信度为1-1-的置的置信区间。信区间。一个总体的检验一个总体的检验Z 检验检验(单侧和双侧)(单侧和双侧)t 检验检验(单侧和双侧)(单侧和双侧)Z 检验检验(单侧和双侧)(单侧和双侧)检验检验(单侧和双侧)(单侧和双侧)均值均值一个总体一个总体比例比例方差方差第二节第二节 总体均值的检验总体均值的检验一、单个总体均值的检验一、单个总体均值的检验(Z TZ T)二、二、两个总体均值检验(等方差、异方差)(等方差、异方差)三、两个非正态总体均值之差的

23、检验(成对检验)一、单个正态总体均值的检验一、单个正态总体均值的检验确定检验统计量的因素:确定检验统计量的因素:1 1、样本容量的大小、样本容量的大小 2 2、总体分布形状、总体分布形状 3 3、总体方差是否已知、总体方差是否已知主要情形(主要情形(6 6种)种)1.1.正态总体(方差未知,且为小样本,正态总体(方差未知,且为小样本,1 1种种)2.2.正态总体(方差已知,小样本,正态总体(方差已知,小样本,1 1种种)3.3.大样本(不论总体是否正态,不论方差是否已大样本(不论总体是否正态,不论方差是否已知,知,4 4种种)三种假设检验的形式三种假设检验的形式(双侧,左侧和右侧)(双侧,左侧

24、和右侧)(一)总体平均数的检验(小样本,正态,方差已(一)总体平均数的检验(小样本,正态,方差已知知)1.假定条件假定条件总体服从正态分布总体服从正态分布小样本小样本(n n 30)30),但是总体方差已知,但是总体方差已知2.检验统计量检验统计量某某机机床床厂厂加加工工一一种种零零件件,根根据据经经验验知知道道,该该厂厂加加工工零零件件的的椭椭圆圆度度近近似似服服从从正正态态分分布布,其其总总体体均均值值为为 0 0=0.081=0.081mmmm,总总体体标标准准差差为为=0.025 0.025。今今换换一一种种新新机机床床进进行行加加工工,抽抽取取n n=200=200个个零零件件进进行

25、行检检验验,得得到到的的椭椭圆圆度度为为0.0760.076mmmm。试试问问新新机机床床加加工工零零件件的的椭椭圆圆度度的的均均值值与与以以前前有有无无显显著著差差异异?(0.050.05)H0:=0.081,H1:0.081,=0.05,n=200临界值临界值(s)(双侧检验双侧检验)Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025.025检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:拒绝拒绝拒绝拒绝H H0 0结论结论结论结论:有证据表明新机床加工的零有证据表明新机床加工的零有证据表明新机床

26、加工的零有证据表明新机床加工的零件的椭圆度与以前有显著差异。件的椭圆度与以前有显著差异。件的椭圆度与以前有显著差异。件的椭圆度与以前有显著差异。均值的单侧均值的单侧 Z Z 检验检验左侧:左侧:左侧:左侧:H H0 0:0 0 0 0 H H1 1:0 0 0 0必须必须必须必须显著地显著地显著地显著地大于大于大于大于 0 0 0 0,小的小的小的小的值满足值满足值满足值满足 H H0 0,不能拒绝,不能拒绝,不能拒绝,不能拒绝Z Z0 0拒绝拒绝 H H0 0 根根据据过过去去大大量量资资料料,某某厂厂生生产产的的灯灯泡泡的的使使用用寿寿命命服服从从正正态态分分布布NN(1020(1020,

27、1001002 2)。现现从从最最近近生生产产的的一一批批产产品品中中随随机机抽抽取取1616只只,测测得得样样本本平平均均寿寿命命为为10801080小小时时。试试在在0.050.05的的显显著著性性水水平平下下判判断断这这批批产产品的使用寿命是否有显著提高?品的使用寿命是否有显著提高?(0.05)0.05)右侧检验右侧检验右侧检验右侧检验H0:1020 H1:1020z z0 0拒绝拒绝H H0 00.050.051.6451.645决策:决策:在在在在 0.050.05的水平上的水平上的水平上的水平上拒绝拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料

28、与与标标准准有有显显著著差差异异,可可以认为试用寿命提高了。以认为试用寿命提高了。总体均值的检验总体均值的检验(z检验检验)(P 值的计算与应用值的计算与应用)第1步:进进入入Excel表表格格界界面面,直直接接点点击击“f(x)”(粘粘贴贴 函数函数)第2步:在在函函数数分分类类中中点点击击“统统计计”,并并在在函函数数名名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值2.4录入,得到的函数值为录入,得到的函数值为 0.9918 P值值=1-0.9918=0.0082 P值小于值小于,故拒绝,故拒绝H0总体均值的检验总体均值的检验(z检

29、验检验)(P 值的图示值的图示)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布P P P=0.00820.0082 0 0 01.6451.6451.645 0.050.050.05拒绝拒绝拒绝H HH0 001-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=2.4=2.4=2.4P P P 值值值【例3】一一种种罐罐装装饮饮料料采采用用自自动动生生产产线线生生产产,每每罐罐的的容容量量是是255ml,标标准准差差为为5ml,服服从从正正态态分分布布。换换了了一一批批工工人人后后,质质检检人人员员在在某某天天生生产产的的

30、饮饮料料中中随随机机抽抽取取了了16罐罐进进行行检检验验,测测得得每每罐罐平平均均容容量量为为252.8ml。取取显显著著性性水水平平=0.05,检检验验该天生产的饮料容量是否减少了?该天生产的饮料容量是否减少了?左侧检验左侧检验左侧检验左侧检验H0:255 H1:255-1.64-1.64z z0 0拒绝拒绝H H0 00.050.05决策:在决策:在0.05水平上拒绝水平上拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料与与标标准准有有显显著著差差异异,可可以认为换工人后容量减少了。以认为换工人后容量减少了。总体均值的检验总体均值的检验(z检验检验)(P

31、 值的计算与应用值的计算与应用)第1步:进进入入Excel表表格格界界面面,直直接接点点击击“f(x)”(粘粘贴贴 函数函数)第2步:在在函函数数分分类类中中点点击击“统统计计”,并并在在函函数数名名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值-1.76录入,得到的函数值为录入,得到的函数值为 0.039204 P值值=0.039204 P值小于值小于,故拒绝,故拒绝H0总体均值的检验总体均值的检验(z检验检验)(P 值的图示值的图示)0 0 0-1.64-1.64-1.64 =0.05=0.05=0.05z z z拒绝拒绝拒绝H HH

32、0 00抽样分布抽样分布抽样分布抽样分布1-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=-1.76=-1.76=-1.76P P P 值值值P PP=.039204.039204 总体均值的检验规则总体均值的检验规则(正态,正态,小小样本,方差已知样本,方差已知)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:=0 0H1:0 0统计量统计量 已知已知拒绝域拒绝域P值决策值决策拒绝拒绝H0练习一练习一(二)总体平均数检验(小样本,正态,方差未知(二)总体平均数检验(

33、小样本,正态,方差未知*)1.假定条件假定条件总体服从正态分布总体服从正态分布小样本小样本(n n 30)30),但总体方差未知,但总体方差未知2.检验统计量检验统计量总体均值的检验总体均值的检验规则规则 (正态,方差未知,小样本情形正态,方差未知,小样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:0 0H1:0 0统计量统计量总体总体 未知未知拒绝域拒绝域P P值决策值决策拒绝拒绝H0【例1】某某机机器器制制造造的的肥肥皂皂厚厚度度规规定定为为5cm,假假设设肥肥皂皂厚厚度度服服从从正正态态分分布布。今今欲欲了了解解机机器器性

34、性能能是是否否良良好好,取取16块块肥肥皂皂为为样样本本,测测得得平平均均厚厚度度为为5.2cm,标标准准差差为为0.4cm。问问在在显显著水平为著水平为0.05的水平下,机器是否为良好?的水平下,机器是否为良好?双侧检验双侧检验双侧检验双侧检验H0:=5 H1:5决策决策:不能拒绝不能拒绝H0结结论论:认认为为该该机机器器还还是是良良好好的的,没没有充分的理由拒绝原假设。有充分的理由拒绝原假设。t t0 02.132.13-2.13-2.130.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025【例2】某某机机器器制制造造的的肥肥皂皂厚厚度度规规定定为为5cm,

35、假假设设肥肥皂皂厚厚度度服服从从正正态态分分布布。今今欲欲了了解解机机器器性性能能是是否否良良好好,取取16块块肥肥皂皂为为样样本本,测测得得平平均均厚厚度度为为5.2cm,标标准准差差为为0.4cm。问问在在显显著著水水平为平为0.05的水平下,肥皂的平均厚度是否偏高?的水平下,肥皂的平均厚度是否偏高?右侧检验右侧检验右侧检验右侧检验H0:5 H1:5决策决策:拒绝拒绝H0结论:认为肥皂的平均厚度偏高。结论:认为肥皂的平均厚度偏高。t(15)t(15)0 0拒绝拒绝H H0 00.050.051.7531.753P值值=0.031972=0.05,故不拒绝,故不拒绝H0 (三)总体均值的检验

36、(大样本(三)总体均值的检验(大样本)1.假定条件假定条件正态总体或非正态总体大样本正态总体或非正态总体大样本(n 30)2.使用使用 z检验统计量检验统计量 2 已知:已知:2 未知:未知:总体均值的检验规则总体均值的检验规则 (大样本情形大样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:=0 0H1:0 0H0:0 0H1:0 0统计量统计量 已知:已知:未知:未知:拒绝域拒绝域P P值决策值决策拒绝拒绝H0某某大大学学规规定定学学生生每每天天参参加加体体育育锻锻炼炼的的时时间间为为25分分钟钟。现现学学校校为为了了调调查查学学生生是是否否达达到到锻

37、锻炼炼标标准准,从从该该校校学学生生中中随随机机抽抽取取100人人,调调查查到到他他们们平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间为为24分分钟钟,标标准准为为5分分钟钟。试试以以5的的显显著著水水平平检检验验该该校校学学生生平平均均每每天天的的锻炼时间是否达到规定。锻炼时间是否达到规定。右侧检验右侧检验.H0:25,H1:25,=0.05,n=100决策:拒绝决策:拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:学学生的锻炼时间没有达到规定。生的锻炼时间没有达到规定。-1.64-1.64z z0 0拒绝拒绝H H0 00.050.05总体均值的检验总体均值的检验(z检验检验

38、)(P 值的计算与应用值的计算与应用)第1步:进进入入Excel表表格格界界面面,直直接接点点击击“f(x)”(粘粘贴贴 函数函数)第2步:在在函函数数分分类类中中点点击击“统统计计”,并并在在函函数数名名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值2录入,得到的函数值为录入,得到的函数值为 0.9925 P值值=(1-0.9925)=0.0075 P值远远小于值远远小于,故拒绝,故拒绝H0【例】一一种种罐罐装装饮饮料料采采用用自自动动生生产产线线生生产产,每每罐罐的的容容量量是是255ml,标标准准差差为为5ml。为为检检验验每每罐罐

39、容容量量是是否否符符合合要要求求,质质检检人人员员在在某某天天生生产产的的饮饮料料中中随随机机抽抽取取了了40罐罐进进行行检检验验,测测得得每每罐罐平平均均容容量量为为255.8ml。取取显显著著性性水水平平=0.05,检检验验该该天生产的饮料容量是否符合标准要求?天生产的饮料容量是否符合标准要求?z z0 01.961.96-1.961.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025双侧检验双侧检验.H0:=255,H1:255,=0.05,n=40决策:不拒绝决策:不拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该天生产的饮料符合标准要求

40、该天生产的饮料符合标准要求 总体均值的检验总体均值的检验(z检验检验)(P 值的计算与应用值的计算与应用)第1步:进进入入Excel表表格格界界面面,直直接接点点击击“f(x)”(粘粘贴贴 函数函数)第2步:在在函函数数分分类类中中点点击击“统统计计”,并并在在函函数数名名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值1.01录入,得到的函数值为录入,得到的函数值为 0.8437 P值值=2*0.8437-1=0.6874 P值远远大于值远远大于,故不能拒绝,故不能拒绝H0总体均值的检验总体均值的检验(大样本大样本)【例】一一种种机机床床

41、加加工工的的零零件件尺尺寸寸绝绝对对平平均均误误差差为为1.35mm1.35mm。生生产产厂厂家家现现采采用用一一种种新新的的机机床床进进行行加加工工以以期期进进一一步步降降低低误误差差。为为检检验验新新机机床床加加工工的的零零件件平平均均误误差差与与旧旧机机床床相相比比是是否否有有显显著著降降低低,从从某某天天生生产产的的零零件件中中随随机机抽抽取取5050个个进进行行检检验验。利利用用这这些些样样本本数数据据,检检验验新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差差与与旧旧机机床床相相比比是是否否有有显显著著降降低低?(=0.01)=0.01)左侧检验左侧检验50个零件尺寸的误

42、差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验总体均值的检验(大样本大样本)(例题分析例题分析)H0:1.35H1:1.35=0.01n=50临界值(c):检验统计量检验统计量检验统计量检验统计量:决策:拒绝决策:拒绝

43、H0结结论论:新新机机床床加加工工的的零零件件尺尺寸寸的的平平均误差与旧机床相比有显著降低均误差与旧机床相比有显著降低-2.33-2.33z z0 0拒绝拒绝H H0 00.010.01总体均值的检验总体均值的检验(z检验检验)(P 值的计算与应用值的计算与应用)第1步:进入进入Excel表格界面,直接点击表格界面,直接点击“f(x)”第2步:在在函函数数分分类类中中点点击击“统统计计”,并并在在函函数数名名的的菜菜单单下下选选择择“ZTEST”,然后确定,然后确定第3步:在所出现的对话框在所出现的对话框Array框中,输入原始数据所在区框中,输入原始数据所在区 域域;在;在X后输入参数的某一

44、假定值后输入参数的某一假定值(这里为这里为1.35);在;在 Sigma后输入已知的总体标准差后输入已知的总体标准差(若未总体标准差未若未总体标准差未 知则可忽略不填,系统将自动使用样本标准差代替知则可忽略不填,系统将自动使用样本标准差代替)第4步:用用1减去得到的函数值减去得到的函数值0.995421023 即为即为P值值 P值值=1-0.995421023=0.004579 P值值 5200 =0.05n=36临界值临界值(c):检验统计量检验统计量检验统计量检验统计量:拒绝拒绝H H0 0(P P=0.000088 =0.000088 =0.05)=0.05)改良后的新品种产量有显著提高

45、改良后的新品种产量有显著提高 决策决策决策决策:结论结论结论结论:z z0 0拒绝拒绝H H0 00.050.051.6451.645总体均值的检验总体均值的检验(z检验检验)(P 值的图示值的图示)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布P P P=0.0000880.0000880.000088 0 0 01.6451.6451.645 0.050.050.05拒绝拒绝拒绝H HH0 001-1-1-计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=3.75=3.75=3.75P P P 值值值二、二、两个总体均值平均数之

46、差的检验两个总体均值平均数之差的检验检验的类型:检验的类型:(1)双侧检验双侧检验 H0:1-2=D,H1:1-2 D;(2)左侧检验左侧检验 H0:1-2=D,H1:1-2 D如果如果D=0,那么检验类型简化为:,那么检验类型简化为:(1)双侧检验双侧检验 H0:1 2,H1:1 2(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0:1 2,H1:1 2(高)(高).两个总体均值之差的假设检验两个总体均值之差的假设检验假定条件,两个总体之间是独立的,假定条件,两个总体之间是独立的,情形情形(一一)两个两个总体都服从正态分布总体都服从正态分布,1 1,2 2已知已知情情形形(三三

47、)若若不不是是正正态态分分布布,两两者者都都是是大大样样本本(n n1 1 3030和和n n2 2 30)30)可以用正态分布来近似。可以用正态分布来近似。2 2、使用正态分布统计量、使用正态分布统计量 z z方差已知方差已知 方差未知用样本方差替代方差未知用样本方差替代两个总体均值之差的检验规则两个总体均值之差的检验规则(正态总体方差已知或者正态总体方差已知或者大大样本情形样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:1 1-00H1:1 1-0 0 H0:1 1-0 0H1:1 1-0 0统计量统计量 1 12,2 已知已知 1 12,2 未知未

48、知拒绝域拒绝域P值决策值决策拒绝拒绝H0 【例例】某某公公司司对对男男女女职职员员的的平平均均小小时时工工资资进进行行了了调调查查,独独立立抽抽取取了了具具有有同同类类工工作作经经验验的的男男女女职职员员的的两两个个随随机机样样本本,并并记记录录下下两两个个样样本本的的均均值值、方方差差等等资资料料如如右右表表。在在显显著著性性水水平平为为0.05的的条条件件下下,能能否否认认为为男男性性职职员员与与女女性性职职员员的的平平均均小小时时工工资存在显著差异?资存在显著差异?两个样本的有关数据两个样本的有关数据 男性职员男性职员女性职员女性职员n1=44n2=32 x1=75 x2=70S12=6

49、4S22=42.25H0:1 1-=0 H1:1 1-0结论:拒绝结论:拒绝H0,该公司男女职员的平均该公司男女职员的平均小时工资之间存在显著差异小时工资之间存在显著差异 ,性别是影响性别是影响性别是影响性别是影响工资的一个因素工资的一个因素工资的一个因素工资的一个因素。z0 01.96-1.960.0250.025拒绝拒绝 H0拒绝拒绝 H00.0250.025二、二、正态总体方差正态总体方差 未知但未知但 12=22*p假定假定条件条件n两个独立的小样本两个独立的小样本n两个两个总体都是正态分布总体都是正态分布n 12、22未知但相等,即未知但相等,即 12=22p检验检验统计量统计量其中

50、:其中:其中:其中:自由度自由度自由度自由度:两个总体均值之差的检验两个总体均值之差的检验规则规则(正态,方差未知,正态,方差未知,小小样本情形样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0:1 1-00H1:1 1-0 0 H0:1 1-0 0H1:1 1-0 0统计量统计量总体总体 未知未知拒绝域拒绝域P值决策值决策拒绝拒绝H0 【例例例例】甲甲、乙乙两两台台机机床床同同时时加加工工某某种种同同类类型型的的零零件件,已已知知两两台台机机床床加加工工的的零零件件直直径径(单单位位:cm)cm)分分别别服服从从正正态态分分布布,并并且且有有 12=22。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服