1、对比实验 欢迎光临6sigma世界1.统计基础知识2.参数估计3.假设检验4.对比实验报告编写和练习课程进程为什么要学习对比实验许多的问题需要就某些参数作出接受或拒绝的决定,这说明是一个假设。它代表把一个实务的问题演绎成统计学上的问题。而这个决策过程便称为:Hypothesis Testing我们把实现假设检验的过程成为对比实验。统计学上的测试能为我们就问题作出客观解说,相比较以前,我们只能作出主观的解说。这是后续学习内容的基础。统计基础知识第一单元总体(Population):在统计问题中,我们把研究对象的全体成为总体个体:构成总体的每个成员称为个体样本(Sample):从总体中抽取部分个体
2、所组成的集合称为样本样品:样本中的个体称为样品样本容量:样品的个数称为样本容量,常用n表示1.1总体和样本样本随机样本(Random sample):能够被推广应用于更大的总体的样本。总体的每个个体有一个已知的(有时是相等的)机会被包含在该样本中。简单随机样本(Simple random sample):1、同一性:样本与总体有同样的分布2、独立性:如果给定第一个事件,无论它的结果是什么,第二个事件的机会都一样。1.2统计量和抽样分布统计量:不含未知参数的样本函数称为统计量。抽样分布:统计量的分布称为抽样分布。有序样本:是从总体X中随机抽取的容量为n的样本,将它们的观测值从小到大排序,这便是有
3、序样本。统计推断过程统计学的主要任务:1、研究总体是什么分布?2、这个总体(即分布)的均值、方差是多少?样样本本总体总体样本统计量例如:样本均值、方差总体总体均值、均值、方差方差抽样1.2常用统计量描述中心位置的统计量:1、众数(mode):一个变量的众数是指出现次数最多的值,不过它不一定唯一。2、中位数:3、均值(mean):1.2常用统计量描述数据分散程度的统计量:1、极差(range):2、方差(variance)3、标准差(standard deviation):4、标准误差(standard error):是很多不同样本的均值的标准差。5、变异系数:1.3正态分布正态分布:1.3正态
4、分布标准正态分布:它是特殊的正态分布,服从标准的正态分布的随机变量记为z,概率密度函数记为(z)1.3正态分布标准正态分布的变换:1.3正态分布标准正态分布的分位数:0.975是随机变量z不超过1.96的概率1.96是标准正态分布N(0,1)的0.975的分位数,记为z0.9750.9750.0251.4常用的抽样分布正态样本均值的分布:=10=10=10=10=10=10X X X X X Xn n n n=4=4=4=4X Xn n n n=16=16=16=16总体分布总体分布抽样分布抽样分布1.4常用的抽样分布t分布:X X X X X Xt t 分布与正态分布的比较分布与正态分布的比
5、较正态分布正态分布t t 分分布布t t t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)1.4常用的抽样分布F分布:设X1,X2,Xn是来自正态总体N(1,12)的一个样本,Y1,Y2,Yn是来自正态总体N(2,22)的一个样本,且相互独立,则:将F(n-1,m-1)称为第一自由度为(n-1),第二自由度为(m-1)的F分布1.4常用的抽样分布F分布:F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)参数估计第二单元2.1点估计点估计的概念(point estimation):用
6、样本均值估计总体均值用样本方差估计总体方差用样本标准差估计总体标准差2.2区间估计区间估计的概念(interval estimate):置信区间(confidence interval):,则称这种置信区间为等尾置信区间。2.2区间估计 置信区间下限值1-aa/2a/2x 置信区间上限值点估计与区间估计的区别:我是意见是这个值是我是意见是这个值是10,但误差在但误差在1之间。之间。2.2区间估计2.2区间估计置信水平的概念:是的置信水平为1-的置信区间。它的含义是能盖住未知参数的概率为1-。置信区间量化了数据的不定性。2.2区间估计总体均值置信区间的计算:已知:未知:2.2区间估计2分布:方差
7、置信区间的计算:2.2区间估计置信区间的长度:1、大的样本产生较短的区间,小的样本产生较长的区间。2、低的置信水平产生较短的区间,高的置信水平产生较长的区间。N=100N=200N=300N=400N=500ExercisesX=sXnDistribution of Sampling AveragesXX研究草莓酱的重量是多少?答案:=95的置信区间假设检验第三单元3.1假设检验问题例:草莓酱的净重服从正态分布N(,2),6月份从产品中随机抽取50瓶称重的平均重量为180.5克,5月份从产品中随机抽取50瓶称重的平均重量为179.6克,,问从总体上是否重量比原来少了?1、这不是一个参数估计问题
8、2、要求对6-5=0作出回答:是与否3、这类问题被称为统计假设检验问题估计的主要任务是找参数值等于几;假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值3.2定义假设H0和HaH0要判断0.9克这个值是否超出了样本变换所能造成的差异的范围,我们先要问一问在总体均值相等的情况下,样本均值会发生什么情况,即是否两个均值的差等于0,在统计学上被称为零假设(null hypothesis)之所以用零来修饰假设,其原因是假设的内容总是没有差异或没有改变3.2定义假设H0和HaHA零假设其逻辑上的反面假设是“两个参数有区别”。这种反面假设称为备择假设(alternative hypothesis)。
9、当零假设所提问的问题被否定时,备择假设的答案就是正确的。如果样本数据能证明对于零假设提出的问题应该否定,那么我们就拒绝(reject)零假设而倾向于备择假设。3.3怎样回答零假设所提出的问题概率:p-值p-值是当零假设正确时,得到所观测的数据或更极端的数据的概率,这个概率称为p-值(p-value)。当p-值小到以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。p-值越小,拒绝零假设的理由就越充分。注意:有时错误以为p-值与零假设对错的概率有关,但这是不可能的.p-值指的是关于数据的概率。p-值告诉我们在某总体的许多样本中,某一类数据出现的经常程度。3.3怎样回答零假设所提
10、出的问题假设检验机制:为了求p-值,统计理论指出要把观测到的0.9这个样本均值之差变换成标准得分。标准得分:0.0H00.00.510.9观测到的差观测到的差样本均值的差样本均值的差标准得分标准得分2.142 p-值0.03473.3怎样回答零假设所提出的问题假设检验机制:t值等于2.142的概率是0.0347,因此两个样本均值之差等于0.9的概率也是0.0347,换句话说就是如果两总体均值相等的话,从均值相等的总体中抽取200个样本两两相减所得之差只有3.47个样本的样本均值相差在0.9,是小概率(0.05)事件,我们拒绝零假设。H00.00.510.9观测到的差观测到的差样本均值的差样本均
11、值的差标准得分标准得分2.142 p-值0.03473.4显著水平显著水平:我们不是在数据收集完毕之后计算p-值,而是在收集数据以前就已经确定好的小概率来构造一个区间。当样本数据落入这个区间时就拒绝零假设。这个小概率 称为检验的显著水平(significant level),通常选0.05.一个检验的显著水平是抽样所得的数据拒绝了本来是正确的零假设的概率。拒绝域:当样本数据落入这个区间时就拒绝零假设,那么这个区间就称为拒绝域。临界值(critical values):拒绝域的边界所对应的标准得分的值。对于双边检验,样本统计量的临界值是两个值。3.4显著水平HoHoHo值值值临界值临界值临界值临
12、界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平3.5风险(和)sX=sXnDistribution of Sampling AveragesXX3.5和的关系sX=sXnDistribution of Sampling AveragesXX你不能同时减你不能同时减少两类错误少两类错误!3.6假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进行方差的F检验5、计算检
13、验统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断案例1例:草莓酱的净重服从正态分布N(180,22),5月份随机抽取50罐称重的平均重量为179.6克,问是否符合标准?平均净重:179.6g3.7One to Standard的问题是假设检验的特例:其中一个 已知3.7One to Standard的问题计算标准得分:已知时,使用z统计量计算 未知时,使用t统计量计算双侧问题HoHoHo值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布抽样分布抽样分
14、布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平3.7One to Standard的问题单侧左检验 表格值表格值(临界值临界值)拒绝范围拒绝范围 无法拒绝无法拒绝HOHa:(大于大于)3.7One to Standard的问题单侧右检验拒绝范围拒绝范围 无法拒绝无法拒绝HO 表格值表格值(临界值临界值)Ha:(小于小于)3.7One to Standard的问题JMP中的操作3.7One to Standard的问题JMP中的操作3.7One to Standard的问题JMP中的操作案例2例:草莓酱的净重服从正态分布N(,2),6月份从产品中随机抽取50瓶称重
15、的平均重量为180.5克,5月份从产品中随机抽取50瓶称重的平均重量为179.6克,,问从总体上是否重量比原来少了?假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进行方差的F检验5、计算检验统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断3.8One to One的问题建立假设:假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进行方差的F检验5、计算检验统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断假设检验的步骤1、建立假设2、数据独立性检查3、数
16、据正态性检查4、如为One to One问题进行方差的F检验5、计算检验统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断3.8One to One的问题Fcrit F检验:假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进行方差的F检验5、计算检验统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断3.8One to One的问题 相等时t的计算:Sp为s1,s2的加权平均,称为两个样本的联合方差。3.8One to One的问题 不等时t的计算:3.8One to One的问题假设检验的步骤1、建立
17、假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进行方差的F检验5、计算检验统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断3.8One to One的问题HoHoHo值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进行方差的F检验5、计算检验
18、统计量6、给出显著性水平,通常=0.057、定出临界值,写出拒绝域8、判断3.8One to One的问题因为因为Prob0.03470.05,所以我们拒绝零假设,所以我们拒绝零假设,接受备择假设!接受备择假设!3.8One to One的问题不等不等实验和报告编写第四单元练习(30分钟)例:两家供应商的硬盘性能指标数据,问是否这两个供应商有显著差异?谢谢大家!课程开发人员:孟繁一、高武附录假设检验术语1.零假设(Ho)-不存在变化或差异的命题。如果没有充分的证据拒绝它,就假设这一命题是真的。2.备择假设(Ha)-存在变化或差异的命题。如果拒绝Ho,则认为这一命题是真的。3.一类错误-当Ho
19、实际上为真时而被拒绝所产生的错误,或是接受存在差异、但事实上却没有差异时所犯的错误。4.二类错误-当Ho 实际上为伪而没有被拒绝所产生的错误,或是接受没有差异、但事实上存在差异时所犯的错误。假设检验术语5.风险-出现第一类错误的最大风险或机率。这个机率总是大于零,通常为5%。研究人员决定拒绝Ho 所可以接受的最大风险。6.风险-出现第二类错误出现的风险或机率,或者是说,忽略了问题的有效处理或解决方案7.显著水平-。8.显著性差异-用于描述统计假设检验结果的术语,即差异大得不能合理地归因于偶然因素假设检验术语检验统计值-标准化数值(z、t、F等),代表Ho 的可行性,它以已知的方式分布,因此可以确定这种观察值出现的机率。通常,Ho 的可能性越高,则检验统计值的绝对值就越小,在这种分布范围内观察到这个值的机率也就越大
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100