第四讲估计与检验.ppt_咨信网zixin.com.cn

资源描述

*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四讲估计与统计检验,沈建荣,jrshen,一、区间估计,总体均值区间估计,总体均值置信水平为,100(1-,)%,的置信区间为：,注意：,1,、估计成立的条件是：样本必须是随机、独立的；,2,、使用,t,分布表时，要求总体必须是近似正态的，需对样本作正态性检验；,3,、置信水平不是概率（置信区间是确定的而不是随机的），可以认为以置信水平（如,95%,）相信总体均值在执行区间内；或是说，置信水平这一计算方法可以使得置信区间以,95%,的概率覆盖总体均值。,大样本下：,方差未知：,或小样本下,例,1,某小组随机抽样调查了,250,户家庭的年收入，样本均值为,9.8,万，样本标准差为,4.8,万。小组给出一个置信区间（,9.2,10.4,），但未给出置信水平。,1,、问该区间的置信水平？（试比较两种分布的情形）,2,、小组给出解释：该地区家庭平均年收入为,9.210.4,的概率为,95%,，这种说法对吗？,3,、若同时有,10,个小组在进行相同的独立调查，问,9,个或以上小组得出的,95%,置信区间都覆盖总体均值的概率是多少？提示：可以将每一个区间是否覆盖总体均值作为一次,Bernoulli,试验。令,Y,为覆盖总体均值的全金属区间数，显然,YBin(10,0.95),单侧置信区间,总体均值,100(1-,)%,的置信区间：,下限为：,上限为：,例,2,1,、同例,1,，问总体均值,95%,置信区间的下限？,当置信水平提高时，估计的可靠性将（提高,or,降低）？精确性将（提高,or,降低）？,比例置信区间,若,XBin(n,p,),，由中心极限定理,传统方法是以样本,p,代替总体,p,进行区间估计，最近的研究表明，,Agresti,Coull,区间有改进，置信水平为,100(1-)%,的置信区间计算公式如下：,若下限小于,0,则用,0,代替，上限大于,1,则用,1,代替。,例,3,：,某企业从所购买的元件中随机抽检了,150,份，有,5,份不合格，估计不合格品率,95%,置信区间。（试用传统方法和,Agresti,Coull,方法分别计算比较）,根据指定精度确定所需样本数,为获得总体平均,100(1-)%,的置信区间，且要求区间宽度不超过,D,时，则需从这个总体中抽取随机样本数为：,总体方差未知的两阶段法：,阶段,1,：从总体中抽取,n,1,个先期样本（如,n,1,=30,），计算这个样本的方差,S,2,；,阶段,2,：以,S,2,替代总体未知方差计算所需样本数,n,，若,nn,1,，再补抽,n n,1,份样本。,另：请同学们自行计算确定总体比例所需样本数。,例,4,例,1,中，若要求所获得总体均值,99%,置信区间的偏差为（,+-,）,0.5,万元，问至少要调查多少样本？,例,3,中，若要求所获得总体不合格品率,99%,置信区间的偏差为（,+-,）,0.5%,万元，问至少要抽取多少样本？,两个总体均值之差的置信区间,根据第三讲的知识，请同学们自行给出大样本情形下的计算公式。,小样本不能使用中心极限定理，可以使用,t,分布，计算公式：,例,5,欲比较,A,、,B,两医院住院病人的住院天数。随机抽取,A,医院,64,个住院病历，计算平均住院天数为,6.54,天，标准差为,1.2,；随机抽取,B,医院,81,个住院病历，计算平均住院天数为,6.24,天，标准差为,0.96,。则两个医院住院病人平均住院天数差的,95%,置信区间是多少？有人认为两个医院病人的住院时间没有差异，与上述数据矛盾吗？为什么？,例,6,随机抽取,A,、,B,两地空气污染指数,PSI,，如下表所示,A,150,146,132,164,126,128,B,95,104,112,99,109,假设两地空气污染指数都服从正态分布，试估计两地,PSI,平均差,95%,置信区间。,例,7,有文献给出一项对睡眠习惯的研究结果。在一个由,87,个成年人组成的样本中，每天躺在床上的平均时间为,7.70,小时（不管处于清醒状态还是睡眠状态），标准差为,1.02,小时，其中处于睡眠状态的平均时间为,7.06,小时，标准差为,1.11,小时。所以躺在床上的平均清醒时间为,7.70-7.06=0.64,小时。有可能建立平均清醒时间,95%,的置信区间吗？如果行，是多少？如不行，为什么？,例,8,：,数据对的置信区间,某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在,10,辆前驱汽车左、右前轮上。,4,万公里后测量磨损情况如下（单位：,mm,）：,1,2,3,4,5,6,7,8,9,10,新材料,4.35,5.00,4.21,5.03,5.71,4.61,4.70,6.03,3.80,4.70,旧材料,4.19,4.62,4.04,4.72,5.52,4.26,4.27,6.24,3.46,4.50,差值,0.16,0.38,0.17,0.31,0.19,0.35,0.43,-0.21,0.34,0.2,问新、旧材料轮胎磨损差值,95%,的置信区间。,两个总体比例之差的置信区间,若,XBin(n,x,p,x,),，,Y,Bin(n,y,p,y,),，则,p,x,-,p,y,置信水平为100(1-)%的置信区间,的,计算方法为：,传统方法：,改进方法：,例,9,重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的,120,个交易账户，有,56,个订购次数在,2,次以上。从去年抽取,80,个样本，有,30,个订购次数在,2,次以上。试计算这两年中订购次数在,2,次以上顾客的比例之差的置信水平为,95%,的置信区间。,二、假设检验,问题,1,某校新入学学生被随机分配进入高一两个班，人数都是,70,人，化学课分别由,2,个老师任教。期末考试的平均分分别是,70.5,和,72.4,分，标准差都为,5.4,分。其中第一个班有一个学生想找第,2,个班的老师补课，他的选择有道理吗？,分析,每一次考试都包含很多随机因素；,老师,1,可以认为自己的教学水平（以学生考试平均分来测量）为,72.4,分；,老师,1,可以认为老师,2,的教学水平其实和自己是一样的，这次考试的结果是因为自己班级发挥不好而对方班级发挥的好。,对于这种具有随机性的结果的证明只能寻求统计意义上的检验。,统计检验,检验,1,：老师,1,的教学水平达不到,72.4,。,零假设（,null hypothesis,，也称原假设）,H,0,：,1,72.4,备择假设,（,alternate hypothesis,）,H,1,：,1,72.4,。,检验,2,：老师,1,与老师,2,的教学水平有差异。,零假设,H,0,：,1,-,2,=0,备择假设,H,1,：,1,2,0,。,假设检验的概念,假设：对总体参数包括总体均值、比例、方差等的一种看法。,假设检验：事先对总体参数或分布形式作出某种假设，然后利用样本信息来判断原假设是否成立。通常依据统计上的小概率不显著原理而对,0,假设作反证。,0,假设：,待检验的假设，表示为,H,0,备择假设：与,0,假设对立的假设,表示为,H,1,假设检验思想示例图,因此我们拒绝假设,=50,样本均值,抽样分布,这个值不像我们应该得到的样本均值,20,H,0,如果这是总体的真实均值,=50,P-,值,（,P,-Value,）,首先我们假设,0,假设成立，,P-,值是观测到的随机样本与,0,假设不一致的强度的度量。计算步骤（以均值检验为例）：,在,0,假设,H,0,为真的条件下，求样本均值的分布，这个分布称为的,0,分布；,在,0,假设为真的条件下，计算观察值与,H,0,不一致（大于、小于或不等于）的概率即为,P-,值。,当,P-,值充分小（如,），我们就放弃,H,0,，而认为,H,1,成立。判断阈值,称为显著水平（,significant level,），当,P,，,此时我们称在显著水平,下,拒绝原假设。,总体均值统计检验,对总体和样本的假设同前。对形如,H,0,：,0,，,或,H,0,：,0,，或,H,0,：,=,0,的,0,假设进行检验，检验,统计量,为：,P-,值就是对应分布密度曲线下某一区域的面积，分别对应的是单尾检验（右侧面积），单尾检验（左侧面积），双尾检验（双侧面积）。,大样本下：,方差未知：,或小样本下,总体比例的统计检验,对总体和样本的假设同前。对形如,H,0,：,p,p,0,，,或,H,0,：,p,p,0,，或,H,0,：,p,=p,0,的,0,假设进行检验，若,np,0,和,n(1-p,0,),都大于,10,，则有检验,统计量,为：,P-,值计算同上。,例,10,某有线电视服务商在免费提供了一个月的某付费频道后进行了调查。他们随机抽取了,400,个家庭组成样本，其中,25,个家庭愿意付费续订该频道。该公司能够得出结论认为该地区有超过,5%,的家庭愿意付费观看该频道吗？,两个总体均值差的检验,对总体和样本的假设同前。对形如,H,0,：,X,-,Y,D,0,，,或,H,0,：,X,-,Y,D,0,，或,H,0,：,X,-,Y,=,D,0,的,0,假设进行检验，检验,统计量,为：,大样本下：,方差未知：,或小样本下,或当两,总体方差近似相等,时，可以采用合并样本方差的方法：,续,P-,值计算同上。,两个总体比例差的检验,设,XBin(n,x,p,x,),和,YBin(n,y,p,y,),相互独立且,n,x,和,n,y,都很大。对形如,H,0,：,p,X,-,p,Y,0,，,或,H,0,：,p,X,-,p,Y,0,，或,H,0,：,p,X,-,p,Y,=,0,的,0,假设进行检验，检验,统计量,为：,P-,值计算同上。,例,11,为确定某燃油添加剂是否具有节油的功能，某司机记录了自己的油耗。,6,箱油的平均油耗为,7.4,升,/,百公里，标准差为,0.63,；使用添加剂后的,4,箱油平均油耗为,7.0,升,/,百公里，标准差为,0.75,。添加剂价格为,200,元，问是否有必要使用该添加剂？此外，该实验是否存在瑕疵？,例,12,某课题组调查企业项目风险管理的方法。,45,个建筑企业样本中有,17,家企业采用了风险转移的方法，,38,个,IT,类企业中有,16,家企业采用了风险转移的方法。你能认为,IT,企业风险转移比例高于建筑企业吗？,关于,P-,值,P-,值不能证明,0,假设的真实性；（科学方法本质上是否定虚假）,例：某建筑工程师要为桥墩混凝土选定水泥，其抗压强度必须大于,0,，在对某一品牌水泥进行多次试验后测度平均值和方差，然后进行假设检验。若他采用的假设检验为：,H,0,：,0,，,H,1,：,0,，计算得到,P-,值为,0.168,，他能否采用这一品牌水泥？,P-,值显著也不一定有现实的意义。,例：调查,2 X 200,个某一学校两个专业学生毕业一年后平均月工资分别为,1587,元和,1590,元，方差都为,100,，这两个专业的毕业生工资差异显著吗？这种差异有实际意义吗？,关于显著性水平,a,的值,在固定的,a,水平下所作判断可能导致两类错误：,第,I,类错误,H,0,为真时拒绝了,H,0,第,II,类错误,H,0,为假时接受了,H,0,犯第,I,类错误,的概率不会大于,a,。,通常我们选取,a,足够小，但我们也希望确定,第,II,类错误是可控的，于是定义功效（,Power,）如下：,功效,=1,-,P(,第,II,类错误,),功效需在采样之前确定。,多项分布与,c,2,检验,频数分析,以下资料是从某工厂搜集而来的缺勤数。在,0.05,的显著水平之下，试判定一周内每天的缺勤率是否有差异。,星期,次数,期望,星期一,120,89,星期二,45,89,星期三,60,89,星期四,90,89,星期五,130,89,合计,445,445,检验,H,0,：,p,1,=,p,2,=,p,5,=,1/5,，,当各单元格的期望次数,或理论次数,不小于,5,时，在,0,假设下有统计量,其中：,O,i,为观察值，,E,i,为期望值,列联表（,contingency table,）,用于检验随机的列属性（随机变量）对选定的（或随机的）行变量是否表现为一致分布（或独立、相关）。,列,1,列,J,总数,行,1,O,11,O,1,J,O,1,.,行,I,O,I1,O,IJ,O,I,.,总数,O.,1,O.,J.,O,.,检验,H,0,：对每一列,j,有，,p,1J,=,p,2J,=,p,IJ,例,12,男性和女性的意外发生地点的分布是否有一致性。警方提供的一个,150,件意外的样本如下表。在,0.05,的显著水平之下，我们可否断定意外发生的地点和性别是相关的？,性別,工作,家中,其他,总数,男性,60,20,10,90,女性,20,30,10,60,总数,80,50,20,150,方差相等的,F,检验,非参数检验（,nonparametric tests,）,当样本来自于非正态总体时，需应用非参数检验方法；,当随机变量为连续数值变量时，主要方法有,Wilcoxon,符号秩检验（,Wilcoxon,signed-rank test,）和,Wilcoxon,秩和检验（,Wilcoxon,rank-sum test,，也称为,Mann-Whitney,检验：,Mann-Whitney test,）,方法：略,

展开阅读全文

第四讲 估计与检验.ppt

第四讲估计与检验.ppt