资源描述
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四讲 估计与统计检验,沈建荣,jrshen,一、区间估计,总体均值区间估计,总体均值置信水平为,100(1-,)%,的置信区间为:,注意:,1,、估计成立的条件是:样本必须是随机、独立的;,2,、使用,t,分布表时,要求总体必须是近似正态的,需对样本作正态性检验;,3,、置信水平不是概率(置信区间是确定的而不是随机的),可以认为以置信水平(如,95%,)相信总体均值在执行区间内;或是说,置信水平这一计算方法可以使得置信区间以,95%,的概率覆盖总体均值。,大样本下:,方差未知:,或小样本下,例,1,某小组随机抽样调查了,250,户家庭的年收入,样本均值为,9.8,万,样本标准差为,4.8,万。小组给出一个置信区间(,9.2,10.4,),但未给出置信水平。,1,、问该区间的置信水平?(试比较两种分布的情形),2,、小组给出解释:该地区家庭平均年收入为,9.210.4,的概率为,95%,,这种说法对吗?,3,、若同时有,10,个小组在进行相同的独立调查,问,9,个或以上小组得出的,95%,置信区间都覆盖总体均值的概率是多少?提示:可以将每一个区间是否覆盖总体均值作为一次,Bernoulli,试验。令,Y,为覆盖总体均值的全金属区间数,显然,YBin(10,0.95),单侧置信区间,总体均值,100(1-,)%,的置信区间:,下限为:,上限为:,例,2,1,、同例,1,,问总体均值,95%,置信区间的下限?,当置信水平提高时,估计的可靠性将(提高,or,降低)?精确性将(提高,or,降低)?,比例置信区间,若,XBin(n,p,),,由中心极限定理,传统方法是以样本,p,代替总体,p,进行区间估计,最近的研究表明,,Agresti,Coull,区间有改进,置信水平为,100(1-)%,的置信区间计算公式如下:,若下限小于,0,则用,0,代替,上限大于,1,则用,1,代替。,例,3,:,某企业从所购买的元件中随机抽检了,150,份,有,5,份不合格,估计不合格品率,95%,置信区间。(试用传统方法和,Agresti,Coull,方法分别计算比较),根据指定精度确定所需样本数,为获得总体平均,100(1-)%,的置信区间,且要求区间宽度不超过,D,时,则需从这个总体中抽取随机样本数为:,总体方差未知的两阶段法:,阶段,1,:从总体中抽取,n,1,个先期样本(如,n,1,=30,),计算这个样本的方差,S,2,;,阶段,2,:以,S,2,替代总体未知方差计算所需样本数,n,,若,nn,1,,再补抽,n n,1,份样本。,另:请同学们自行计算确定总体比例所需样本数。,例,4,例,1,中,若要求所获得总体均值,99%,置信区间的偏差为(,+-,),0.5,万元,问至少要调查多少样本?,例,3,中,若要求所获得总体不合格品率,99%,置信区间的偏差为(,+-,),0.5%,万元,问至少要抽取多少样本?,两个总体均值之差的置信区间,根据第三讲的知识,请同学们自行给出大样本情形下的计算公式。,小样本不能使用中心极限定理,可以使用,t,分布,计算公式:,例,5,欲比较,A,、,B,两医院住院病人的住院天数。随机抽取,A,医院,64,个住院病历,计算平均住院天数为,6.54,天,标准差为,1.2,;随机抽取,B,医院,81,个住院病历,计算平均住院天数为,6.24,天,标准差为,0.96,。则两个医院住院病人平均住院天数差的,95%,置信区间是多少?有人认为两个医院病人的住院时间没有差异,与上述数据矛盾吗?为什么?,例,6,随机抽取,A,、,B,两地空气污染指数,PSI,,如下表所示,A,150,146,132,164,126,128,B,95,104,112,99,109,假设两地空气污染指数都服从正态分布,试估计两地,PSI,平均差,95%,置信区间。,例,7,有文献给出一项对睡眠习惯的研究结果。在一个由,87,个成年人组成的样本中,每天躺在床上的平均时间为,7.70,小时(不管处于清醒状态还是睡眠状态),标准差为,1.02,小时,其中处于睡眠状态的平均时间为,7.06,小时,标准差为,1.11,小时。所以躺在床上的平均清醒时间为,7.70-7.06=0.64,小时。有可能建立平均清醒时间,95%,的置信区间吗?如果行,是多少?如不行,为什么?,例,8,:,数据对的置信区间,某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在,10,辆前驱汽车左、右前轮上。,4,万公里后测量磨损情况如下(单位:,mm,):,1,2,3,4,5,6,7,8,9,10,新材料,4.35,5.00,4.21,5.03,5.71,4.61,4.70,6.03,3.80,4.70,旧材料,4.19,4.62,4.04,4.72,5.52,4.26,4.27,6.24,3.46,4.50,差值,0.16,0.38,0.17,0.31,0.19,0.35,0.43,-0.21,0.34,0.2,问新、旧材料轮胎磨损差值,95%,的置信区间。,两个总体比例之差的置信区间,若,XBin(n,x,p,x,),,,Y,Bin(n,y,p,y,),,则,p,x,-,p,y,置信水平为100(1-)%的置信区间,的,计算方法为:,传统方法:,改进方法:,例,9,重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的,120,个交易账户,有,56,个订购次数在,2,次以上。从去年抽取,80,个样本,有,30,个订购次数在,2,次以上。试计算这两年中订购次数在,2,次以上顾客的比例之差的置信水平为,95%,的置信区间。,二、假设检验,问题,1,某校新入学学生被随机分配进入高一两个班,人数都是,70,人,化学课分别由,2,个老师任教。期末考试的平均分分别是,70.5,和,72.4,分,标准差都为,5.4,分。其中第一个班有一个学生想找第,2,个班的老师补课,他的选择有道理吗?,分析,每一次考试都包含很多随机因素;,老师,1,可以认为自己的教学水平(以学生考试平均分来测量)为,72.4,分;,老师,1,可以认为老师,2,的教学水平其实和自己是一样的,这次考试的结果是因为自己班级发挥不好而对方班级发挥的好。,对于这种具有随机性的结果的证明只能寻求统计意义上的检验。,统计检验,检验,1,:老师,1,的教学水平达不到,72.4,。,零假设(,null hypothesis,,也称原假设),H,0,:,1,72.4,备择假设,(,alternate hypothesis,),H,1,:,1,72.4,。,检验,2,:老师,1,与老师,2,的教学水平有差异。,零假设,H,0,:,1,-,2,=0,备择假设,H,1,:,1,2,0,。,假设检验的概念,假设:对总体参数包括总体均值、比例、方差等的一种看法。,假设检验:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。通常依据统计上的小概率不显著原理而对,0,假设作反证。,0,假设:,待检验的假设,表示为,H,0,备择假设:与,0,假设对立的假设,表示为,H,1,假设检验思想示例图,因此我们拒绝假设,=50,样本均值,抽样分布,这个值不像我们应该得到的样本均值,20,H,0,如果这是总体的真实均值,=50,P-,值,(,P,-Value,),首先我们假设,0,假设成立,,P-,值是观测到的随机样本与,0,假设不一致的强度的度量。计算步骤(以均值检验为例):,在,0,假设,H,0,为真的条件下,求样本均值 的分布,这个分布称为 的,0,分布;,在,0,假设为真的条件下,计算观察值与,H,0,不一致(大于、小于或不等于)的概率即为,P-,值。,当,P-,值充分小(如,),我们就放弃,H,0,,而认为,H,1,成立。判断阈值,称为显著水平(,significant level,),当,P,,,此时我们称在显著水平,下,拒绝原假设。,总体均值统计检验,对总体和样本的假设同前。对形如,H,0,:,0,,,或,H,0,:,0,,或,H,0,:,=,0,的,0,假设进行检验,检验,统计量,为:,P-,值就是对应分布密度曲线下某一区域的面积,分别对应的是单尾检验(右侧面积),单尾检验(左侧面积),双尾检验(双侧面积)。,大样本下:,方差未知:,或小样本下,总体比例的统计检验,对总体和样本的假设同前。对形如,H,0,:,p,p,0,,,或,H,0,:,p,p,0,,或,H,0,:,p,=p,0,的,0,假设进行检验,若,np,0,和,n(1-p,0,),都大于,10,,则有检验,统计量,为:,P-,值计算同上。,例,10,某有线电视服务商在免费提供了一个月的某付费频道后进行了调查。他们随机抽取了,400,个家庭组成样本,其中,25,个家庭愿意付费续订该频道。该公司能够得出结论认为该地区有超过,5%,的家庭愿意付费观看该频道吗?,两个总体均值差的检验,对总体和样本的假设同前。对形如,H,0,:,X,-,Y,D,0,,,或,H,0,:,X,-,Y,D,0,,或,H,0,:,X,-,Y,=,D,0,的,0,假设进行检验,检验,统计量,为:,大样本下:,方差未知:,或小样本下,或当两,总体方差近似相等,时,可以采用合并样本方差的方法:,续,P-,值计算同上。,两个总体比例差的检验,设,XBin(n,x,p,x,),和,YBin(n,y,p,y,),相互独立且,n,x,和,n,y,都很大。对形如,H,0,:,p,X,-,p,Y,0,,,或,H,0,:,p,X,-,p,Y,0,,或,H,0,:,p,X,-,p,Y,=,0,的,0,假设进行检验,检验,统计量,为:,P-,值计算同上。,例,11,为确定某燃油添加剂是否具有节油的功能,某司机记录了自己的油耗。,6,箱油的平均油耗为,7.4,升,/,百公里,标准差为,0.63,;使用添加剂后的,4,箱油平均油耗为,7.0,升,/,百公里,标准差为,0.75,。添加剂价格为,200,元,问是否有必要使用该添加剂?此外,该实验是否存在瑕疵?,例,12,某课题组调查企业项目风险管理的方法。,45,个建筑企业样本中有,17,家企业采用了风险转移的方法,,38,个,IT,类企业中有,16,家企业采用了风险转移的方法。你能认为,IT,企业风险转移比例高于建筑企业吗?,关于,P-,值,P-,值不能证明,0,假设的真实性;(科学方法本质上是否定虚假),例:某建筑工程师要为桥墩混凝土选定水泥,其抗压强度必须大于,0,,在对某一品牌水泥进行多次试验后测度平均值和方差,然后进行假设检验。若他采用的假设检验为:,H,0,:,0,,,H,1,:,0,,计算得到,P-,值为,0.168,,他能否采用这一品牌水泥?,P-,值显著也不一定有现实的意义。,例:调查,2 X 200,个某一学校两个专业学生毕业一年后平均月工资分别为,1587,元和,1590,元,方差都为,100,,这两个专业的毕业生工资差异显著吗?这种差异有实际意义吗?,关于显著性水平,a,的值,在固定的,a,水平下所作判断可能导致两类错误:,第,I,类错误,H,0,为真时拒绝了,H,0,第,II,类错误,H,0,为假时接受了,H,0,犯第,I,类错误,的概率不会大于,a,。,通常我们选取,a,足够小,但我们也希望确定,第,II,类错误是可控的,于是定义功效(,Power,)如下:,功效,=1,-,P(,第,II,类错误,),功效需在采样之前确定。,多项分布与,c,2,检验,频数分析,以下资料是从某工厂搜集而来的缺勤数。在,0.05,的显著水平之下,试判定一周内每天的缺勤率是否有差异。,星期,次数,期望,星期一,120,89,星期二,45,89,星期三,60,89,星期四,90,89,星期五,130,89,合计,445,445,检验,H,0,:,p,1,=,p,2,=,p,5,=,1/5,,,当各单元格的期望次数,或理论次数,不小于,5,时,在,0,假设下有统计量,其中:,O,i,为观察值,,E,i,为期望值,列联表(,contingency table,),用于检验随机的列属性(随机变量)对选定的(或随机的)行变量是否表现为一致分布(或独立、相关)。,列,1,列,J,总数,行,1,O,11,O,1,J,O,1,.,行,I,O,I1,O,IJ,O,I,.,总数,O.,1,O.,J.,O,.,检验,H,0,:对每一列,j,有,,p,1J,=,p,2J,=,p,IJ,例,12,男性和女性的意外发生地点的分布是否有一致性。警方提供的一个,150,件意外的样本如下表。在,0.05,的显著水平之下,我们可否断定意外发生的地点和性别是相关的?,性別,工作,家中,其他,总数,男性,60,20,10,90,女性,20,30,10,60,总数,80,50,20,150,方差相等的,F,检验,非参数检验(,nonparametric tests,),当样本来自于非正态总体时,需应用非参数检验方法;,当随机变量为连续数值变量时,主要方法有,Wilcoxon,符号秩检验(,Wilcoxon,signed-rank test,)和,Wilcoxon,秩和检验(,Wilcoxon,rank-sum test,,也称为,Mann-Whitney,检验:,Mann-Whitney test,),方法:略,
展开阅读全文