资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020年5月29日星期五,#,08 六月 2025,第五章抽样估计3,目标要求,1、了解,正态总体方差的区间估计,2、熟悉大样本,二项分布、泊松分布总体参数的区间估计,3、,了解小样本二项分布、泊松分布总体参数的区间估计,三、正态总体方差的区间估计,标准型,:若总体,XN(,2,),,且,2,未知,x,1,x,2,x,n,是来自总体的样本值,求的置信度1-的置信区间。,(3)对给定置信水平1-,/2,/2,1-,f(x),解,(1),选,2,的点估计为S,2,所以,2,的1-置信区间为,总体标准差,的1-置信区间为,例14,从某地随机抽取13人,测得血磷值为1.67,1.98,2.33,2.34,2.5,3.6,3.73,4.14,4.17,4.57,4.82,5.78,若血磷值近似服从正态分布,求总体方差,2,的0.9置信区间.,解 n=13,自由度df=12,当1-=0.9时,=0.1,查附表6 得,故,2,的0.9置信区间为(0.971,3.906).,5.4 二项分布、泊松分布总体参数的区间估计,前面介绍的区间估计方法都是正态总体的情况,解决的也是,计量资料,问题。,本节讨论总体服从二项分布和泊松分布的情况,解决,计数资料,参数的区间估计问题。,一、小样本精确估计方法(n50),二、大样本正态近似估计方法(n50),1、二项分布参数P的区间估计,总体(概)率,P:具有某种特征的个体数与总体数的比率,如有效率、发病率。,总体率一般未知,需要根据样本值进行区间估计。,样本(概)率p,:具有某种特征的个体数占样本容量的比率。,重复抽取n个个体可看作n重贝努利试验,则具有某种特征的个体数XB(n,P)。,一、小样本精确估计方法(n50),在小样本情况下,用公式直接计算很复杂,,通常通过查表,得到。,只要给出n,k 和(常用0.05及0.01),就可从附表9中查出总体率P的1-置信区间.,例17,设用某种药物治疗近视眼,随机抽取样20例作为样本,结果12例有效,求总体有效率的0.95的置信区间.,解 显然,是二项分布参数P的区间估计,n=20,k=12,1-=0.95,查附表9得0.95的置信区间(0.361,0.809),2、泊松分布参数的区间估计,设总体服从参数的泊松分布,x,1,x,2,x,n,是来自总体的样本值,(,x,i,为第i次抽样事件发生的次数,,注意与二项分布中,x,i,的区别)。,样本总计数,-各次试验事件发生次数之和,,在小样本情况下,通常也是,通过查表,得到。,只要给出样本总计数X和,就可从附表10中查出总体参数n的1-置信区间,将其上下限再除以n即得参数的1-置信区间。,例18,从一份充分混合的井水中随机抽取3 次水样(每次1ml),经检查有20只细菌,求每毫升井水所含细菌数的0.99的置信区间。,解 井水含细菌是稀有事件,则本题为泊松分布均数的区间估计。,设 x,i,(i=1,2,3)为第i次抽样所含细菌数,则 X=x,1,+x,2,+x,3,=20,n=3,1-=0.99。,查附表10得,总体参数 3的0.99置信区间(10.35,34.67),则每毫升井水所含细菌数的0.99的置信区间 (3.45,11.56)。,二、大样本正态近似估计方法,(计数样本容量n50),1、二项分布参数P的区间估计,从总体中抽取容量为n的样本,可看做n重贝努利试验,所以具有某种特征的的样本数,XB(n,P),,且 E(X)=nP,V(X)=nP(1-P),则样本率,这说明样本率p是总体率P的,无偏估计量,。,由中心极限定理,在大样本情况下(n足够大),样本率p 近似服从正态分布N(P,P(1-P)/n).,则样本率p 的标准化随机变量,为计算方便,在大样本情况下(n足够大),常用样本率p代替总体率P计算样本率p 的标准差,即,所以总体率P的,1-,置信区间为,(3)对给定置信水平1-,(1)总体率P 以样本率p为点估计量。,用求区间估计的一般步骤求出P的置信区间:,例19,随机抽查了某校200名沙眼患者,经治疗有168名治愈,求总体治愈率的0.95的置信区间.,解 样本治愈率p=168/200=0.84,=0.05,查附表4得u,0.05/2,=1.96,总体治愈率的0.95置信区间,即(0.789,0.891),2、泊松分布参数,的区间估计,设总体X服从泊松分布P(),则E(X)=V(X)=,若x,1,x,2,x,n,是来自总体的样本值(,x,i,为第i次抽样事件发生的次数,),则,这说明样本均值是参数,的,无偏估计,。,由中心极限定理,在大样本情况下(n足够大),样本均值近似服从正态分布N(,/n),.,则样本均值的标准化随机变量,因,为计算方便,,在大样本情况下(n足够大),常用样本均值代替,计算样本均值的标准差,则有,若实际中只得到样本总计数,(3)对给定置信水平1-,现用求区间估计的一般步骤求出的置信区间:,所以总体均数,的,1-,置信区间为,而总体总计数n,的,1-,置信区间为,例20,用一种计数器测定某放射性标本,10分钟获得脉冲数为16784,求10分钟及每分钟总体总脉冲数的0.95置信区间.,解 样本总计数X=16784,n=10,=0.05,查,附表4,得u,0.05/2,=1.96,所以10分钟总体总脉冲数的0.95置信区间为,即(16530,17038),故每分钟总体总脉冲数的0.95置信区间为(1653,1703.8)。,
展开阅读全文