1、第七章第七章 参数估计参数估计7.1 参数估计的一般问题参数估计的一般问题7.2 一个总体参数的区间估计一个总体参数的区间估计7.3 两个总体参数的区间估计两个总体参数的区间估计7.4 样本量的确定样本量的确定学习目标学习目标1.1.估计量与估计值的概念估计量与估计值的概念2.2.点估计与区间估计的区别点估计与区间估计的区别3.3.评价估计量优良性的标准评价估计量优良性的标准4.4.一个总体参数的区间估计方法一个总体参数的区间估计方法5.5.两个总体参数的区间估计方法两个总体参数的区间估计方法6.6.样本容量的确定方法样本容量的确定方法参数估计在统计方法中的地参数估计在统计方法中的地位位统计推
2、断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等7.1 参数估计的一般问题参数估计的一般问题1、参数估计(、参数估计(Parameter Estimation),用样本估计量估计总体估计值。,用样本估计量估计总体估计值。(1)、)、点(值)估计(近似值)点(值)估计(近似值)(2)、)、区间估计(近似范围)区间估计(近似范围)一、估计量和估计值一、估计量和估计值n n估计:人人都做过。如
3、:估计:人人都做过。如:n n上课时,你会上课时,你会估计估计一下老师提问你的概率有多一下老师提问你的概率有多大?大?n n过马路闯红灯时,你会过马路闯红灯时,你会估计估计一下被罚款的概率一下被罚款的概率有多大?有多大?n n推销员年初时要推销员年初时要估计估计今年超额完成任务的概率今年超额完成任务的概率有多大?有多大?(1)估估计计量量:用用来来估估计计总总体体参参数数的的样样本本统统计计量量。如如:样样本本算算术术平平均均数数、样样本本中中位位数数、样样本本标准差、样本方差等。标准差、样本方差等。例如例如例如例如:样本均值就是总体均值样本均值就是总体均值样本均值就是总体均值样本均值就是总体
4、均值 的一个估计量的一个估计量的一个估计量的一个估计量(2)参数用参数用 表示,估计量表示,估计量用用 表示表示(3)估估计计值值:估估计计参参数数时时计计算算出出来来的的统统计计量量的的具体值具体值如果样本均值如果样本均值如果样本均值如果样本均值 x x =80=80,则,则,则,则8080就是就是就是就是 的估计值的估计值的估计值的估计值2、估计量与估计值(estimator&estimated value)参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计
5、量法估估 计计 方方 法法点点 估估 计计区间估计区间估计二、点估计(point estimation)Population Parameter总体参数总体参数Point Estimator is a single value(statistic)used to estimate a population value(parameter).1、用样本的估计量直接作为总体参数的估计值、用样本的估计量直接作为总体参数的估计值例如:用样本均值直接例如:用样本均值直接例如:用样本均值直接例如:用样本均值直接作为作为作为作为总体均值的估计总体均值的估计总体均值的估计总体均值的估计例例例例如如如如:用用用
6、用两两两两个个个个样样样样本本本本均均均均值值值值之之之之差差差差直直直直接接接接作作作作为为为为总总总总体体体体均均均均值值值值之差的估计之差的估计之差的估计之差的估计Point estimation点估计点估计PopulationSampleParameterStatistic FormulaMean,Variance,s2Proportion,px x =xin12)(22nxixss=pp=x successesn trials总体参数总体参数样本统计量样本统计量计算公式计算公式2、点点估估计计的的方方法法有有矩矩估估计计法法、顺顺序序统统计计量量法法、最大似然法、最小二乘法等最大似然
7、法、最小二乘法等3、点估计、点估计用样本用样本估计量估计量直接作为总体均数的直接作为总体均数的估计值,估计值,未考虑抽样误差未考虑抽样误差,没有给出估计没有给出估计值接近总体参数程度的信息值接近总体参数程度的信息。三、区间估计三、区间估计(interval estimate)在在在在点点点点估估估估计计计计的的的的基基基基础础础础上上上上,给给给给出出出出总总总总体体体体参参参参数数数数估估估估计计计计的的的的一一一一个个个个区区区区间间间间范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计
8、量加减抽样误差而得到的 根根根根据据据据样样样样本本本本统统统统计计计计量量量量的的的的抽抽抽抽样样样样分分分分布布布布能能能能够够够够对对对对样样样样本本本本统统统统计计计计量量量量与与与与总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量 比比比比如如如如,某某某某班班班班级级级级平平平平均均均均分分分分数数数数在在在在75758585之之之之间间间间,置置置置信信信信水水水水平平平平是是是是95%95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间
9、置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x(1)将构造置信区间的步骤重复很多次,)将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所置信区间包含总体参数真值的次数所占的比例称为置信水平占的比例称为置信水平(2)表示为)表示为(1-为是总体参数未在
10、区间内的比例为是总体参数未在区间内的比例为是总体参数未在区间内的比例为是总体参数未在区间内的比例 (3)常用的置信水平值有)常用的置信水平值有 99%,95%,90%相应的相应的相应的相应的 为为为为0.010.01,0.050.05,0.100.101、置信水平、置信水平 (confidence cofficient)(1 1)由样本统计量所构造的总体参数的估计)由样本统计量所构造的总体参数的估计)由样本统计量所构造的总体参数的估计)由样本统计量所构造的总体参数的估计区间称为置信区间区间称为置信区间区间称为置信区间区间称为置信区间(2 2)统计学家在某种程度上确信这个区间会)统计学家在某种程
11、度上确信这个区间会)统计学家在某种程度上确信这个区间会)统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置包含真正的总体参数,所以给它取名为置包含真正的总体参数,所以给它取名为置包含真正的总体参数,所以给它取名为置信区间信区间信区间信区间 (3 3)用一个具体的样本所构造的区间是一个)用一个具体的样本所构造的区间是一个)用一个具体的样本所构造的区间是一个)用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产特定的区间,我们无法知道这个样本所产特定的区间,我们无法知道这个样本所产特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值生的区间是否包
12、含总体参数的真值生的区间是否包含总体参数的真值生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参我们只能是希望这个区间是大量包含总体参我们只能是希望这个区间是大量包含总体参我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数数真值的区间中的一个,但它也可能是少数数真值的区间中的一个,但它也可能是少数数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个几个不包含参数真值的区间中的一个几个不包含参数真值的区间中的一个几个不包含参数真值的区间中的一个2、置信区间、置信区间(confidence interval)例:例:虽然不能知道某校全
13、体女大学生身高均数的确虽然不能知道某校全体女大学生身高均数的确切数值,但有切数值,但有95%的把握说校全体女大学生身高均数的把握说校全体女大学生身高均数在在163.0-164.5cm之间,有之间,有99%的把握说校全体女的把握说校全体女大学生身高均数在大学生身高均数在 162.7 164.7cm之间。之间。换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0-164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错,说错的概率是的概率是5%;做出校全体女大学生身高均数为;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是的结论
14、,说对的概率是99%,说错的概率,说错的概率是是1%。3、置信区间与置信水平、置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)区间包含了区间包含了区间包含了区间包含了 的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2 /2 2The factors that determine the width of a confidence interval are:4、影响置信区间宽度的因素有:影响置信区间宽度的因素有:(1).The sample size,n.样本容量样本容量n(2).The variability in the popul
15、ation总体数据的离散程度,总体数据的离散程度,用用 来测度来测度(3).The desired level of confidence.置信水平置信水平(1-),影响,影响 z 的大小的大小5、标准误(Standard error)(1)、概念、概念抽样误差:由于抽样引起的样本统计量与总抽样误差:由于抽样引起的样本统计量与总体参数之间的差异。体参数之间的差异。标准误标准误:表示抽样误差大小的指标;:表示抽样误差大小的指标;即样本均值的标准差;即样本均值的标准差;(3)、(样本均值)标准误(样本均值)标准误意义:意义:反映抽样误差的大小。标准误越小,抽样误反映抽样误差的大小。标准误越小,抽样
16、误差越小,用样本均数估计总体均数的可靠性越大。差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准误,标准误(2)、(样本均值)标准误的计算、(样本均值)标准误的计算四、评价估计量的标准1、无偏性、无偏性(unbiasedness)n n无偏性:估计量抽样分布的数学期望等于被无偏性:估计量抽样分布的数学期望等于被n n 估计的总体参数估计的总体参数 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏2、有效性、有效性(efficiency)有有效效性性:与与离离散散度度相相联联系系。对对同同一一总总体体参参数数的的两两个个无无
17、偏偏点点估估计计量量,有有更更小小标标准准差差的的估估计计量更有效量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()3、一致性、一致性(consistency)n n一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量的值越来越接近被估计的总体参数量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()7.2 一个总体参数的区间估计一个总体参数的区间估计7.2.1 总体均值的区间估计总体均值的区间估计7.2.2 总体比例的区间
18、估计总体比例的区间估计7.2.3 总体方差的区间估计总体方差的区间估计A confidence interval is a range of values within which the population parameter is expected to occur.区间估计给出总体参数的近似范围区间估计给出总体参数的近似范围Interval Estimation区间估计区间估计一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差总体均值的区间估计总体均值的区间估计(正态总体、正态总体、已知,或非正态总体、大已知,或非正
19、态总体、大样本样本)总体均值的区间估计总体均值的区间估计(大样本大样本)n n1.1.假定条件假定条件假定条件假定条件 总体服从正态分布总体服从正态分布总体服从正态分布总体服从正态分布,且方差且方差且方差且方差()未知未知未知未知 如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n n 30)30)2.2.使用正态分布统计量使用正态分布统计量使用正态分布统计量使用正态分布统计量 z z3.总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信水平下的置信水平下的置信水平下的置信区间为
20、置信区间为置信区间为置信区间为Interval Estimatesn nAn Interval Estimate states the range within which a population parameter probably lies.n n区间估计表明总体参数可能存在的范围区间估计表明总体参数可能存在的范围Interval EstimatesmThe interval within which a populationparameter is expected to occur is called a confidence interval.m总体参数可能存在的区间称为置信区间总
21、体参数可能存在的区间称为置信区间mThe two confidence intervals that are used extensively are the 95%and the 90%.常用的置信水平及值为:常用的置信水平及值为:Z=1.96Z=1.65Interpretation of Confidence Intervalsn nFor a 95%confidence interval about 95%of the similarly constructed intervals will contain the parameter being estimated.n n95%of t
22、he sample means for a specified sample size will lie within 1.96 standard deviations of the hypothesized population mean.总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例 】一一一一家家家家食食食食品品品品生生生生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,为为为为对对对对产产产产量量量量质质质质量量量量进进进进行行行行监监监监测测测测,企企企企业业业业质质质质检检检检部部部部门门门门经经经经常常常常要要
23、要要进进进进行行行行抽抽抽抽检检检检,以以以以分分分分析析析析每每每每袋袋袋袋重重重重量量量量是是是是否否否否符符符符合合合合要要要要求求求求。现现现现从从从从某某某某天天天天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机抽抽抽抽取取取取了了了了2525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量量量如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布,且且且且总总总总体体体体标标标标准准准准差差差差为为为为10g10g。试试试试估估估估计计
24、计计该该该该批批批批产产产产品品品品平平平平均均均均重重重重量量量量的的的的置信区间,置信水平为置信区间,置信水平为置信区间,置信水平为置信区间,置信水平为95%95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解:已已知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z
25、/2/2=1.96=1.96。根根据样本数据计算得:据样本数据计算得:总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】一一一一家家家家保保保保险险险险公公公公司司司司收收收收集集集集到到到到由由由由3636投投投投保保保保个个个个人人人人组组组组成成成成的的的的随随随随机机机机样样样样本本本本,得得得得到到到到每每每每个个个个投投投投保保保保人
26、人人人的的的的年年年年龄龄龄龄(周周周周岁岁岁岁)数数数数据据据据如如如如下下下下表表表表。试建立投保人年龄试建立投保人年龄试建立投保人年龄试建立投保人年龄90%90%的置信区间的置信区间的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据据计算得:计算得:,总体均
27、值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁岁岁41.6341.63岁岁岁岁总体均值的区间估计总体均值的区间估计(正态总体、正态总体、未知、小样本未知、小样本)总体均值的区间估计总体均值的区间估计(小样本小样本)1.假定条件假定条件总体服从正态分布总体服从正态分布总体服从正态分布总体服从正态分布,且方差且方差且方差且方差()未知未知未知未知小样本小样本小样本小样本 (n n 30)30)2.2.使用使用 t 分布统计量分布统计量3.总体均值总体
28、均值 在在1-置信水平下的置信水平下的置信区间为置信区间为t 分布分布 t t 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,它它它它通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的的的的参参参参数数数数。随随随随着着着着自自自自由由由由度度度度的的的的增增增增大大大大,分分分分布布布布也也也也逐逐逐逐渐渐渐渐趋于正态分布趋于
29、正态分布趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z zt 值表值表 横坐标:自由度,横坐标:自由度,df 纵坐标:概率,纵坐标:概率,p,即曲线下阴影部分的面积即曲线下阴影部分的面积;表中的数字:相应的表中的数字:相应的|t|界值。界值。t 值表规律:值表规律:(1)自由度(自由度(df)一定时,)一定时,p 与与 t 成反比成反比;(2)概率(概率(p)一定时,一定时,df
30、与与 t 成反比成反比;总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】已已已已知知知知某某某某种种种种灯灯灯灯泡泡泡泡的的的的寿寿寿寿命命命命服服服服从从从从正正正正态态态态分分分分布布布布,现现现现从从从从一一一一批批批批灯灯灯灯泡泡泡泡中中中中随随随随机机机机抽抽抽抽取取取取1616只只只只,测测测测得得得得其其其其使使使使用用用用寿寿寿寿命命命命(小小小小时时时时)如如如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿
31、命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计总体均值的区间估计(例题分析例题分析)解:已知解:已知解:已知解:已知 N N(,2 2),n n=16,1-=16,1-=95%=95%,t t /2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:根据样本数据计算得:根据样本数据计算得:,总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为该该该该种种种种灯灯灯灯泡泡泡泡平平平平均
32、均均均使使使使用用用用寿寿寿寿命命命命的的的的置置置置信信信信区区区区间间间间为为为为1476.81476.8小小小小时时时时1503.21503.2小时小时小时小时总体比例的区间估计总体比例的区间估计总体比例的区间估计总体比例的区间估计n n1 1.假定条件假定条件假定条件假定条件 总体服从二项分布总体服从二项分布总体服从二项分布总体服从二项分布 可以由正态分布来近似可以由正态分布来近似可以由正态分布来近似可以由正态分布来近似2.2.使用正态分布统计量使用正态分布统计量使用正态分布统计量使用正态分布统计量 z z3.3.3.总体比例总体比例总体比例总体比例总体比例总体比例 在在在在在在1-1
33、-1-置信水平下置信水平下置信水平下置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为总体比例的区间估计总体比例的区间估计(例题分析例题分析)【例例例例】某某某某城城城城市市市市想想想想要要要要估估估估计计计计下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性所所所所占占占占的的的的比比比比例例例例,随随随随机机机机地地地地抽抽抽抽取取取取了了了了100100名名名名下下下下岗岗岗岗职职职职工工工工,其其其其中中中中6565人人人人为为为为女女女女性性性性职职职职工工工工。试试试试以以以以95%95%的的的的置置置置信信信信水水水水平平
34、平平估估估估计计计计该该该该城城城城市市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的置信区间的置信区间的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该该该城城城城市市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的的的的置置置置信信信信区间为区间为区间为区间为55.65%74.35%55.65%74.35%总体方差的区间估计总体方差的区间估计总体方差的区间估计总体方差的区间估计n n1.估计一个总体的方差或标准差估计一个总体的方差或标
35、准差n n2.假设总体服从正态分布假设总体服从正态分布3.3.总体方差总体方差 2 2 的点估计量为的点估计量为S2 2,且且4.总体方差在总体方差在1-置信水平下的置信区间为置信水平下的置信区间为总体方差的区间估计总体方差的区间估计(图示图示)1-1-1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例例例例】一一一一家家家家食食食食品品品品生生生生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,现现现现从
36、从从从某某某某天天天天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机抽抽抽抽取取取取了了了了2525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量量量如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布。以以以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.01
37、02.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解:已知已知n n2525,1-1-95%,95%,根据样本数据计算得根据样本数据计算得 s s2 2=93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区该企业生产的食品
38、总体重量标准差的的置信区间为间为间为间为7.54g13.43g7.54g13.43g7.3 两个总体参数的区间估计两个总体参数的区间估计7.3.1 两个总体均值之差的区间估计两个总体均值之差的区间估计7.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计7.3.3 两个总体方差比的区间估计两个总体方差比的区间估计两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比两个总体均值之差的区间估两个总体均值之差的区间估计计(独立大样本独立大样本)两个总体均值之差的估计两个总体均值之差的估计(大样本大样本)n n1.假定条件假定
39、条件 两两两两个个个个总总总总体体体体都都都都服服服服从从从从正正正正态态态态分分分分布布布布,1 1、2 2已已已已知知知知 若若若若不不不不是是是是正正正正态态态态分分分分布布布布,可可可可以以以以用用用用正正正正态态态态分分分分布布布布来来来来近近近近似似似似(n n1 1 3030和和和和n n2 2 30)30)两个样本是独立的随机样本两个样本是独立的随机样本两个样本是独立的随机样本两个样本是独立的随机样本2.2.使用正态分布统计量使用正态分布统计量 z两个总体均值之差的估计两个总体均值之差的估计(大样本大样本)n n1.1.1 1,2 2已已已已知知知知时时时时,两两两两个个个个总
40、总总总体体体体均均均均值值值值之差之差之差之差 1 1-2 2在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为2.1 1、2 2未知时,未知时,未知时,未知时,两个总体均值之差两个总体均值之差两个总体均值之差两个总体均值之差 1 1-2 2在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】某某地地区区教教育育委委员员会会想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此
41、此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%的的置置信区间信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=57.2两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解:两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信区间为置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差
42、的置信区间为5.035.03分分分分10.9710.97分分分分两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本)两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1=)n n1.1.假定条件假定条件假定条件假定条件 两个两个两个两个总体都服从正态分布总体都服从正态分布总体都服从正态分布总体都服从正态分布 两个总体方差未知但相等:两个总体方差未知但相等:两个总体方差未知但相等:两个总体方差未知但相等:1 1=2 2 两个独立的小样本两个独立的小样本两个独立的小样本两个独立的小样本(n n1 13030和和和和n n2 230)30)2.2.总体方差的合并
43、估计量总体方差的合并估计量总体方差的合并估计量总体方差的合并估计量3.估计估计估计估计量量量量 x x1 1 1 1-x x2 2 2 2的抽样标准差的抽样标准差的抽样标准差的抽样标准差两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1=)1.1.两个样本均值之差的标准化两个样本均值之差的标准化2.两个总体均值之差两个总体均值之差 1-2在在1-置信水平下的置信水平下的置信区间为置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例【例【例【例】为估计两种方法组装产品所需时间的差异,分别对两种不同为估计两种方法组装产品所需时间的差异,分别对两种不同为估计
44、两种方法组装产品所需时间的差异,分别对两种不同为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排的组装方法各随机安排的组装方法各随机安排的组装方法各随机安排1212名工人,每个工人组装一件产品所需的名工人,每个工人组装一件产品所需的名工人,每个工人组装一件产品所需的名工人,每个工人组装一件产品所需的时间(分钟)下如表时间(分钟)下如表时间(分钟)下如表时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,假定两种方法组装产品的时间服从正态分布,假定两种方法组装产品的时间服从正态分布,假定两种方法组装产品的时间服从正态分布,且方差相等。试以且方差相等。试以且方差相等。
45、试以且方差相等。试以95%95%的置信水平建立两种方法组装产品所需平均的置信水平建立两种方法组装产品所需平均的置信水平建立两种方法组装产品所需平均的置信水平建立两种方法组装产品所需平均时间差值的置信区间时间差值的置信区间时间差值的置信区间时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解
46、解:根据样本数据计算得根据样本数据计算得 合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间两种方法组装产品所需平均时间之差的置信区间两种方法组装产品所需平均时间之差的置信区间两种方法组装产品所需平均时间之差的置信区间为为为为0.140.14分钟分钟分钟分钟7.267.26分钟分钟分钟分钟两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1 )n n1.1.假定条件假定条件假定条件假定条件两个两个两个两个总体都服从正态分布总体都服从正态分布总体都服从正态分布总体都服从正态分布两个总体方差未知且不相等:两个总体方差未知且不相等:两个总体方差未知且不相等:两个总体
47、方差未知且不相等:1 1 2 2两个独立的小样本两个独立的小样本两个独立的小样本两个独立的小样本(n n1 13030和和和和n n2 230)30)2.2.使用统计量使用统计量使用统计量使用统计量两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1 )n n两个总体均值之差两个总体均值之差 1-2在在1-置信水置信水平下的置信区间为平下的置信区间为自由度自由度两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例例例】沿沿沿沿用用用用前前前前例例例例。假假假假定定定定第第第第一一一一种种种种方方方方法法法法随随随随机机机机安安安安排排排排1212名名名名工工工工
48、人人人人,第第第第二二二二种种种种方方方方法法法法随随随随机机机机安安安安排排排排名名名名工工工工人人人人,即即即即n n1 1=12=12,n n2 2=8=8,所所所所得得得得的的的的有有有有关关关关数数数数据据据据如如如如表表表表。假假假假定定定定两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品的的的的时时时时间间间间服服服服从从从从正正正正态态态态分分分分布布布布,且且且且方方方方差差差差不不不不相相相相等等等等。以以以以95%95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装
49、产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 1两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解:根据样本数据计算得根据样本数据计算得 自由度为:自由度为:两种方法组装产品所需平均时间之差的置信区间两种方法组装产品所需平均时间之差的置信区间两种方法组装产品所需平均时间之差的置信区间两种方法组装
50、产品所需平均时间之差的置信区间为为为为0.1920.192分钟分钟分钟分钟9.0589.058分钟分钟分钟分钟两个总体均值之差的区间估计两个总体均值之差的区间估计(匹配样本匹配样本matched sample)两个总体均值之差的估计两个总体均值之差的估计(匹配大样本匹配大样本)1.1.假定条件假定条件两个匹配的大样本两个匹配的大样本两个匹配的大样本两个匹配的大样本(n n1 1 3030和和和和n n2 2 30)30)两两两两个个个个总总总总体体体体各各各各观观观观察察察察值值值值的的的的配配配配对对对对差差差差服服服服从从从从正正正正态态态态分分分分布布布布2.2.两个总体均值之差两个总体