1、第四章 抽样分布与参数估计7。2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。(1)假定总体标准差为15元,求样本均值的抽样标准误差。=2.143(2)在95%的置信水平下,求边际误差. ,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t= 因此,=1.962.143=4。2(3)如果样本均值为120元,求总体均值 的95%的置信区间. 置信区间为: =(115.8,124。2)7。4 从总体中抽取一个n=100的简单随机样本,得到=81,s=12.要求:大样本,样本均值服从正态分布:或置信区间为:,=1。2(1)构建的90的置信
2、区间.=1。645,置信区间为:=(79.03,82.97)(2)构建的95的置信区间。=1。96,置信区间为:=(78.65,83。35)(3)构建的99%的置信区间。=2.576,置信区间为:=(77.91,84。09)7。7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3。33。16。25。82.34.15.44.53。24。42。05.42.66。41.83。55。72.32.11.91。25.14.34。23。60。81.54.71.41。22。93。52。40。53.62。5求该校大学
3、生平均上网时间的置信区间,置信水平分别为90,95%和99。解:(1)样本均值=3.32,样本标准差s=1.61;(2)抽样平均误差: 重复抽样:=1。61/6=0。268 不重复抽样:=0。268=0.2680.998=0。267(3)置信水平下的概率度: =0.9,t=1.645 =0.95,t=1。96 =0.99,t=2。576(4)边际误差(极限误差): =0。9,=重复抽样:=1.6450.268=0。441不重复抽样:=1。6450.267=0.439 =0。95,=重复抽样:=1.960。268=0.525不重复抽样:=1。960。267=0。523 =0。99,=重复抽样:=
4、2.5760。268=0。69不重复抽样:=2。5760.267=0.688(5)置信区间:=0.9,重复抽样:=(2.88,3。76)不重复抽样:=(2。88,3。76) =0.95, 重复抽样:=(2。79,3.85)不重复抽样:=(2。80,3。84) =0。99, 重复抽样:=(2。63,4.01)不重复抽样:=(2.63,4.01)7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距
5、离的95的置信区间.解:小样本,总体方差未知,用t统计量均值=9.375,样本标准差s=4.11置信区间:=0。95,n=16,=2.13=(7。18,11.57)711 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g)如下:每包重量(g)包数969898100100102102104104106233474合计50 已知食品包重量服从正态分布,要求: (1)确定该种食品平均重量的95的置信区间。 解:大样本,总体方差未知,用z统计量样本均值=101.4,样本标准差s=1.829置信区间:=0。9
6、5,=1.96=(100.89,101。91)(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。解:总体比率的估计大样本,总体方差未知,用z统计量样本比率=(505)/50=0.9置信区间:=0。95,=1。96=(0.8168,0。9832)713 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工.得到他们每周加班的时间数据如下(单位:小时):63218171220117902182516152916假定员工每周加班的时间服从正态分布.估计网络公司员工平均每周加班时间的90%的置信区间。解:小样本,总体方差未知,用t统计量均
7、值=13.56,样本标准差s=7。801置信区间:=0。90,n=18,=1.7369=(10。36,16.75)715 在一项家电市场调查中随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机.其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95。解:总体比率的估计大样本,总体方差未知,用z统计量样本比率=0。23置信区间:=0.90,=1.645=(0.1811,0.2789)=0.95,=1。96=(0。1717,0。2883)720 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排
8、队的方式等.为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16。56。66。76.87。17.37。47.77。77。7方式24。25.45。86。26。77.77。78。59。310 要求:(1)构建第一种排队方式等待时间标准差的95的置信区间。解:估计统计量经计算得样本标准差=3.318置信区间:=0.95,n=10,=19。02,=2.7=(0。1075,0.7574)因此,标准
9、差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待时间标准差的95的置信区间。解:估计统计量经计算得样本标准差=0。2272置信区间:=0.95,n=10,=19。02,=2.7=(1.57,11.06)因此,标准差的置信区间为(1.25,3.33)(3)根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种方式好,标准差小!723 下表是由4对观察值组成的随机样本。配对号来自总体A的样本来自总体B的样本1234251080765(1)计算A与B各对观察值之差,再利用得出的差值计算和。 =1.75,=2.62996(2)设分别为总体A和总体B的均值,构造的95的置信区
10、间.解:小样本,配对样本,总体方差未知,用t统计量均值=1.75,样本标准差s=2。62996置信区间:=0。95,n=4,=3。182=(2.43,5.93)725 从两个总体中各抽取一个250的独立随机样本,来自总体1的样本比例为40%,来自总体2的样本比例为30。要求:(1)构造的90的置信区间。(2)构造的95的置信区间.解:总体比率差的估计大样本,总体方差未知,用z统计量样本比率p1=0.4,p2=0.3置信区间:=0.90,=1.645=(3。02,16.98%)=0。95,=1。96=(1。68,18。32)7.26 生产工序的方差是工序质量的一个重要度量.当方差较大时,需要对序
11、进行改进以减小方差。下面是两部机器生产的袋茶重量(单位:g)的数据:机器1机器23。453.223。93.223.283。353。22。983。73。383。193。33。223.753。283。33。23。053.53.383。353.33。293。332。953。453.23.343。353.273.163.483.123.283.163.283.23。183。253.33.343。25要求:构造两个总体方差比/的95的置信区间.解:统计量:置信区间:=0。058,=0。006n1=n2=21=0.95,=2.4645,=0.4058=(4.05,24。6)727 根据以往的生产数据,某种
12、产品的废品率为2。如果要求95的置信区间,若要求边际误差不超过4%,应抽取多大的样本?解: =0.95,=1。96=47.06,取n=48或者50。728 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本?解:,=0。95,=1.96, =138。3,取n=139或者140,或者150.729 假定两个总体的标准差分别为:,,若要求误差范围不超过5,相应的置信水平为95,假定,估计两个总体均值之差时所需的样本量为多大?解:n1=n2=,=0。95,=
13、1.96, n1=n2= =56.7,取n=58,或者60。730 假定,边际误差E005,相应的置信水平为95,估计两个总体比例之差时所需的样本量为多大?解:n1=n2=,=0。95,=1。96,取p1=p2=0.5, n1=n2= =768。3,取n=769,或者780或800。82 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时.已知该元件寿命服从正态分布,60小时,试在显著性水平005下确定这批元件是否合格。解:H0:700;H1:700已知:680 60由于n=3630,大样本,因此检验统计量:2当0。05,查表得1。645。
14、因为z-,故拒绝原假设,接受备择假设,说明这批产品不合格。84 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下: 993 987 1005 1012 983 997 995 1021 1005已知包重服从正态分布,试检验该日打包机工作是否正常(a005)?解:H0:100;H1:100经计算得:99。9778 S1。21221检验统计量:-0。055当0.05,自由度n19时,查表得2。262。因为,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。85 某种大量生产的袋装食品,按规定不得
15、少于250克.今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5就不得出厂,问该批食品能否出厂(a005)?解:解:H0:0.05;H1:0。05已知: p6/50=0.12 检验统计量:2。271当0。05,查表得1.645。因为,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。87 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命显著地大于225
16、小时(a005)?解:H0:225;H1:225经计算知:241。5 s98.726检验统计量:0.669当0。05,自由度n115时,查表得1。753。因为t,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。810 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高.劳动效率可以用平均装配时间反映.现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下: 甲方法:31 34 29 32 35 38 34 30 29 32 31 26 乙方法:26 24 28 29 30 29 32 26 31 29 32 28两总
17、体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a005)?解:建立假设H0:12=0 H1:120总体正态,小样本抽样,方差未知,方差相等,检验统计量 根据样本数据计算,得12,=12,31.75,3.19446,28.6667,=2.46183。 8。13262。6480.05时,临界点为2.074,此题中,故拒绝原假设,认为两种方法的装配时间有显著差异。811 调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点(a005)?解:建立假设H0:12;H1:12p1
18、43/205=0.2097 n1=205 p213/134=0.097 n2=134检验统计量 3当0。05,查表得1。645。因为,拒绝原假设,说明吸烟者容易患慢性气管炎.812 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元.随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得=681万元,s=45。用a001的显著性水平,采用p值进行检验.解:H0:60;H1:60已知:68。1 s=45由于n=14430,大样本,因此检验统计量:2.16由于,因此P值=P(z2。1
19、6)=1,查表的=0。9846,P值=0.0154由于P0。01,故不能拒绝原假设,说明贷款的平均规模没有明显地超过60万元。813 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22 000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本1),另一组人员在相同的时间服用安慰剂(样本2)持续3年之后进行检测,样本1中有104人患心脏病,样本2中有189人患心脏病.以a005的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。解:建立假设H0:12;H1:12p1104/11000=0.00945 n1=11000 p2189/11000=0。
20、01718 n2=11000检验统计量 -5当0.05,查表得1。645.因为,拒绝原假设,说明用阿司匹林可以降低心脏病发生率。815 有人说在大学中男生的学习成绩比女生的学习成绩好.现从一个学校中随机抽取了25名男生和16名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水平=002,从上述数据中能得到什么结论?解:首先进行方差是否相等的检验:建立假设H0:;H1:n1=25,=56,n2=16,=491.143当0。02时,3。294,0.346。由于F,检验统计量的值落在接受域中,所以接受原假设,说明总体方差无显著差异。检验均值差:建立假设H0:120 H1:120总体正态,小样本抽样,方差未知,方差相等,检验统计量 根据样本数据计算,得25,=16,82,=56,78,=4953.3081.7110.02时,临界点为2.125,t,故不能拒绝原假设,不能认为大学中男生的学习成绩比女生的学习成绩好.