1、组员:100401110丁妙,100401127卢丽瑶,100401126刘妃玲,100401141曾晓玲, 100401137肖胜南,100401146郑乙锋,100401150邹永能 1、一家食品生产企业以生产袋装食品为主,每天的产量大约为8000袋左右。按规定每袋的重量应为100g。为对产品质量进行检测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取25袋,测得每袋重量如表7—2所示。 表7—2 25袋食品的重量 112.5 101.0 103.0 102.0 110.5 102.6 1
2、07.5 95.0 108.8 115.6 100.0 123.5 102.0 101.6 102.2 116.6 95.4 97.8 108.6 105.0 136.8 102.8 101.5 98.4 93.3 已知产品重量的分布,且总体标准差为10g,试估计该天产品平均质量的置信区间,置信水平为95%。 解:已知δ=10,n=25, 置信水平1-α=95%,Zx/2=1.96 应该把图先放到画图软件中,再复制有菜单那部分就可以了,这样图片就清晰了。 即该批食品平均重量95%的置信区间为101.44g至1
3、09.28g。这是课本的答案,显然和上表的结果不同。原因是这里用的是Z分布,即标准正态分布的分位点,而SPSS用的是t分布的分位点。因为这里说知道总体标准差为10克,所以可以用Z分布,但是这里的总体均值不知道,要点估计和区间估计,更难以知道总体标准差了,相对而言总体均值更容易获得。所以现实中一般是用t分布的,很少有机会用到Z分布去做区间估计,所以SPSS就只有t分布的菜单了。要做本题,应该用Excel中的插入函数之统计函数,找到Z分布的分位点函数,然后代入公式,即不用查询课本后面的分位点表,用函数得到分位点,这个可以参考课本第五章有这些统计函数。SPSS里面也有函数,在转换的计算变量中。两横线
4、之间的是我做的软件操作: 得到样本平均数 重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3 105.36 要得到分位点,即Z0.025 输入0.975是因为标准正态分布的分位点说右边的概率(即分布密度函数的右边面积
5、为0.025,即左边概率为0.975(即小于该分位点的概率),这是这个函数的定义。参考课本P443的图形。得到分位点为1.959963985,约等于1.96,则在Excel中编公式为=A28-B28*10/25^0.5 回车键得到区间下限101.4401 同理,把刚才的公式改为加号,=A28+B28*10/25^0.5得到区间上限109.2799 则和课本中是一样的。 下面用SPSS做 得到结果窗口中的 Descriptive Statistics N Minimum Maximum Mean Std. Deviation 重量 25 93
6、30 136.80 105.3600 9.65449 Valid N (listwise) 25 即有均值为105.36,则用分位点代入公式 目标变量自己编写,右边方框中写公式,并插入右下角的函数。 同理做区间上限为 注意:SPSS公式中的**表示^,即乘方运算。 得到数据窗口中的 即区间估计是101.44到109.28. 例题7.2一家保险公司收集到由36位投保人组成的随机样本,得到每位投保人的年龄数据如表7—2所示。 表7—3 36个投保人年龄的数据
7、 单位:周岁 23.0 35.0 39.0 27.0 36.0 44.0 36.0 42.0 46.0 43.0 31.0 33.0 42.0 53.0 45.0 54.0 47.0 24.0 34.0 28.0 39.0 36.0 44.0 40.0 39.0 49.0 38.0 34.0 48.0 50.0 34.0 39.0 45.0 48.0 45.0 32.0 试建立投保人年龄90%的置信区间。 解:已知n=36 ,1
8、α=90%,Zx/2=1.645 由于总体方差未知,但为大样本,可以使用样本方差来代替总体方差。根据样本数据计算的样本均值和标准差如下: 因此,投保人平均年龄90%的置信区间为37.31岁至41.68岁。这里虽然用t分布,但是和课本用Z分布的结果和靠近,是因为这里是大样本,有36个样本,所以t和Z分布很靠近,可以用Z来近似t分布。严格来说,不知道总体标准差,就应该用t分布的,但是两者此时很接近,用谁都差不多了。 例题7.3 已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16个,测得其使用寿命(单位:h)如下: 1510 1450 1480 1460 1520
9、1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470 试建立该批灯泡平均使用寿命95%的置信区间。 解 描述统计量 N 极小值 极大值 均值 标准差 VAR00001 16 1450.00 1530.00 1490.0000 24.76557 有效的 N (列表状态) 16 得 均值=1490,s=24.76557 养成良好习惯,变量视图中给变量取名字,才有可读性。 该种灯泡平均使用寿命95%的置信区间为1476.8034h~1503.1966h这时候不知道总体标准差,就要用t分布,所以答案和课本上一样了。 例题7.4即用Excel查询分位点,当然Z0.025=1.96不用查询也能够记忆住,就直接代入公式做出来,没有软件菜单直接做这个的,需要背下公式,按公式计算。 某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95的置信水平估计该城市下岗职工中女性比例的置信区间 解: 已知n=100,Za/2=1.96,根据抽样结果计算的样本比例为:






