资源描述
组员:100401110丁妙,100401127卢丽瑶,100401126刘妃玲,100401141曾晓玲,
100401137肖胜南,100401146郑乙锋,100401150邹永能
1、一家食品生产企业以生产袋装食品为主,每天的产量大约为8000袋左右。按规定每袋的重量应为100g。为对产品质量进行检测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取25袋,测得每袋重量如表7—2所示。
表7—2
25袋食品的重量
112.5
101.0
103.0
102.0
110.5
102.6
107.5
95.0
108.8
115.6
100.0
123.5
102.0
101.6
102.2
116.6
95.4
97.8
108.6
105.0
136.8
102.8
101.5
98.4
93.3
已知产品重量的分布,且总体标准差为10g,试估计该天产品平均质量的置信区间,置信水平为95%。
解:已知δ=10,n=25, 置信水平1-α=95%,Zx/2=1.96
应该把图先放到画图软件中,再复制有菜单那部分就可以了,这样图片就清晰了。
即该批食品平均重量95%的置信区间为101.44g至109.28g。这是课本的答案,显然和上表的结果不同。原因是这里用的是Z分布,即标准正态分布的分位点,而SPSS用的是t分布的分位点。因为这里说知道总体标准差为10克,所以可以用Z分布,但是这里的总体均值不知道,要点估计和区间估计,更难以知道总体标准差了,相对而言总体均值更容易获得。所以现实中一般是用t分布的,很少有机会用到Z分布去做区间估计,所以SPSS就只有t分布的菜单了。要做本题,应该用Excel中的插入函数之统计函数,找到Z分布的分位点函数,然后代入公式,即不用查询课本后面的分位点表,用函数得到分位点,这个可以参考课本第五章有这些统计函数。SPSS里面也有函数,在转换的计算变量中。两横线之间的是我做的软件操作:
得到样本平均数
重量
112.5
102.6
100.0
116.6
136.8
101.0
107.5
123.5
95.4
102.8
103.0
95.0
102.0
97.8
101.5
102.0
108.8
101.6
108.6
98.4
100.5
115.6
102.2
105.0
93.3
105.36
要得到分位点,即Z0.025
输入0.975是因为标准正态分布的分位点说右边的概率(即分布密度函数的右边面积)为0.025,即左边概率为0.975(即小于该分位点的概率),这是这个函数的定义。参考课本P443的图形。得到分位点为1.959963985,约等于1.96,则在Excel中编公式为=A28-B28*10/25^0.5
回车键得到区间下限101.4401
同理,把刚才的公式改为加号,=A28+B28*10/25^0.5得到区间上限109.2799
则和课本中是一样的。
下面用SPSS做
得到结果窗口中的
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
重量
25
93.30
136.80
105.3600
9.65449
Valid N (listwise)
25
即有均值为105.36,则用分位点代入公式
目标变量自己编写,右边方框中写公式,并插入右下角的函数。
同理做区间上限为
注意:SPSS公式中的**表示^,即乘方运算。
得到数据窗口中的
即区间估计是101.44到109.28.
例题7.2一家保险公司收集到由36位投保人组成的随机样本,得到每位投保人的年龄数据如表7—2所示。
表7—3
36个投保人年龄的数据 单位:周岁
23.0
35.0
39.0
27.0
36.0
44.0
36.0
42.0
46.0
43.0
31.0
33.0
42.0
53.0
45.0
54.0
47.0
24.0
34.0
28.0
39.0
36.0
44.0
40.0
39.0
49.0
38.0
34.0
48.0
50.0
34.0
39.0
45.0
48.0
45.0
32.0
试建立投保人年龄90%的置信区间。
解:已知n=36 ,1-α=90%,Zx/2=1.645
由于总体方差未知,但为大样本,可以使用样本方差来代替总体方差。根据样本数据计算的样本均值和标准差如下:
因此,投保人平均年龄90%的置信区间为37.31岁至41.68岁。这里虽然用t分布,但是和课本用Z分布的结果和靠近,是因为这里是大样本,有36个样本,所以t和Z分布很靠近,可以用Z来近似t分布。严格来说,不知道总体标准差,就应该用t分布的,但是两者此时很接近,用谁都差不多了。
例题7.3
已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16个,测得其使用寿命(单位:h)如下:
1510 1450 1480 1460 1520 1480 1490 1460
1480 1510 1530 1470 1500 1520 1510 1470
试建立该批灯泡平均使用寿命95%的置信区间。
解
描述统计量
N
极小值
极大值
均值
标准差
VAR00001
16
1450.00
1530.00
1490.0000
24.76557
有效的 N (列表状态)
16
得 均值=1490,s=24.76557
养成良好习惯,变量视图中给变量取名字,才有可读性。
该种灯泡平均使用寿命95%的置信区间为1476.8034h~1503.1966h这时候不知道总体标准差,就要用t分布,所以答案和课本上一样了。
例题7.4即用Excel查询分位点,当然Z0.025=1.96不用查询也能够记忆住,就直接代入公式做出来,没有软件菜单直接做这个的,需要背下公式,按公式计算。
某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95的置信水平估计该城市下岗职工中女性比例的置信区间
解:
已知n=100,Za/2=1.96,根据抽样结果计算的样本比例为:
展开阅读全文