资源描述
样本总体的置信区间
数据分析
去除一些异常数据之后得到的有效数据有449个,见附录1
将数据分类处理,得到下表
月支出
人数
x<=600
135
600<x<1500
268
x>=1500
46
抽样调查学生449人,平均月支出为898元,标准差为426元,月支出在1500元及以上的学生有46人,月支出在600元及以下的学生有135人,月支出在600元到1500元之间的有268人。
现在以95.45%的置信水平推断学校学生平均月支出所在的范围和月支出在1500及以上学生在全校学生中所占的比重,月支出在600及以下的学生在全校学生中所占的比重和月支出在600到1500之间学生在全校学生中所占的比重。
当样本容量n充分大时,x-E(x)DX/n近似服从标准正态分布N(0,1),这里不知道学生的月支出服从什么分布,且样本容量n=449,属于大样本情况,因此可以采用正态总体的置信区间来求。学生月支出的均值用μ表示,样本均值x=898,标准差为s=426,因为1-∝=0.9545,所以1-∝2=0.97725,所以查标准正态分布表得z1-∝2=z0.97725=2
z1-∝2sn=2×426449=20
x-z1-∝2sn =898-20=878, x+z1-∝2sn=898+20=918
于是我们得到:878≤μ≤918
计算结果表明,有95.45%的把握说学校学生月平均支出在878到918之间。
在抽取的449人中,月支出在1500及以上学生所占的比重即样本成数为p1=46449=0.103,月支出在600元到1500元之间学生所占的比重即样本成数为p2=268449=0.597,支出在600元及以下学生所占的比重即样本成数为p3=135449=0.3。
z1-∝2p1(1-p1)n=2×0.103×1-0.103449=0.029
p1-z1-∝2p11-p1n=0.102-0.029=0.073
p1+z1-∝2p11-p1n=0.102+0.029=0.131
z1-∝2p2(1-p2)n=2×0.597×(1-0597)449=0.046
p2-z1-∝2p21-p2n=0.597-0.046=0.551
p2+z1-∝2p21-p2n=0.597+0.046=0.643
z1-∝2p3(1-p3)n=2×0.3×1-0.3449=0.043
p3-z1-∝2p31-p3n=0.3-0.043=0.257
p3+z1-∝2p31-p3n=0.3+0.043=0.343
于是我们得到: 0.073≪p1≪0.131。所以,有95.45%的把握说学校学生月支出在1500元及以上学生占全校学生的比重在7.3%到13.1%之间; 0.551≪p2≪0.643.所以,有95.45%的把握说学校学生月支出在600元到1500元之间学生占全校学生的比重在55.1%到64.3%之间; 0.257≪p3≪0.343。所以,有95.45%的把握说学校学生月支出在600及以下学生占全校学生的比重在25.7%到34.3%之间。即全校大部分学生的月支出在600到1500之间,少部分学生月支出在600及以下,极少部分学生月支出在1500及以上。
对于国民消费状况,我们用恩格尔系数进行评估。而大学生是个特殊的群体,他们的生活源较为单一(并且恩格尔系数本身对来源没有限定),消费方向较为单一、清晰,所以将恩格尔系数应用于此可以客观反映消费状况的恩格尔系数。
恩格尔定律的公式为 :R1= FCP/TPP 或 R2=FCP/IP。其中 :R1为食物支出对总支出的比率 ;R2为食物支出对收入的比率 ( 又称为食物支出的收入弹性 ) ;FCP 为食物支出变动百分比 ;TPP 为总支出变动百分比 ;I P 为收入变动百分比。
恩格尔定律的原理非常简单 :一个家庭或个人维持生命所必须的食品数量是基本不变的。在这个前提下,恩格尔系数值越小,即食品支出占家庭或个人支出的比重越小,自然就意味
着家庭或个人的生活水平越高,反之则说明生活水平越低。因此,可用恩格尔系数来衡量一个国家或地区的居民生活水平和经济发展成就。联合国粮农组织于 20 世纪 70 年代中期更是将恩格尔系数作为评价国家贫富和地区生活水平高低的重要标准之一。
(2)恩格尔系数。恩格尔系数 (Engel Coefficient) 是根据恩格尔定律得出的比例数,即食品支出占全部生活消费支出的比重,用公式表示如下:
恩格尔系数 =( 食品支出/全部生活消费支出 )×l00%
20 世纪 70 年代中期,联合国粮农组织将恩格尔系作为衡量一个国家和地区富裕程度的标准之一:恩格尔系数在 59%以上为贫困,50%~59%为温饱,40%~50%为小康,30%~40%为富裕,低于 30%为最富裕。联合国粮农组织的这一举措使恩格尔系数和恩格尔定律得到了人们广泛的认同。但大学生属于一个特殊的群体,消费对象单一,而且恩格尔系数对于大学生的应用是恩格尔系数的局部应用,因此,衡量标准与衡量一个国家或地区的居民生活水平和经济发展成就的标准并不完全相同。我们现定义大学生恩格尔系数,80%以上为贫困,50%~80% 为正常,低于50% 为富裕。
数据分析
将收去除一些异常的数据之后,得到的有效数据有417个。见附录2
集到的数据进行归类,得到下表
恩格尔系数
人数
男生人数
女生人数
10<=x<20
3
0
3
20<=x<30
10
1
9
30<=x<40
22
4
18
40<=x<50
38
7
31
50<=x<60
90
19
71
60<=x<70
83
23
60
70<=x<80
83
28
55
80<=x<90
62
28
34
90<=x<=100
29
18
11
由收集到的数据作出恩格尔系数图
样本平均恩格尔系数为E=60.93%,样本标准差为S=17.55%,男生的平均恩格尔系数为e1=67.74%,标准差为S1=16.86,女生的平均恩格尔系数为e2=58.59%标准差为S2=17.03。
恩格尔系数在80%及以上的有91人,恩格尔系数在50%到80%之间的有170人,恩格尔系数在50%及以下的有156人。
问题:根据新定义的恩格尔系数来研究学校家庭贫困学生,家庭收入正常学生和家庭收入富足学生的情况。现在以95.45%的置信水平推断学校学生恩格尔系数所在的范围和恩格尔系数在80%及以上,恩格尔系数在50%到80%之间,50%及以下学生在全校学生中所占的比重。
当样本容量n充分大时,x-E(x)DX/n近似服从标准正态分布N(0,1),这里不知道学生的恩格尔系数服从什么分布,且样本容量n=417,属于大样本情况,因此可以采用正态总体的置信区间来求。学生恩格尔系数的均值用μ表示,样本均值x=60.93%,标准差为S=17.55%,因为1-∝=0.9545,所以1-∝2=0.97725,所以查标准正态分布表得z1-∝2=z0.97725=2
z1-∝2sn×100%=2×17.55%417×100%=1.72%
x-z1-∝2sn =60.93%-1.72%=59.21%, x+z1-∝2sn=60.93%+1.72%=62.65%
于是我们得到:59.21%≤μ≤62.65%
计算结果表明,有95.45%的把握说全校学生平均恩格尔系数在59.21%到62.65%之间。这样我们有很大的把握说全校学生的家庭收入正常。
在抽取的417名学生的恩格尔系数中,恩格尔系数在80%及以上的学生所占的比重即样本成数为P1=91417=0.218,恩格尔系数在50%到80%之间的学生所占的比重即样本成数为P2=170417=0.408, 恩格尔系数在50%及以下的学生所占的比重即样本成数为P3=156417=0.374
P的置信区间为
p-z1-∝2p(1-p)n≪p≪p+z1-∝2p(1-p)n
代入数据得
0.177≪P1≪0.259,,0.36≪P2≪0.456,0.35≪P3≪0.398。
所以,我们有95.45%的把握说学校恩格尔系数在80%及以上的学生所占的比重在17.7%到25.9%之间,恩格尔系数在50%到80%之间的学生所占的比重在36%到45.6%之间,恩格尔系数在50%及以下的学生所占的比重在35%到39.8%之间。即学校家庭收入贫困的学生所占的比重在17.7%到25.9%之间,家庭收入正常的学生所占的比重在36%到45.6%之间,家庭收入富足的学生所占的比重在35%到39.8%之间。
展开阅读全文