资源描述
统计学试验报告
一.个人信息:
姓名:平措
学号:09182139
专业班级:经济95
试验日期:2011年6月1日 星期三
二.实验内容:
1、将本班“概率”成绩搜集并整理成组数为5、组距为10的等距次数分布数列统计表,并依据此资料计算:
(1) 累计次数(向上累计、向下累计)
(2) 特征值:均值 、众数MO、中位数Me、四分位数QL、QU、标准差σ、标准差系数Vσ
(3) 绘制茎叶图、直方图和曲线图
(4) 利用图、表以及计算的指标对成绩分布特征作一简要分析。
解答:
1)按照1~59;60~69;70~79;80~89;90~100的情况分组,得到统计图如下:
Frequency
Percent
Valid Percent
Cumulative Percent
Valid
1.00
6
21.4
21.4
21.4
2.00
1
3.6
3.6
25.0
3.00
2
7.1
7.1
32.1
4.00
6
21.4
21.4
53.6
5.00
13
46.4
46.4
100.0
Total
28
100.0
100.0
由上表知,向上累计的次数为:6,7,9,15,28;
向下累计的次数分别为:13,19,21,22,28;
2)由spss软件可得下表:
均值:
众数:变量数组中出现次数最多的变量值;
中位数:将统计变量的值按大小顺序排列,处于变量数列中间位置的位置变量为中位数;
四分位数就是将数据分布四等分的三个数值:
Ql=60
Qu=94
方差:
标准差:
标准差系数:
3)茎叶图:
SCORE Stem-and-Leaf Plot
Frequency Stem & Leaf
4.00 Extremes (=<13)
1.00 3 . 6
.00 4 .
1.00 5 . 5
1.00 6 . 0
2.00 7 . 36
6.00 8 . 125679
13.00 9 . 0033446777899
Stem width: 10.00
Each leaf: 1 case(s)
直方图与曲线图:
4)经济95班概率论考试的成绩平均分为74.8929,水平相对较高,但成绩的标准差高达29份,说明经济95班的成绩分布很散,离散程度大,同时从直方图与茎叶图可直观看出经济95班高分与低分成绩都很多,中间水平的成绩很少。
2、《统计学》(第三版)教材P54 -8题:
1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。
月份 北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安
1 49 70 76 57 77 72 79 65 51 67
2 41 68 71 57 75 80 83 65 41 67
3 47 50 77 68 81 80 81 58 49 74
4 50 39 72 67 75 84 79 61 46 70
5 55 56 68 63 71 83 75 58 41 58
6 57 54 73 57 74 87 82 72 43 42
7 69 70 82 74 81 86 84 84 58 62
8 74 79 82 71 73 84 78 74 57 55
9 68 66 71 67 71 81 75 77 55 65
10 47 59 75 53 72 80 78 76 45 65
11 66 59 82 77 78 72 78 71 53 73
12 56 57 82 65 82 75 82 71 52 72
解答:
箱线图如下:
分析:从上面各个城市的平均湿度分布箱线图可看出,北京,长春,兰州这三个城市的最低平均湿度都非常低,只有大概40左右;与之相对的是南京,武汉,广州,成都,昆明这五个南方城市的最高平均湿度都很高,这符合南湿北干的地域特征。同时可看出,北京,长春,昆明,郑州四个城市的湿度跨度很大, 说明他们的湿度变化很大,与之相对的是武汉,广州,成都三个城市的湿度跨度小,变化小,较为稳定。
3.参数估计:《统计学》(第三版)教材P145 -3题:
某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):
3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2
4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3
2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5
4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
解答:
1)90%置信水平:
先根据样本求出样本均值;样本方差;
由此得出抽样平均误差
由置信水平为90%,知
所以抽样极限误差
故置信水平为90%时上网时间的置信区间为:
即(2.8635,3.7699)
Statistic
Std. Error
VAR00001
Mean
3.3167
.26822
90% Confidence Interval for Mean
Lower Bound
2.8635
Upper Bound
3.7699
5% Trimmed Mean
3.2994
Median
3.2500
Variance
2.590
Std. Deviation
1.60935
Minimum
.50
Maximum
6.40
Range
5.90
Interquartile Range
2.4500
Skewness
.211
.393
Kurtosis
-.888
.768
2)95%置信水平:
同理,当置信水平为95%时
所以抽样极限误差
故置信水平为90%时上网时间的置信区间为:
即(2.7721,3.8612)
Statistic
Std. Error
VAR00001
Mean
3.3167
.26822
95% Confidence Interval for Mean
Lower Bound
2.7721
Upper Bound
3.8612
5% Trimmed Mean
3.2994
Median
3.2500
Variance
2.590
Std. Deviation
1.60935
Minimum
.50
Maximum
6.40
Range
5.90
Interquartile Range
2.4500
Skewness
.211
.393
Kurtosis
-.888
.768
3)99%置信水平:
同理,当置信水平为99%时
所以抽样极限误差
故置信水平为90%时上网时间的置信区间为:
即(2.5861,4.0473)
Statistic
Std. Error
VAR00001
Mean
3.3167
.26822
99% Confidence Interval for Mean
Lower Bound
2.5861
Upper Bound
4.0473
5% Trimmed Mean
3.2994
Median
3.2500
Variance
2.590
Std. Deviation
1.60935
Minimum
.50
Maximum
6.40
Range
5.90
Interquartile Range
2.4500
Skewness
.211
.393
Kurtosis
-.888
.768
4.相关与回归分析:《统计学》(第三版)教材P247 -2题:
美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下:
航空公司名称
航班正点率(%)
投诉率(次/10万名乘客)
西南(Southwest)航空公司
81.8
0.21
大陆(Continental)航空公司
76.6
0.58
西北(Northwest)航空公司
76.6
0.85
美国(US Airways)航空公司
75.7
0.68
联合(United)航空公司
73.8
0.74
美洲(American)航空公司
72.2
0.93
德尔塔(Delta)航空公司
71.2
0.72
美国西部(Americawest)航空公司
70.8
1.22
环球(TWA)航空公司
68.5
1.25
(1)画出这些数据的散点图;
(2)根据散点图。表明二变量之间存在什么关系?
(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程;
(4)对估计的回归方程的斜率作出解释;
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
解答:
1) 散点图:
2) 根据上面的散点图可知,航班正点率与投诉率存在负相关的关系,既航班正点率越高,投诉率越低。
3)设投诉率为变量y,航班正点率为变量x,设回归方程为
则
所以回归方程为:y=-0.070x+6.018;
Spss运行结果如下:
Model Summary
Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1
.883(a)
.779
.747
.16082
a Predictors: (Constant), 正点率
ANOVA(b)
Model
Sum of Squares
df
Mean Square
F
Sig.
1
Regression
.638
1
.638
24.674
.002(a)
Residual
.181
7
.026
Total
.819
8
a Predictors: (Constant), 正点率
b Dependent Variable: 投诉率
Coefficients(a)
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
1
(Constant)
6.018
1.052
5.719
.001
正点率
-.070
.014
-.883
-4.967
.002
a Dependent Variable: 投诉率
4) 斜率为-0.070;这说明在误差允许范围内;航班正点率每提高一个百分点,投诉率便减小0.07;
5) 按照3)的回归方程,当航班正点率为80%时,每十万名乘客的投诉次数为6.018-0.070X80=0.418;
展开阅读全文