资源描述
第1章 统计与统计数据
1.1 (1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2 (1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3 (1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4 (1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5 (略)。
1.6 (略)。
第2章 数据的图表展示
2.1 (1) 属于顺序数据。
(2)频数分布表如下
服务质量等级评价的频数分布
服务质量等级
家庭数/频率
频率/%
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计
100
100
(3)条形图(略)
(4)帕累托图(略)。
2.2 (1)频数分布表如下
40个企业按产品销售收入分组表
按销售收入分组
/万元
企业数
/个
频率
/%
向上累积
向下累积
企业数
频率
企业数
频率
100以下
100~110
110~120
120~130
130~140
140以上
5
9
12
7
4
3
12.5
22.5
30.0
17.5
10.0
7.5
5
14
26
33
37
40
12.5
35.0
65.0
82.5
92.5
100.0
40
35
26
14
7
3
100.0
87.5
65.0
35.0
17.5
7.5
合计
40
100.0
—
—
—
—
(2)某管理局下属40个企分组表
按销售收入分组/万元
企业数/个
频率/%
先进企业
良好企业
一般企业
落后企业
11
11
9
9
27.5
27.5
22.5
22.5
合计
40
100.0
2.3 频数分布表如下
某百货公司日商品销售额分组表
按销售额分组/万元
频数/天
频率/%
25~30
30~35
35~40
40~45
45~50
4
6
15
9
6
10.0
15.0
37.5
22.5
15.0
合计
40
100.0
直方图(略)。
2.4 茎叶图如下
茎
叶
数据个数
1
8
8
9
3
2
0
1
1
3
3
6
8
8
8
9
9
9
12
3
1
3
5
6
9
5
4
1
2
3
6
6
7
6
5
0
1
2
7
4
箱线图(略)。
2.5 (1)排序略。
(2)频数分布表如下
100只灯泡使用寿命非频数分布
按使用寿命分组/小时
灯泡个数/只
频率/%
650~660
2
2
660~670
5
5
670~680
6
6
680~690
14
14
690~700
26
26
700~710
18
18
710~720
13
13
720~730
10
10
730~740
3
3
740~750
3
3
合计
100
100
(3)直方图(略)。
(4)茎叶图如下
茎
叶
65
1
8
66
1
4
5
6
8
67
1
3
4
6
7
9
68
1
1
2
3
3
3
4
5
5
5
8
8
9
9
69
0
0
1
1
1
1
2
2
2
3
3
4
4
5
5
6
6
6
7
7
8
8
8
8
9
9
70
0
0
1
1
2
2
3
4
5
6
6
6
7
7
8
8
8
9
71
0
0
2
2
3
3
5
6
7
7
8
8
9
72
0
1
2
2
5
6
7
8
9
9
73
3
5
6
74
1
4
7
2.6 (1)频数分布表如下
按重量分组
频率/包
40~42
2
42~44
3
44~46
7
46~48
16
48~50
17
52~52
10
52~54
20
54~56
8
56~58
10
58~60
4
60~62
3
合计
100
(2)直方图(略)。
(3)食品重量的分布基本上是对称的。
2.7 (1)频数分布表如下
按重量误差分组
频数/个
10~20
0
20~30
5
30~40
7
40~50
8
50~60
13
60~70
9
70~80
6
80~90
2
合计
50
(2)直方图(略)。
2.8 (1)属于数值型数据。
(2)分组结果如下
分组
天数/天
-25~-20
6
-20~-15
8
-15~-10
10
-10~-5
13
-5~0
12
0~5
4
5~10
7
合计
60
(3)直方图(略)。
2.9 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10 (1)茎叶图如下
A班
树茎
B班
数据个数
树 叶
树叶
数据个数
0
3
59
2
1
4
4
0448
4
2
97
5
122456677789
12
11
97665332110
6
011234688
9
23
98877766555554443332100
7
00113449
8
7
6655200
8
123345
6
6
632220
9
011456
6
0
10
000
3
(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析)
第3章 数据的概括性度量
3.1 (1);;。
(2);。
(3)。
(4)左偏分布。
3.2 (1);。
(2);。
(3);。
(4);。
(5)略。
3.3 (1)略。
(2);。
(3);。
(4)选方法一,因为离散程度小。
3.4 (1)=274.1(万元);Me=272.5 。
(2)QL=260.25;QU=291.25。
(3)(万元)。
3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3.6 (1)=426.67(万元);(万元)。
(2);。
3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2) 男生:=27.27(磅),(磅);
女生:=22.73(磅),(磅);
(3)68%;
(4)95%。
3.9 通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高
出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.10 通过标准化值来判断,各天的标准化值如下表
日期
周一
周二
周三
周四
周五
周六
周日
标准化值Z
3
-0.6
-0.2
0.4
-1.8
-2.2
0
周一和周六两天失去了控制。
3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:;
幼儿组身高的离散系数:;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
3.12 下表给出了一些主要描述统计量,请读者自己分析。
方法A
方法B
方法C
平均
165.6
平均
128.73
平均
125.53
中位数
165
中位数
129
中位数
126
众数
164
众数
128
众数
126
标准偏差
2.13
标准偏差
1.75
标准偏差
2.77
极差
8
极差
7
极差
12
最小值
162
最小值
125
最小值
116
最大值
170
最大值
132
最大值
128
3.13 (1)方差或标准差;(2)商业类股票;(3)(略)。
第4章 抽样与参数估计
4.1 (1)200。(2)5。(3)正态分布。(4)。
4.2 (1)32。(2)0.91。
4.3 0.79。
4.4 (1)。(2)。
4.5 (1)1.41。(2)1.41,1.41,1.34。
4.6 (1)0.4。(2)0.024 。(3)正态分布。
4.7 (1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越小。
4.8 (1);(2)E=4.2;(3)(115.8,124.2)。
4.9 (87819,121301)。
4.10 (1)81±1.97;(2)81±2.35;(3)81±3.10。
4.11 (1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702)
4.12 (1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。
4.13 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
4.14 (7.1,12.9)。
4.15 (7.18,11.57)。
4.16 (1)(148.9,150.1);(2)中心极限定理。
4.17 (1)(100.9,123.7);(2)(0.017,0.183)。
4.18 (15.63,16.55)。
4.19 (10.36,16.76)。
4.20 (1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。
4.21 (18.11%,27.89%);(17.17%,22.835)。
4.22 167。
4.23 (1)2522;(2)601;(3)268。
4.24 (1)(51.37%,76.63%);(2)36。
4.25 (1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。
4.26 (1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。
4.27 48。
4.28 139。
第5章 假设检验
5.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:,。
5.2 =“某一品种的小鸡因为同类相残而导致的死亡率”,,。
5.3 ,。
5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
5.5 (1)检验统计量,在大样本情形下近似服从标准正态分布;
(2)如果,就拒绝;
(3)检验统计量=2.94>1.645,所以应该拒绝。
5.6 =3.11,拒绝。
5.7 ,不拒绝。
5.8 ,拒绝。
5.9 ,不拒绝
5.10 ,拒绝。
5.11 =1.93,不拒绝。
5.12 =7.48,拒绝。
5.13 =206.22,拒绝。
5.14 ,拒绝。
第6章 方差分析
6.1 (或),不能拒绝原假设。
6.2 (或),拒绝原假设。
6.3 (或),拒绝原假设。
6.4 (或),拒绝原假设。
6.5 (或),拒绝原假设。
,拒绝原假设;
,不能拒绝原假设;
,拒绝原假设。
6.6 方差分析表中所缺的数值如下表:
差异源
SS
df
MS
F
P-value
F crit
组间
420
2
210
1.478
0.245946
3.354131
组内
3836
27
142.07
—
—
—
总计
4256
29
—
—
—
—
(或),不能拒绝原假设。
第7章 相关与回归分析
7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)。
(3)检验统计量,拒绝原假设,相关系数显著。
7.2 (1)散点图(略)。
(2)。
7.3 (1)表示当时的期望值。
(2)表示每变动一个单位平均下降0.5个单位。
(3)。
7.4 (1)。
(2)。
7.5 (1)散点图(略)。
(2)。
(3)。回归系数表示运送距离每增加1公里,运送时间平均增加0.00358天。
7.6 (1) 散点图(略)。二者之间为高度的正线性相关关系。
(2),二者之间为高度的正线性相关关系。
(3)估计的回归方程为:。回归系数表示人均GDP每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。
(5)检验统计量,拒绝原假设,线性关系显著。
(6)(元)。
(7)置信区间:[1990.749,2565.464];预测区间:[1580.463,2975.750]。
7.7 (1) 散点图(略),二者之间为负的线性相关关系。
(2)估计的回归方程为:。回归系数表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。
(3)检验统计量(P-Value=0.001108<),拒绝原假设,回归系数显著。
(4)(次)。
(5)置信区间:(37.660,70.619);预测区间:(7.572,100.707)。
7.8 Excel输出的结果如下(解释与分析请读者自己完成)
Multiple R
0.7951
R Square
0.6322
Adjusted R Square
0.6117
标准误差
2.6858
观测值
20
方差分析
df
SS
MS
F
Significance F
回归分析
1
223.1403
223.1403
30.9332
2.79889E-05
残差
18
129.8452
7.2136
总计
19
352.9855
Coefficients
标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept
49.3177
3.8050
12.9612
0.0000
41.3236
57.3117
X Variable 1
0.2492
0.0448
5.5618
0.0000
0.1551
0.3434
7.9 (1)方差分析表中所缺的数值如下
方差分析表
变差来源
df
SS
MS
F
Significance F
回归
1
1422708.6
1422708.6
354.277
2.17E-09
残差
10
40158.07
4015.807
—
—
总计
11
1642866.67
—
—
—
(2)。表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。
(3)。
(4)。回归系数表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
(5)Significance F=2.17E-09<,线性关系显著。
7.10 ;;。
7.11 (1)27。
(2)4.41。
(3)拒绝。
(4)。
(5)拒绝。
7.12 (1)。
(2)。
7.13 ;。
7.14 ;预测28.586。
7.15 (略)。
7.16 (1)显著。
(2)显著。
(3)显著。
7.17 (1)。
(2)。
(3)不相同。方程(1)中的回归系数表示电视广告费用每增加1万元,月销售额平均增加1.6039万元;方程(1)中的回归系数表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。
(4);。
(5)的P-Value=0.0007,的P-Value=0.0098,均小于,两个回归系数均显著。
7.18 (1)
(2)回归系数表示降雨量每增加1毫mm,小麦收获量平均增加22.3865kg/hm2;回归系数表示温度每增加1,小麦收获量平均增加327.6717kg/mh2。
(3)可能存在。
7.19 (1)。
(2);。
(3)Significance F=3.88E-08<,线性关系显著。
(4)的P-Value=0.1311>,不显著;的P-Value=0.0013<,显著;的P-Value=0.0571>,不显著。
第8章 时间序列分析和预测
8.1 (1)时间序列图(略)。
(2)13.55%。
(3)1232.90(亿元)。
8.2 (1)时间序列图(略)。
(2)1421.2(公斤/公顷)。
(3)时的预测值:,误差均方=291455; 时的预测值:,误差均方=239123。更合适。
8.3 (1)3期移动平均预测值=630.33(万元)。
(2)时的预测值:,误差均方=87514.7; 时的预测值:,误差均方=62662.5;时的预测值:,误差均方=50236。更合适
(3)趋势方程。估计标准误差。
8.4 (1)趋势图(略)。
(2)趋势方程。2001年预测值=3336.89(亿元)。
8.5 (1)趋势图(略)。
(2)线性趋势方程,2000年预测值=585.65(万吨)。
8.6 线性趋势:;二次曲线:;三次曲线:。
8.7 (1)原煤产量趋势图(略)。
(2)趋势方程,预测值(亿吨)。
8.8 (1)图形(略)。
(2)移动平均法或指数平滑法。
(3)移动平均预测=72.49(万元);指数平滑法预测=72.5(万元)( )。
8.9 (1)略。
(2)结果如下
2001年/月
时间编号
季节指数
回归预测值
最终预测值
1
97
1.0439
3056.30
3190.48
2
98
0.9939
3077.50
3058.87
3
99
0.9593
3098.71
2972.48
4
100
0.9398
3119.92
2931.99
5
101
0.9439
3141.13
2964.88
6
102
0.9589
3162.33
3032.30
7
103
0.9287
3183.54
2956.43
8
104
0.9261
3204.75
2967.86
9
105
0.9814
3225.96
3166.05
10
106
1.0075
3247.16
3271.51
11
107
1.0472
3268.37
3422.77
12
108
1.2694
3289.58
4175.95
8.10 各季节指数如下
1季度
2季度
3季度
4季度
季节指数
0.7517
0.8513
1.2343
1.1627
季节变动图(略)。
计算趋势:分离季节因素后的趋势方程为:。图形(略)
周期波动图(略)。
8.11 各月季节指数如下
1月
2月
3月
4月
5月
6月
0.6744
0.6699
0.7432
0.7903
0.8061
0.8510
7月
8月
9月
10月
11月
12月
0.7552
0.3449
0.9619
1.1992
1.8662
2.3377
季节变动图(略)。
计算趋势:分离季节因素后的趋势方程为:。图形(略)。
周期波动图(略)。
随机波动图(略)。
第9章 指数
9.1 (1)。(2)。(3)。(4)13920元=26190元-12270元。
9.2 (1)111.72%。(2)111.60%。(3)100.10%。(4)15.3万元=15.1532万元+0.1468万元。
9.3 (1)2.62%;8016元。(2)28.42%;124864元。(3)143.37%;132880元。
9.4 (1)单位成本增长11.11%。(2);。
9.5 结果如下表:
年份
缩减后的人均GDP
1990
1584.9
1991
1817.2
1992
2149.4
1993
2562.3
1994
3161.2
1995
4145.2
1996
5148.7
1997
5889.1
1998
6357.9
1999
6640.0
2000
7049.8
9.6 ,下跌1.48%。
9.7
9.8
9.9
9.10
9.11 (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)
9.12
9.13
展开阅读全文