1、第二章、练习题及解答 1.某商品专卖店2012年10月8日销售流水帐如下 销售单号 销售员姓名 性别 销售型号 单价 销售数量 销售额 071008001 赵灵儿 女 C型 1200 1 1200 071008002 赵灵儿 女 C型 1200 1 1200 071008003 李逍遥 男 A型 800 1 800 071008004 林月如 女 B型 1000 1 1000 071008005 赵灵儿 女 A型 800 1 800 071008006 赵灵儿 女 C型 1200 1 1200
2、 071008007 林月如 男 A型 800 1 800 071008008 李逍遥 女 C型 1200 1 1200 071008009 李逍遥 女 A型 800 1 800 071008010 赵灵儿 女 B型 1000 1 1000 071008011 林月如 男 C型 1200 1 1200 071008012 林月如 女 C型 1200 1 1200 071008013 赵灵儿 女 A型 800 1 800 071008014 林月如 女 C型 1200 1 1200 0
3、71008015 赵灵儿 女 C型 1200 1 1200 要求:(1)利用excel软件,分别按销售员和销售型号进行分类汇总。 (2)利用excel软件,按销售员统计其不同销售型号的销售量与销售额(数据透视表). 解:(1) 按销售型号进行汇总 销售单号 销售员姓名 性别 销售型号 单价 销售数量 销售额 71008003 李逍遥 男 A型 800 1 800 71008005 赵灵儿 女 A型 800 1 800 71008007 林月如 男 A型 800 1 800 71008009 李逍遥
4、女 A型 800 1 800 71008013 赵灵儿 女 A型 800 1 800 A型 汇总 5 4000 71008004 林月如 女 B型 1000 1 1000 71008010 赵灵儿 女 B型 1000 1 1000 B型 汇总 2 2000 71008001 赵灵儿 女 C型 1200 1 1200 71008002 赵灵儿 女 C型 1200 1 1200 71008006 赵灵儿 女 C型 1200 1 1200 71
5、008008 李逍遥 女 C型 1200 1 1200 71008011 林月如 男 C型 1200 1 1200 71008012 林月如 女 C型 1200 1 1200 71008014 林月如 女 C型 1200 1 1200 71008015 赵灵儿 女 C型 1200 1 1200 C型 汇总 8 9600 总计 15 15600 (2) 按销售员统计其不同销售型号的销售量与销售额(数据透视表) 销售员 销售型号 数据 A型 B型 C型 总计 李逍遥
6、销售数量 2 0 1 3 销售额 1600 0 1200 2800 林月如 销售数量 1 1 3 5 销售额 800 1000 3600 5400 赵灵儿 销售数量 2 1 4 7 销售额 1600 1000 4800 7400 销售数量合计 5 2 8 15 销售额合计 4000 2000 9600 15600 2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下: 700 716 728 719 685 709 691 684 705 718 706
7、 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701
8、 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(1)利用excel软件,对以上数据进行排序. (2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。 解:(1) 数据排序结果(升序) 651 658 661 664 665 666 668 671 673 674 676 677 679 681
9、 681 682 683 683 683 684 685 685 685 688 688 689 689 690 690 691 691 691 691 692 692 692 693 693 694 694 695 695 696 696 696 697 697 698 698 698 698 699 699 700 700 701 701 702 702 703 704 705 706 706 706 707 707 708 708 708 709 710 710 712
10、 712 713 713 715 716 717 717 718 718 719 720 721 722 722 725 726 727 728 729 729 733 735 736 741 747 749 (2) 灯泡的使用寿命频数分布表 分组 频数(只) 频率(%) 650—660 2 2 660-670 5 5 670-680 6 6 680-690 14 14 690—700 26 26 700-710 18 18 710-720 13 13 720-730
11、10 10 730-740 3 3 740-750 3 3 合计 100 100 0 5 10 15 20 25 30 660 670 680 690 700 710 720 730 740 750 直方图 3.某公司下属40个销售点2012年的商品销售收入数据如下: 单位:万元 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 1
12、10 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1) 频数分布表 分组 频数(个) 频率(%) 85-95 3 7。5 95-105 6 15.0 105-115 9 22。5 115—125 11 27。5 125-135 4 10。0 135-145 5
13、 12。5 145—155 2 5.0 合计 40 100 直方图 0 2 4 6 8 10 12 95 105 115 125 135 145 155 或: (2)茎叶图 树茎 树叶 数据个数 8 9 10 11 12 13 14 15 78 257 033455788 023455677899 0345679 5678 26 2 2 3 9 12 7 4 2 1 4。2006~2011年我国就业人口人员数(年底数)如下表所示: 年份 就业人员 (万人) 三次产业就业人数
14、第一产业 第二产业 第三产业 2006 74978 31941 18894 24143 2007 75321 30731 20186 24404 2008 75564 29923 20553 25087 2009 75828 28890 21080 25857 2010 76105 27931 21842 26332 2011 76420 26594 22544 27282 要求: (1)
15、利用excel软件,绘制就业人数的条形图。 (2)分别绘制一、二、三次产业就业人数的条形图并比较分析。 (3)根据2006年和2011年这两年就业人数的三次产业构成数据,分别绘制饼形图并比较分析. 解:(1) (2) 二、三产业就业人数条形图请自己绘制。 (3) 第一产业就业人数及其比重下降,第二、三产业人数比重上升。具体情况自己分析。 第三章、练习题及解答 1. 已知下表资料: 日产量(件) 工人数(人) 工人比重(%) 25 30 35 40 45 20 50 80 36 14 10 25 40 18 7 合
16、计 200 100 试根据频数和频率资料,分别计算工人平均日产量. 解: 计算表 日产量(件)x 工人数(人)f 工人比重(%)f/∑f xf xf/∑f 25 20 10 500 2.5 30 50 25 1500 7。5 35 80 40 2800 14 40 36 18 1440 7.2 45 14 7 630 3。15 合 计 200 100 6870 34.35 根据频数计算工人平均日产量:(件) 根据频率计算工人平均日产量:(件)
17、结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2。某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 单位产品成本(元/件) 单位数 产量比重(%) 10~12 12~14 14~18 2 3 4 20 42 38 合计 9 100 试计算这9个企业的平均单位成本.解: 单位产品成本(元/件) 单位数 产量比重(%) f/∑f 组中值(元)x X·f/∑f 10~12 2 20 11 2。2 12~14 3 42 13 5.46 14~18 4 38 16
18、6。08 合计 9 100 — 13.74 这9个企业的平均单位成本==13。74(元) 3.某专业统计学考试成绩资料如下: 按成绩分组(分) 学生数(人) 60以下 60~70 70~80 80~90 90~100 100以上 4 8 14 20 9 5 合 计 60 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm—1=14,fm+1=9, (分) 中位数的计算: 根据和向上累积频数信息知,中位数在80~90这一组。 (分)
19、4。利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可) 解: 计算表 日产量(件)x 工人数(人)f 25 20 1748。45 30 50 946.125 35 80 33.8 40 36 1149。21 45 14 1587.915 合 计 200 5465.5 5.一家公司在招收职员时,首先要通过两项能力测试.在A项测试中,平均分数是80分,标准差是15分;在B项测试中,平均分数是200分,标准差是50分.一位应试者在A项测试中得了95分
20、在B项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想? 解:计算各自的标准分数:, 因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想. 第四章 练习题及解答 1.解:由于Z服从标准正态分布,查表得 ,, ,, (1) (2) (3) 2.解:对数据进行整理,30个样本数据极差为1。99.将数据分为7组,组距为0。3,如下表所示: 分组 频数 8。51—8.80 2 8.81-9。10 3 9.11—9。40 7 9。41-9.70 9 9.71—10。00 3 10.01—10。30 5 10.31—10
21、60 1 对应频数直方图为: 观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。 3。解:已知:,,同时由于样本量很大,可以看作重置抽样来处理。 根据公式4。5可以得到: (1) (2), (3)根据中心极限定理,近似服从均值为200,标准差为5的正态分布。 4.解:已知:,同时由于样本量很大,可以看作重置抽样来处理。 根据公式4.7可以得到: (1) (2),; (3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布. 5.解: (1), ; (2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有种可能样本
22、 (3)如下表所示: 样本序号 样本单位 样本均值 样本序号 样本单位 样本均值 1 54,54 54 19 63,54 58。5 2 54,55 54.5 20 63,55 59 3 54,59 56.5 21 63,59 61 4 54,63 58。5 22 63,63 63 5 54,64 59 23 63,64 63。5 6 54,68 61 24 63,68 65.5 7 55,54 54。5 25 64,54 59 8 55,55 55 26 64,55 59。5 9
23、 55,59 57 27 64,59 61。5 10 55,63 59 28 64,63 63。5 11 55,64 59.5 29 64,64 64 12 55,68 61.5 30 64,68 66 13 59,54 56。5 31 68,54 61 14 59,55 57 32 68,55 61。5 15 59,59 59 33 68,59 63。5 16 59,63 61 34 68,63 65。5 17 59,64 61.5 35 68,64 66 18 59,68 63.5
24、 36 68,68 68 (4)样本均值频数表: 分组 频数 54-56 4 56-58 4 58—60 9 60—62 7 62—64 7 64-66 3 66-68 2 样本均值频数直方图: 由上图可以发现,样本均值近似服从正态分布; (5)由样本方差均值公式可以得到: ; 可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。 第五章、练习题及解答 1。解:(1)已知,故:; (2)由题目可知:,故查表可知: 估计误差; (3)由题目可知:,由置信区间公式可得: 即快餐店所有顾客午餐平均花费金额的95%的置信区间为(1
25、15。8,124.2)元。 2.解: (1)总体服从正态分布,,则的95%置信区间为: (2)总体不服从正态分布,且样本属于大样本,,则的95%置信区间为: (3)总体不服从正态分布,未知,因此使用样本方差代替总体方差,,则的90%置信区间为: (4)总体不服从正态分布,未知,因此使用样本方差代替总体方差, ,则的95%置信区间为: 3。解:整理数据可以得到,,,由于属于大样本,所以使用正态分布来构建置信区间. 当,该校大学生平均上网时间的90%置信区间为: 小时 当,该校大学生平均上网时间的95%置信区间为: 小时 当,该校大学生平均上网时间的95%置信区间为: 小时
26、 4。解: (1)由题目可知:,,,由于抽取的样本属于大样本,所以,总体中赞成新措施的户数比例的95%置信区间为: (2)由题目可知:估计误差,,,得到: 即样本个数至少为62户。 或直接将带入n确定的公式,即, 5.解: (1)整理数据可以得到:,,,由于抽取的样本属于小样本,所以由CHIINV函数得:,,由此可以得到第一种排队方式等待时间标准差的95%的置信区间为: (2)整理数据可以得到:,,,第二种排队方式等待时间标准差的95%的置信区间为: (3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。 6.解
27、由题目可以得到: 当 ,的95%置信区间为: 当,的95%置信区间为: 7。解:由样本数据计算得到: ,, 则自信心得分之差的95%的置信区间为: 8.解:由题目可以得到:,,, 当,的90%置信区间为: 当,的95%置信区间为: 9.解:由题目可以得到:,,, , 两个总体方差比的95%的置信区间为: 10.解:由题目可以得到:使用过去经验数据,则可以认为 已知,即,在95%置信度下,估计误差,因此: 即样本个数至少为139个. 11。解:由题目可以得到:总体 已知,即,,,在95%置信度下,估计误差,因此: 即两个总体的样本各至少为57个。 第六章、练习
28、题及解答 1。解:由题目可以得到:,; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:; 在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。 (或利用Excel的“1—NORMSDIST(3。1113)”函数得到检验P=0。0009<0.01,则拒绝原假设) 2.解:由题目可以得到:,根据样本数据计算得到:,; 提出原假设与备择假设:,; 该检验属于左侧单边检验,因此得到拒绝域为:; 在大样本且总体方差未知条件下检验统计量为:,落入拒绝域
29、中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值. (或利用Excel的“NORMSDIST(-2。3949)”函数得到检验P=0。0083〈0。01,则拒绝原假设) 3.解:由题目可以得到:,计算样本数据得到,; 提出原假设与备择假设:,; 该检验属于双边检验,因此得到拒绝域为:; 在服从正态分布的小样本且总体方差未知条件下检验统计量为: ,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产的金属板不符合要求. (或利用“TDIST(1.04,19,2)”函数得到检验P=0。3114>0。05,则不能拒绝原假
30、设) 4.解:由题目可以得到:,计算样本数据得到; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:; 在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1—NORMSDIST(2.4412)”函数得到检验P=0。0073<0.05,则拒绝原假设) 5。解:提出原假设与备择假设:,; 在大样本条件下检验统计量为: 利用“2*(1-NORMSDIST(5。1450))”函数,得到双尾值为,由于,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。
31、 6。解:设:“看后”平均得分为 ,“看前”平均得分,“看后”平均得分与“看前"平均得分之差为; 提出原假设与备择假设:,; 根据样本数据计算得到:,; 在配对的小样本条件下检验统计量为: 利用Excel “=TDIST(1。3572, 7, 1)”得到的单尾概率值为0。10842,由于,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。 7。解:设:方法一培训测试平均得分为,方法二培训测试平均得分为; 提出原假设与备择假设:,; 根据样本数据计算得到: ,,,,, 由于小样本情况下总体方差未知且不相等,t分布自由度为: 在小样本条件下检验
32、统计量为: 利用Excel的“=TDIST(5.2183, 24, 2)”函数,得到的双尾概率值为0.00002,由于,拒绝原假设,认为两种培训方法的效果存在显著差异。 8.解: 设:男性经理认为自己成功的人数比例为 , 女性经理认为自己成功的人数比例为,两个样本合并后得到的合并比例为; 提出原假设与备择假设:,; 根据样本数据计算得到:两个样本的比例分别为:41%,24% 两个样本合并后得到的合并比例; 检验统计量为: 利用Excel的“=2*(1—NORMSDIST(2。5373))”函数,得到检验概率值为0.0112,由于,所以拒绝原假设,认为男女经理认为自己成功的
33、人数比例具有显著差异。 9。解:设:新肥料获得的平均产量为,旧肥料获得的平均产量为; (1)两种肥料产量的方差未知但相等,即时: 提出原假设和备择假设: ; 根据样本数据计算得: ,,,, ,; 总体方差的合并估计量为: 检验统计量为: 利用Excel的“=TDIST(5。4271, 38, 1)”函数,得到单尾概率值为0。000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。 (以上也可由Excel中的[t-检验:双样本等方差假设]给出) 两种肥料产量的方差未知且不相等,即时: 提出原假设与备择假设:; 根据样本数据计算得
34、到: ,,,, , 由于小样本情况下总体方差未知且不相等,t分布自由度为: 在小样本条件下检验统计量为: 利用Excel的“=TDIST(5。4271, 37, 1)"函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。 (以上也可由Excel中的[t-检验:双样本异方差假设]给出) (2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本1 提出原假设与备择假设:; 利用Excel中的“-检验:双样本方差”()得到的检验结果如下表所示: F—检验 双样本方差分析 变量 1 变量 2 平均 109。9
35、 100。7 方差 33。35789 24.11579 观测值 20 20 df 19 19 F 1。383239 P(F<=f) 单尾 0。24311 F 单尾临界 2.526451 由于,不能拒绝原假设,没有证据表明两种肥料产量的方差有显著差异。 10.解:设:机器一为样本1,机器二为样本1 提出原假设与备择假设:; 利用Excel的“—检验:双样本方差”()得到的检验结果如下表所示: F-检验 双样本方差分析 变量 1 变量 2 平均 3.3284 3.278181818 方差 0.048889 0。005901299 观测值 25 22 df 24 21 F 8。284447623 P(F〈=f) 单尾 3.61079E—06 F 单尾临界 2.367525575 由于,拒绝原假设,认为两种肥料产量的方差有显著差异。






