1、第二章、练习题及解答1.某商品专卖店2012年10月8日销售流水帐如下销售单号销售员姓名性别销售型号单价销售数量销售额071008001赵灵儿女C型120011200071008002赵灵儿女C型120011200071008003李逍遥男A型8001800071008004林月如女B型100011000071008005赵灵儿女A型8001800071008006赵灵儿女C型120011200071008007林月如男A型8001800071008008李逍遥女C型120011200071008009李逍遥女A型8001800071008010赵灵儿女B型100011000071008011
2、林月如男C型120011200071008012林月如女C型120011200071008013赵灵儿女A型8001800071008014林月如女C型120011200071008015赵灵儿女C型120011200要求:(1)利用excel软件,分别按销售员和销售型号进行分类汇总。 (2)利用excel软件,按销售员统计其不同销售型号的销售量与销售额(数据透视表).解:(1) 按销售型号进行汇总销售单号销售员姓名性别销售型号单价销售数量销售额71008003李逍遥男A型800180071008005赵灵儿女A型800180071008007林月如男A型800180071008009李逍遥女
3、A型800180071008013赵灵儿女A型8001800A型 汇总5400071008004林月如女B型10001100071008010赵灵儿女B型100011000B型 汇总2200071008001赵灵儿女C型12001120071008002赵灵儿女C型12001120071008006赵灵儿女C型12001120071008008李逍遥女C型12001120071008011林月如男C型12001120071008012林月如女C型12001120071008014林月如女C型12001120071008015赵灵儿女C型120011200C型 汇总89600总计1515600(
4、2) 按销售员统计其不同销售型号的销售量与销售额(数据透视表)销售员销售型号数据A型B型C型总计李逍遥销售数量2013销售额1600012002800林月如销售数量1135销售额800100036005400赵灵儿销售数量2147销售额1600100048007400销售数量合计52815销售额合计400020009600156002.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:70071672871968570969168470571870671571272269170869069270770170872969468169568570666173566
5、5668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688要求:(1)利用excel软件,对以上数据进行排序. (2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。解:(1) 数据排序结果(升序)651658661664665
6、666668671673674676677679681681682683683683684685685685688688689689690690691691691691692692692693693694694695695696696696697697698698698698699699700700701701702702703704705706706706707707708708708709710710712712713713715716717717718718719720721722722725726727728729729733735736741747749(2) 灯泡的使用寿命频数分布
7、表分组频数(只)频率(%)65066022660-67055670-68066680-69014146907002626700-7101818710-7201313720-7301010730-74033740-75033合计100100051015202530660670680690700710720730740750直方图3.某公司下属40个销售点2012年的商品销售收入数据如下: 单位:万元1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119
8、138112146113126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。解:(1) 频数分布表分组频数(个)频率(%)85-9537。595-105615.0105-115922。51151251127。5125-135410。0135-145512。514515525.0合计40100直方图02468101295105115125135145155或:(2)茎叶图树茎树叶数据个数8910111213141578257033455788023455677899034567956782622391274214。20062011年我
9、国就业人口人员数(年底数)如下表所示:年份就业人员(万人)三次产业就业人数第一产业第二产业第三产业 2006 74978 31941 18894 24143 2007 75321 30731 20186 24404 2008 75564 29923 20553 25087 2009 75828 28890 21080 25857 2010 76105 27931 21842 26332 2011 76420 26594 22544 27282要求: (1)利用excel软件,绘制就业人数的条形图。(2)分别绘制一、二、三次产业就业人数的条形图并比较分析。 (3)根据2006年和2011年这两年
10、就业人数的三次产业构成数据,分别绘制饼形图并比较分析.解:(1) (2)二、三产业就业人数条形图请自己绘制。(3) 第一产业就业人数及其比重下降,第二、三产业人数比重上升。具体情况自己分析。第三章、练习题及解答1. 已知下表资料:日产量(件)工人数(人)工人比重()2530354045205080361410254018 7合 计200100试根据频数和频率资料,分别计算工人平均日产量.解: 计算表日产量(件)x工人数(人)f工人比重()f/fxfxf/f2520105002.530502515007。535804028001440361814407.2451476303。15合 计20010
11、0687034.35根据频数计算工人平均日产量:(件)根据频率计算工人平均日产量:(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。2。某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:单位产品成本(元/件)单位数产量比重(%)101212141418234204238合计9100试计算这9个企业的平均单位成本.解:单位产品成本(元/件)单位数产量比重(%)f/f组中值(元)xXf/f1012220112。21214342135.461418438166。08合计910013.74这9个企业的平均单位成本=13。74(元)3.某专业
12、统计学考试成绩资料如下:按成绩分组(分)学生数(人)60以下607070808090 90100 100以上 4 81420 9 5合 计60试计算众数、中位数。解:众数的计算:根据资料知众数在8090这一组,故L=80,d=90-80=10,fm=20,fm1=14,fm+1=9, (分)中位数的计算:根据和向上累积频数信息知,中位数在8090这一组。(分)4。利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)解: 计算表日产量(件)x工人数(人)f25201748。453050946.125358033.840361149。2145141587.915
13、合 计2005465.55.一家公司在招收职员时,首先要通过两项能力测试.在A项测试中,平均分数是80分,标准差是15分;在B项测试中,平均分数是200分,标准差是50分.一位应试者在A项测试中得了95分,在B项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想?解:计算各自的标准分数:,因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想.第四章 练习题及解答1.解:由于Z服从标准正态分布,查表得,(1)(2)(3)2.解:对数据进行整理,30个样本数据极差为1。99.将数据分为7组,组距为0。3,如下表所示:分组频数8。518.8028.81-9。1039.11
14、9。4079。41-9.7099.7110。00310.0110。30510.3110.601对应频数直方图为:观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。3。解:已知:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4。5可以得到:(1)(2),(3)根据中心极限定理,近似服从均值为200,标准差为5的正态分布。4.解:已知:,同时由于样本量很大,可以看作重置抽样来处理。根据公式4.7可以得到:(1)(2),;(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布.5.解:(1),;(2)由于从总体中重置抽取的样本,考虑抽取顺序情况
15、下共有种可能样本。(3)如下表所示:样本序号样本单位样本均值样本序号样本单位样本均值154,54541963,5458。5254,5554.52063,5559354,5956.52163,5961454,6358。52263,6363554,64592363,6463。5654,68612463,6865.5755,5454。52564,5459855,55552664,5559。5955,59572764,5961。51055,63592864,6363。51155,6459.52964,64641255,6861.53064,68661359,5456。53168,54611459,55
16、573268,5561。51559,59593368,5963。51659,63613468,6365。51759,6461.53568,64661859,6863.53668,6868(4)样本均值频数表:分组频数54-56456-58458609606276264764-66366-682样本均值频数直方图:由上图可以发现,样本均值近似服从正态分布;(5)由样本方差均值公式可以得到:;可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。第五章、练习题及解答1。解:(1)已知,故:;(2)由题目可知:,故查表可知:估计误差;(3)由题目可知:,由置信区间公式可得:即快餐店所有顾客午
17、餐平均花费金额的95的置信区间为(115。8,124.2)元。2.解:(1)总体服从正态分布,则的95置信区间为:(2)总体不服从正态分布,且样本属于大样本,则的95置信区间为:(3)总体不服从正态分布,未知,因此使用样本方差代替总体方差,则的90置信区间为:(4)总体不服从正态分布,未知,因此使用样本方差代替总体方差, ,则的95%置信区间为:3。解:整理数据可以得到,由于属于大样本,所以使用正态分布来构建置信区间.当,该校大学生平均上网时间的90%置信区间为:小时当,该校大学生平均上网时间的95置信区间为:小时当,该校大学生平均上网时间的95%置信区间为:小时4。解:(1)由题目可知:,由
18、于抽取的样本属于大样本,所以,总体中赞成新措施的户数比例的95%置信区间为:(2)由题目可知:估计误差,,得到:即样本个数至少为62户。或直接将带入n确定的公式,即,5.解:(1)整理数据可以得到:,由于抽取的样本属于小样本,所以由CHIINV函数得:,,由此可以得到第一种排队方式等待时间标准差的95的置信区间为:(2)整理数据可以得到:,,第二种排队方式等待时间标准差的95%的置信区间为:(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。6.解:由题目可以得到:当 ,的95%置信区间为:当,的95置信区间为:7。解:由样本数据
19、计算得到:,则自信心得分之差的95的置信区间为:8.解:由题目可以得到:,,, 当,的90置信区间为:当,的95%置信区间为:9.解:由题目可以得到:,,两个总体方差比的95%的置信区间为:10.解:由题目可以得到:使用过去经验数据,则可以认为 已知,即,在95置信度下,估计误差,因此:即样本个数至少为139个.11。解:由题目可以得到:总体 已知,即,,,在95置信度下,估计误差,因此:即两个总体的样本各至少为57个。第六章、练习题及解答1。解:由题目可以得到:,; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:; 在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝
20、原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。 (或利用Excel的“1NORMSDIST(3。1113)”函数得到检验P=0。00090。05,则不能拒绝原假设)4.解:由题目可以得到:,计算样本数据得到; 提出原假设与备择假设:,; 该检验属于右侧单边检验,因此得到拒绝域为:;在大样本条件下检验统计量为:,落入拒绝域中,因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1NORMSDIST(2.4412)”函数得到检验P=0。00730.05,则拒绝原假设)5。解:提出原假设与备择假设:,;在大样本条件下检验统计量为:利用“2*(
21、1-NORMSDIST(5。1450)”函数,得到双尾值为,由于,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。6。解:设:“看后”平均得分为 ,“看前”平均得分,“看后”平均得分与“看前平均得分之差为; 提出原假设与备择假设:,; 根据样本数据计算得到:,;在配对的小样本条件下检验统计量为:利用Excel “=TDIST(1。3572, 7, 1)”得到的单尾概率值为0。10842,由于,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。7。解:设:方法一培训测试平均得分为,方法二培训测试平均得分为; 提出原假设与备择假设:,;根据样本数据计算得到:,,,,由于小样本情
22、况下总体方差未知且不相等,t分布自由度为:在小样本条件下检验统计量为:利用Excel的“=TDIST(5.2183, 24, 2)”函数,得到的双尾概率值为0.00002,由于,拒绝原假设,认为两种培训方法的效果存在显著差异。8.解: 设:男性经理认为自己成功的人数比例为 , 女性经理认为自己成功的人数比例为,两个样本合并后得到的合并比例为; 提出原假设与备择假设:,;根据样本数据计算得到:两个样本的比例分别为:41,24两个样本合并后得到的合并比例;检验统计量为:利用Excel的“=2(1NORMSDIST(2。5373))”函数,得到检验概率值为0.0112,由于,所以拒绝原假设,认为男女
23、经理认为自己成功的人数比例具有显著差异。9。解:设:新肥料获得的平均产量为,旧肥料获得的平均产量为;(1)两种肥料产量的方差未知但相等,即时:提出原假设和备择假设: ; 根据样本数据计算得:,,, ,; 总体方差的合并估计量为:检验统计量为: 利用Excel的“=TDIST(5。4271, 38, 1)”函数,得到单尾概率值为0。000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由Excel中的t-检验:双样本等方差假设给出)两种肥料产量的方差未知且不相等,即时: 提出原假设与备择假设:;根据样本数据计算得到:,, ,由于小样本情况下总体方差未知且不相等,t分
24、布自由度为:在小样本条件下检验统计量为:利用Excel的“=TDIST(5。4271, 37, 1)函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。(以上也可由Excel中的t-检验:双样本异方差假设给出)(2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本1 提出原假设与备择假设:;利用Excel中的“-检验:双样本方差”()得到的检验结果如下表所示:F检验 双样本方差分析变量 1变量 2平均109。9100。7方差33。3578924.11579观测值2020df1919F1。383239P(F=f) 单尾0。24311F 单尾临界2.526451由于,不能拒绝原假设,没有证据表明两种肥料产量的方差有显著差异。10.解:设:机器一为样本1,机器二为样本1 提出原假设与备择假设:; 利用Excel的“检验:双样本方差”()得到的检验结果如下表所示:F-检验 双样本方差分析变量 1变量 2平均3.32843.278181818方差0.0488890。005901299观测值2522df2421F8。284447623P(F=f) 单尾3.61079E06F 单尾临界2.367525575由于,拒绝原假设,认为两种肥料产量的方差有显著差异。