1、 第二章 统计一、选择题1对于简单随机抽样,下列说法中,正确的为( ).它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概率进行分析;它是从总体中按排列顺序逐个地进行抽取;它是一种不放回抽样;它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种方法抽样的公平性A BC D2甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生( ).A30人,30人,30人 B30人,45人,1
2、5人 C20人,30人,10人 D30人,50人,10人 3已知一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,中位数为22,则x的值等于( ).A21 B22 C20 D234下列说法中,正确的是( ).A数据 5,4,4,3,5,2 的众数是 4B一组数据的标准差是这组数据的方差的平方C数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半D频率分布直方图中各小长方形的面积等于相应各组的频数5观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在2 7003 000(单位:克)的频率为( ).A0.001 B0.1 C0.2D0.36
3、下列说法中正确的是( ).Ay2x21中的x,y是具有相关关系的两个变量B正四面体的体积与其棱长具有相关关系C电脑的销售量与电脑的价格之间是一种确定性的关系D某地区感染流感人数与外来流感患者人数是具有相关关系的两个变量 7为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在(56.5,64.5)的学生人数是( ).A20 B30C40 D50丙的成绩环数78910频数46648甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩环数78910频数5555乙的成绩环数7
4、8910频数6446s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ).As3s1s2Bs2s1s3 Cs1s2s3Ds2s3s19通过随机抽样用样本频率分布估计总体分布的过程中,下列说法正确的是( ).A总体容量越大,可能估计越精确B样本容量大小与估计结果无关C样本容量越大,可能估计越精确D样本容量越小,可能估计越精确10从观测所得的数据中取出m个x1,n个x2,p个x3组成一个样本,那么这个样本的平均数是( ).ABCD二、填空题11一个总体容量为60,其中的个体编号为00,01,02,59现需从中抽取一个容量为7的样本,请从随机数表的倒数第5行(下表为随机数表的
5、最后5行)第1112列的18开始,依次向下,到最后一行后向右,直到取足样本,则抽取样本的号码是 95 33 95 22 00 18 74 72 00 18 46 40 62 98 80 54 97 20 56 9538 79 58 69 32 81 76 80 26 92 15 74 80 08 32 16 46 70 50 8082 80 84 25 39 90 84 60 79 80 67 72 16 42 79 71 59 73 05 5024 36 59 87 38 82 07 53 89 35 08 22 23 71 77 91 01 93 20 4996 35 23 79 18 0
6、5 98 90 07 35 82 96 59 26 94 66 39 67 98 6012一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10个小组,组号依次为1,2,10现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同若m6,则在第7组中抽取的号码是 13一个容量为40的样本,分成若干组,在它的频率分布直方图中,某一组相应的小长方形的面积为0.4,则该组的频数是 14甲乙两种冬小麦试验品种连续5年的平均单位面积产量如下:品种第一年第二年第三年第四年第五年甲9.89.910.11010.2
7、乙9.410.310.89.79.8其中产量比较稳定的小麦品种是 15在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7现去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 , 16某鱼塘放养鱼苗10万条,根据这几年的经验知道,鱼苗成活率为95%一段时间后准备打捞出售,第一次捞出40条,称得平均每条鱼重2.5 kg;第二次捞出25条,称得平均每条鱼重2.2 kg;第三次捞出35条,称得平均每条鱼重2.8 kg请你根据这些数据,估计鱼塘中的鱼的总重量约是 三、解答题17某中学高中部共有16个班,其中一年级6个班,二年级6个班,三年级4
8、个班每个班的人数均在46人左右(44人49人),各班的男女学生数均基本各占一半现要调查这所学校学生的周体育活动时间,它是指学生在一周中参加早锻炼、课间操、课外体育活动、体育比赛等时间的总和(体育课、上学和放学路上的活动时间不计在内)为使所得数据更加可靠,应在所定抽样的“周”之后的两天内完成抽样工作试给出抽样方法,分别对男、女学生抽取一个容量相同的样本,样本容量可在4050之间选择18一个单位有职工160人,其中业务员120人,管理人员16人,后勤服务人员24人为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法写出抽取样本的过程19为了了解某地区高三学生的身体发育情况,抽查
9、了地区内100名年龄为17.5岁18岁的男生的体重情况,结果如下(单位:kg):56.569.56561.564.566.56464.57658.57273.556677057.565.56871756268.562.56659.563.564.567.57368557266.574636055.57064.5586470.55762.5656971.573625876716663.55659.563.5657074.568.56455.572.566.5687657.56071.55769.57464.55961.5676863.5585965.562.569.57264.575.568.5
10、646265.558.567.570.5656666.5706359.5试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计20有顾客反映某家航空公司售票处售票的速度太慢为此,航空公司收集了100位顾客购票时所花费时间的样本数据(单位;分钟),结果如下表:2.3 1.0 3.5 0.7 1.0 1.3 0.8 1.0 2.4 0.91.1 1.5 0.2 8.2 1.7 5.2 1.6 3.9 5.4 2.36.1 2.6 2.8 2.4 3.9 3.8 1.6 0.3 1.1 1.13.1 1.1 4.3 1.4 0.2 0.3 2.7 2.7 4.1 4.03.1 5.5 0
11、.9 3.3 4.2 21.7 2.2 1.0 3.3 3.44.6 3.6 4.5 0.5 1.2 0.7 3.5 4.8 2.6 0.97.4 6.9 1.6 4.1 2.1 5.8 5.0 1.7 3.8 6.33.2 0.6 2.1 3.7 7.8 1.9 0.8 1.3 1.4 3.511 8.6 7.5 2.0 2.0 2.0 1.2 2.9 6.5 1.04.6 2.0 1.2 5.8 2.9 2.0 2.9 6.6 0.7 1.5航空公司认为,为一位顾客办理一次售票业务所需的时间在5分钟之内就是合理的上面的数据是否支持航空公司的说法?请你对上面的数据进行适当的分析,回答下面问题
12、:(1)根据原始数据计算中位数、均值和标准差,并进行分析;(2)对数据进行适当的分组,分析数据分布的特点;(3)你认为应该用哪一个统计量来分析上述问题比较合适?参考答案一、选择题1C解析:错若按排列顺序逐个抽取,则导致了每个个体被抽取的概率不等2B解析:甲校、乙校、丙校学生人数之比为231,采用分层抽样法,抽取一个容量为90人的样本,应在这三校分别抽取学生30人,45人,15人3A.解析:22应是x与23的平均数,所以答案为A 4C解析:A ,众数为 4、5;B ,标准差是方差的算术平方根;C ;D ,面积是频率5D解析:3000.0010.36D解析:感染非典的医务人员人数不仅受医院收治病人
13、数的影响,还受防护措施等其他因素的影响,所以选DA,B是确定性函数关系,C非确定性关系(销售量还与其它因素如质量等有关)7C解析:根据运算的算式:体重在(56.5,64.5)学生的累积频率为20.0320.0520.0520.070.4,则体重在(56.5,64.5)学生的人数为0.4100408B解析:甲8.5, ;乙, 1.45; 丙, 1.05;由,得s2s1s39C解析:样本容量越大越能反映总体10D解析:根据加权平均数的定义或直接根据平均数定义即可得出二、填空题1118,05,07,35,59,26,39解析:先选取18,向下81,90,82不符合要求,下面选取05,向右读数,07,
14、35,59,26,39,因此抽取的样本的号码为:18,05,07,35,59,26,391263解析:由题意第7组中抽取的号码的个位数字为3,这是因为6713,而十位数字为6,故抽取的号码为631316解析:频数频率样本容量14甲解析:比较它们的方差即可,方差较小的较稳定159.5,0.016解析:最高分是9.9,最低分是8.4,去掉后的数据为9.4,9.4,9.6,9.4,9.7,它们的平均数,方差为16约24万(kg)解析:先算出三次捞出的鱼每条鱼的重量平均数为2.53(kg),所以鱼塘中的鱼的总重量约为2.53(100 00095%)24万(kg)三、解答题17解:由于各个年级的学生参加
15、体育活动的时间存在差异,应采用分层抽样;又由于各班的学生数相差不多,且每班的男女学生人数也基本各占一半,为便于操作,分层抽样时可以班级为单位关于抽取的人数,如果从每班中抽取男、女学生各3人,样本容量各为48(即316),符合对样本容量的要求18解:样本容量与职工总人数的比为2016018,业务人员、管理人员、后勤服务人员应抽取的个体数为,即分别为15人、2人和3人,每一层抽取时可采用简单随机抽样或系统抽样,再将各层抽取的个体合在一起,就是要抽取的样本19按照下列步骤获得样本的频率分布(1)求最大值与最小值的差在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是7655=21所得的
16、差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由21210.5,组数为11,这个组数是适合的. 于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的这样,所得到的分组是54.5,56.5),56.5,58.5),74.5,76.5). (4)列频率分布表频率分布表分组频数累计频数频率54.5,56.5)20.0256.5,58.5) 60.0658.5,60.5) 100.1060.5,62.5) 10
17、0.1062.5,64.5) 140.1464.5,66.5) 160.1666.5,68.5) 130.1368.5,70.5) 110.1170.5,72.5) 80.0872.5,74.5) 70.0774.5,76.5)30.03合计1001.00(5)绘制频率分布直方图频率组距 54.556.558.574.572.566.568.570.576.562.560.564.5体重频率分布直方图如图所示:由于图中各小长方形的面积等于相应各组的频率,这个图形以面积的形式反映了数据落在各个小组的频率的大小在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的
18、作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%;等等20(1)根据原始数据计算中位数、均值和标准差如下:顾客购票花费时间的中位数位置50.5,将100个数据由小到大排列,中位数在第50个数值(2.4)和第51个数值(2.6)之间,中位数2.5(分钟);平均花费时间为: (分钟);标准差为:2.85(分钟)(2)对数据进行分组的结果如下表:100名顾客购票花费时间的分组表花费时间(分)频数(人)频率(%)1以下14141224242320203415154599
19、56666755783389229以上22合计100100绘制直方图观察数据分布的特点,直方图如下:从直方图可以看出,顾客购票所花费时间的分布为左偏有顾客反映某家航空公司售票处售票的速度太慢,这可能是由少数人提出来的因此这些少数顾客提出的意见并不能代表大多数人,少数顾客的意见应该作为航空公司完善售票系统加强管理的参考意见(3)从平均数来看,其结果为3.17分钟,因此,从总体上看,该航空公司办理一项售票业务所需的平均时间约为3.2分钟;从中位数来看,其结果为2.5分钟,这说明有一半顾客在2.5分钟之内可以购得机票.平均数、中位数都在航空公司认为的合理时间(5分钟)之内.第 12 页 共 12 页