1、第一章统计(A) (时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分)1从某班级1 000名同学中抽取125名同学进行体重的统计分析,就这个问题来说,下列说法正确的是()A1 000名同学是总体B每个被抽查的同学是个体C抽查的125名同学的体重是一个样本D抽取的125名同学的体重是样本容量2由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于1,那么对于样本1,x1,x2,x3,x4,x5的中位数可以表示为()A.(1x2) B.(x2x1)C.(1x5) D.(x3x4)3某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体
2、状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是()A7,11,19 B6,12,18C6,13,17 D7,12,174数学老师对某同学在参与高考前的5次数学模拟考试成果进行统计分析,推断该同学的数学成果是否稳定,那么老师需要知道该同学这5次成果的()A平均数或中位数 B方差或标准差C众数或频率 D频数或众数5已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x12,3x22,3x32,3x42,3x52的平均数,方差分别是()A2, B2,1C4, D4,36某学院有4个饲养房,分别养有18,54,24,48只白鼠供
3、试验用某项试验需抽取24只白鼠,你认为最合适的抽样方法是()A在每个饲养房各抽取6只B把全部白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C从4个饲养房分别抽取3,9,4,8只D先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简洁随机抽样的方法确定7下列有关线性回归的说法,不正确的是()A相关关系的两个变量不愿定是因果关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D任一组数据都有线性回归方程8已知施肥量与水稻产量之间的线性回归方程为y4.75x257,则施肥量x30时,对产量y的估量值为()A398.5 B399.5C40
4、0 D400.59在发生某公共卫生大事期间,有专业机构认为该大事在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”依据过去10天甲、乙、丙、丁四地新增疑似病例数据,确定符合该标志的是()A甲地:总体均值为3,中位数为4B乙地:总体均值为1,总体方差大于0C丙地:中位数为2,众数为3D丁地:总体均值为2,总体方差为310某高中在校同学2 000人,高一与高二人数相同并都比高三多1人为了响应“阳光体育运动”号召,学校进行了“元旦”跑步和登山竞赛活动每人都参与而且只参与了其中一项竞赛,各班级参与竞赛人数状况如下表:高一高二高三跑步abc登山xyz其中abc235,全
5、校参与登山的人数占总人数的.为了了解同学对本次活动的满足程度,从中抽取一个200人的样本进行调查,则高二参与跑步的同学中应抽取()A36人 B60人C24人 D30人11某赛季,甲、乙两名篮球运动员都参与了11场竞赛,他们全部竞赛得分的状况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为()A19,13 B13,19C20,18 D18,2012从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:分组90,100)100,110)110,120)120,130)130,140)140,150频数1231031则这堆苹果中,质量不小于120克的苹果数约占苹果总数的
6、()A30% B70%C60% D50%题号123456789101112答案二、填空题(本大题共4小题,每小题5分,共20分)13甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是_甲乙丙丁7887s2.52.52.8314.一组数据23,27,20,18,x,12,它们的中位数是21,即x是_15某市居民20052009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012依据统计资料,居民家庭年平均收入的中
7、位数是_,家庭年平均收入与年平均支出有_线性相关关系16某单位为了了解用电量y度与气温x之间的关系,随机统计了某4天的用电量与当天气温.气温()141286用电量(度)22263438由表中数据得线性回归方程ybxa中b2,据此猜想当气温为5时,用电量的度数约为_三、解答题(本大题共6小题,共70分)17(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程18(12分)为了了解同学的体能状况,某校抽取部分同学进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如右),图中从左到右各小长方形面积之比为24
8、171593,其次小组频数为12.(1)同学跳绳次数的中位数落在哪个小组内?(2)其次小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估量该学校全体高一同学的良好率是多少?19(12分)为了争辩三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观看了2003年至2008年的状况,得到下面数据:年份200320042005200620072008x()24.429.632.928.730.328.9y19611018已知x与y之间具有线性相关关系,据气象猜想该地区在2010年三月下旬平均气温为27,试估量2010年四月化蛹高峰日为哪天?20(1
9、2分)下表供应了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对比数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请依据上表供应的数据,用最小二乘法求出y关于x的线性回归方程ybxa;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试依据(2)求出线性回归方程,猜想生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)21(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势状况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,
10、10,11,12,10,20乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此推断甲、乙两种麦苗的长势状况22(12分)从高三抽出50名同学参与数学竞赛,由成果得到如下的频率分布直方图试利用频率分布直方图求:(1)这50名同学成果的众数与中位数(2)这50名同学的平均成果答案1C在学校学过:“在统计中,全部考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量”因此题中所指的对象应是体重,故A、B错误,样本
11、容量应为125,故D错误2C由题意把样本从小到大排序为x1,x3,x5,1,x4,x2,因此得中位数为(1x5)3B因275481123,366,3612,3618.4B5D由于数据x1,x2,x3,x4,x5的平均数是2,方差是,所以2, (xi2)2,因此数据3x12,3x22,3x32,3x42,3x52的平均数为: (3xi2)3xi24,方差为: (3xi2)2 (3xi6)29 (xi2)293.6D由于这24只白鼠要从4个饲养房中抽取,因此要用分层抽样打算各个饲养房应抽取的只数,再用简洁随机抽样法从各个饲养房选出所需白鼠C虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是
12、说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.7D依据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确只有线性相关的数据才有线性回归方程,所以D不正确8B成线性相关关系的两个变量可以通过线性回归方程进行猜想,本题中当x30时,y4.7530257399.5.9D由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不行能每天都是1,可以有一天大
13、于7,故乙地不符合丙地中中位数为2,众数为3,3毁灭的最多,并且可以毁灭8,故丙地不符合故丁地符合10A由题意知高一、高二、高三的人数分别为667,667,666.设a2k,b3k,c5k,则abc2 000,即k120.b3120360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.11A分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数12B由数据分布表可知,质量不小于120克的苹果有103114(个),占苹果总数的100%70%.13乙解析平均数反映平均水平大小,标准差表明稳定性标准差越小,稳定性越好14221513正1640
14、解析(141286)10,(22263438)30,ab 3021050.当x5时,y255040.17解分层抽样方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,99编号,二级品有60个,产品按00,01,59编号,三级品有40个,产品按00,01,39编号因总体个数样本容量为101,故用简洁随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个这样就可得到一个容量为20的样本18解(1)前三组的频率和为,中位数落在第四小组内(2)频率为:0.08,又频率,样本容量150.(3)由图可估量所求良好率约为:100%88%.19解由题意知:29.13,7.5,x5
15、130.92,xiyi1 222.6,b2.2,ab 71.6,线性回归方程为y2.2x71.6.当x27时,y2.22771.612.2,据此,可估量该地区2010年4月12日或13日为化蛹高峰日20解(1)散点图如下:(2)4.5,3.5,xiyi32.5435464.566.5,x3242526286,b0.7,ab3.50.74.50.35.y0.7x0.35.所求的线性回归方程为y0.7x0.35.(3)现在生产100吨甲产品用煤y0.71000.3570.35,9070.3519.65.生产能耗比技改前降低约19.65吨标准煤21解(1)茎叶图如图所示:(2)甲12,乙13,s(9
16、12)2(1012)2(1112)2(1212)2(1012)2(2012)213.67,s(813)2(1413)2(1313)2(1013)2(1213)2(2113)216.67.由于甲乙,所以乙种麦苗平均株高较高,又由于s0.5,中位数应位于第四个小矩形内设其底边为x,高为0.03,令0.03x0.2得x6.7,故中位数约为706.776.7.(2)样本平均值应是频率分布直方图的“重心”,即全部数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可平均成果为45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02110)95(0.01610)74.