1、提能专训(十六)统计与统计案例一、选择题1(2022上海松江期末考试)某市共有400所学校,现要用系统抽样的方法抽取20所学校作为样本,调查同学课外阅读的状况把这400所学校编上1400的号码,再从120中随机抽取一个号码,假如此时抽得的号码是6,则在编号为21到40的学校中,应抽取的学校的编号为()A25B26C27D以上都不是答案:B解析:系统抽样是把个体编号后,先抽取第一个,然后每次间隔相同的数依次抽取,本题中每次间隔20,第一个抽取的是6号,接下来应当抽取的是26号,故选B.2(2022河北正定中学三模)正定中学教学处接受系统抽样方法,从学校高三班级全体800名同学中抽50名同学做学习
2、状况问卷调查现将800名同学从1到800进行编号,在116中随机抽取一个数,假如抽到的是7,则从4964中应取的数是()A55 B56 C57 D61答案:A解析:从4964中应抽取的是716355.3(2022甘肃其次次诊断)已知回归直线斜率的估量值为1.23,样本点的中心为点(4,5),则回归直线的方程为()A.1.23x4 B.1.23x5C.1.23x0.08 D.0.08x1.23答案:C解析:回归直线x经过样本点的中心,所以51.234,解得0.08,所以回归直线方程是y1.23x0.08.4(2022郑州质检)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒
3、物,如图是依据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()A.甲 B乙C甲、乙相等 D无法确定答案:A解析:由茎叶图知,甲的数据比较集中,乙的数据比较分散,故甲的方差较小或计算得甲0.068 9,乙0.067 5,s0.000 212,s0.000 429.s2.706.所以有90%以上的把握认为“该市居民能否做到光盘与性别有关”8(2022长春一次调研)以下四个命题中:在匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;若两个变量的线性相关性越强,则相关系数
4、的确定值越接近于1;在某项测量中,测量结果听从正态分布N(1,2)(0),若位于区域(0,1)内的概率为0.4,则位于区域(0,2)内的概率为0.8;对分类变量X与Y的随机变量K2的观测值k来说,k越小,推断“X与Y有关系”的把握越大其中真命题的序号为()A B C D答案:D解析:应为系统(等距)抽样;线性相关系数r的确定值越接近于1,两变量间线性关系越亲密;变量N(1,2),P(02)2P(0乙,乙比甲成果稳定,应当选乙参与竞赛B.甲乙,甲比乙成果稳定,应当选甲参与竞赛C.甲乙,甲比乙成果稳定,应当选甲参与竞赛D.甲乙,乙比甲成果稳定,应当选乙参与竞赛答案:D解析:甲82,乙87,所以甲乙
5、s(100169916100)41.67,s(811111636)22.67,由于s3.841,因此有95%的把握认为“成果与班级有关系”,选项C正确12(2022高考原创)从某中学一、二两个班中各随机抽取10名同学,测量他们的身高(单位:cm)后获得身高数据的茎叶的图如图(1),在这20人中,记身高在150,160),160,170),170,180),180,190的人数依次为A1,A2,A3,A4,图(2)是统计样本中身高在肯定范围内的人数的程序框图,则下列说法正确的是()图(1)图(2)A由图(1)可知一、二两班中平均身高较高的是一班,图(2)输出的S的值为18B由图(1)可知一、二两
6、班中平均身高较高的是二班,图(2)输出的S的值为16C由图(1)可知一、二两班中平均身高较高的是二班,图(2)输出的S的值为18D由图(1)可知一、二两班中平均身高较高的是一班,图(2)输出的S的值为16答案:C解析:由茎叶图可知,一班同学身高的平均数为170.3,二班同学身高的平均数为170.8,故二班同学的平均身高较高由题意可知,A12,A27,A39,A42,由程序框图易知,最终输出的结果为S79218.二、填空题13(2022广东七校联考)假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,0
7、01,799进行编号,假如从随机数表第7行第8列的数开头向右读,则得到的第4个样本个体的编号是_(下面摘取了随机数表第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 3815 51 00 13 42 99 66 02 79 54答案:068解析:由随机数
8、表,可以看出前4个样本的个体的编号是331,572,455,068.于是,第4个样本个体的编号是068.14(2022河北石家庄调研)某学校共有师生3 200人,现用分层抽样的方法,从全部师生中抽取一个容量为160的样本,已知从同学中抽取的人数为150,那么该学校的老师人数是_答案:200解析:本题属于分层抽样,设该学校的老师人数为x,所以,所以x200.15(2022江西南昌一模)在一次演讲竞赛中,6位评委对一名选手打分的茎叶图如图(1)所示,若去掉一个最高分和一个最低分,得到一组数据xi(1i4),在如图(2)所示的程序框图中,是这4个数据的平均数,则输出的v的值为_图(1)图(2)答案:
9、5解析:本题主要考查样本数字特征、算法基本思想、程序框图等基础学问,意在考查考生的运算求解力量、规律思维力量依据题意得到的数据为78,80,82,84,则81.该程序框图的功能是求以上数据的方差,故输出的v的值为5.16(2022武汉调研)为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在25,30)内的数据不慎丢失,依据此图可得:(1)年龄在25,30)内对应小长方形的高度为_;(2)这800名志愿者中年龄在25,35)内的人数为_答案:0.04440解析:(1)由于各个小长方形的面积之和为1,所以年龄在25,30)内对应小长
10、方形的高度为0.04.(2)年龄在25,35)内的频率为0.0450.0750.55,人数为0.55800440.三、解答题17随机询问某高校40名不同性别的高校生在购买食物时是否读养分说明,得到如下列联表:性别与读养分说明列联表男女总计读养分说明16824不读养分说明41216总计202040(1)依据以上列联表进行独立性检验,能否在犯错误的概率不超过0.01的前提下认为性别与是否读养分说明之间有关系?(2)从被询问的16名不读养分说明的高校生中,随机抽取2名同学,求抽到男生人数的分布列及其均值(即数学期望)注:K2,其中nabcd为样本容量.P(K2k)0.0500.0100.001k3.
11、8416.63510.828解:(1)由表中数据,得K26.676.635,因此,能在犯错误的概率不超过0.01的前提下,认为性别与读养分说明有关(2)的取值为0,1,2.P(0),p(1),P(2).的分布列为012P的均值为E012.18(2022贵阳适应性考试)一次考试中,五名同学的数学、物理成果如下表所示:同学A1A2A3A4A5数学成果x(分)8991939597物理成果y(分)8789899293(1)要从5名同学中选2人参与一项活动,求选中的同学中至少有一人的物理成果高于90分的概率;(2)依据上表数据,用变量y与x的相关系数和散点图说明物理成果y与数学成果x之间线性相关关系的强
12、弱假如具有较强的线性相关关系,求y与x的线性回归方程(系数精确到0.01);假如不具有线性相关关系,请说明理由. 参考公式:相关系数r;回归直线的方程x,其中,i是与xi对应的回归估量值参考数据:93,90, (xi)240, (yi)224, (xi)(yi)30,6.32,4.90.解:(1)从5名同学中任取2名同学的全部状况为:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A2,A3),(A2,A4),(A2,A5),(A3,A4),(A3,A5),(A4,A5),共10种状况其中至少有一人的物理成果高于90分的状况有:(A1,A4),(A1,A5),(A2,A4),
13、(A2,A5),(A3,A4),(A3,A5),(A4,A5),共7种状况,故选中的同学中至少有一人的物理成果高于90分的概率为.(2)变量y与x的相关关系是r0.97.可以看出,物理成果与数学成果高度正相关散点图如图所示: 从散点图可以看出这些点大致分布在一条直线四周,并且在逐步上升,故物理成果与数学成果正相关设y与x的线性回归方程是x,依据所给的数据,可以计算出0.75,900.759320.25,所以y与x的线性回归方程是0.75x20.25.19(2022东北三校一联)某城市随机抽取一年(365天)内100天的空气质量指数API的监测数据,结果统计如下:API0,50(50,100(1
14、00,150(150,200(200,250(250,300300空气质量优良稍微污染轻度污染中度污染中度重污染重度污染天数413183091115(1)若某企业每天由空气污染造成的经济损失S(单位:元)与空气质量指数API(记为w)的关系式为S试估量在本年内随机抽取一天,该天经济损失S大于200元且不超过600元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面22列联表,并推断能否有95%的把握认为该市本年空气重度污染与供暖有关?非重度污染重度污染合计供暖季非供暖季合计100附:K2P(K2k0)0.250.150.100.050.0250.0100.00
15、50.001k01.3232.0722.7063.8415.0246.6357.87910.828解:(1)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为大事A.由200S600得1503.841,所以有95%的把握认为该市本年空气重度污染与供暖有关20.(2022石家庄质检一)2021年12月21日上午10时,石家庄首次启动重污染天气级应急响应,正式实施机动车尾号限行,当天某报社为了解公众对“车辆限行”的态度,随机抽查了50人,将调查状况进行整理后制成下表:年龄(岁)15,25)25,35)35,45)45,55)55,65)65,75)频数510151055赞成人数469634(1)完成被调查人员的频率分布直方图;(2)若从年龄在15,25),25,35)的调查者中各随机选取两人进行追踪调查,记选中的4人中不赞成“车辆限行”的人数为,求随机变量的分布列和数学期望解:(1)各组的频率分别是0.1,0.2,0.3,0.2,0.1,0.1,所以图中各组的纵坐标分别是0.01,0.02,0.03,0.02,0.01,0.01.(2)的全部可能取值为0,1,2,3.P(0),P(1),P(2),P(3),所以的分布列是0123P所以的数学期望E.