1、考点十九统计与统计案例一、选择题1对四组数据进行统计,获得如下图的散点图,关于其相关系数的比拟,正确的选项是()Ar2r40r3r1 Br4r20r1r3Cr4r20r3r1 Dr2r40r1r3答案A解析易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,那么r2r40r3r1.2(2022全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A中位数 B平均数 C方差 D极差答案A解析中位数是
2、将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响应选A.3(2022南阳市一中第九次目标考试)为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图根据图中信息,在以下各项中,说法最正确的一项为哪一项()A药物B的预防效果优于药物A的预防效果B药物A的预防效果优于药物B的预防效果C药物A,B对该疾病均有显著的预防效果D药物A,B对该疾病均没有预防效果答案B解析由题图可得服用药物A的患病人数少于服用药物B的患病人数,而服用药物A的未患病人数多于服用药物B的未患病人数,所以药物A的预防效果优于药物
3、B的预防效果应选B.4(2022沈阳市东北育才学校高三一模)甲、乙两名同学6次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为甲、乙,标准差分别为甲,乙,那么()A.甲乙,甲乙 B.甲乙C.甲乙,甲乙,甲乙答案C解析甲、乙两名同学6次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为甲,乙,标准差分别为甲,乙,由折线图得甲乙,甲乙应选C.5(2022湖南张家界三模)变量x,y之间的线性回归方程为y0.7x10.3,且变量x,y之间的一组相关数据如表所示,那么以下说法错误的选项是()x681012y6m32A变量x,y之间呈现负相关关系B可以预测,当x20时,y3.7Cm4D由表格数据可知
4、,该回归直线必过点(9,4)答案C解析由题意得,由0.76.635可知,我们有99%以上的把握认为“爱好该项运动与性别有关7(2022湖南师大附中月考七)以下说法错误的选项是()A在回归模型中,预报变量y的值不能由解释变量x唯一确定B假设变量x,y满足关系y0.1x1,且变量y与z正相关,那么x与z也正相关C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D以模型ycekx去拟合一组数据时,为了求出回归方程,设zln y,将其变换后得到线性方程z0.3x4,那么ce4,k0.3答案B解析对于A,y除了受自变量x的影响之外还受其他因素的影响,故A正确;对于B,变量x,y满足关系
5、y0.1x1,那么变量x与y负相关,又变量y与z正相关,那么x与z负相关,故B错误;对于C,由残差图的意义可知正确;对于D,ycekx,两边取对数,可得ln yln (cekx)ln cln ekxln ckx,令zln y,可得zln ckx,z0.3x4,ln c4,k0.3,ce4.即D正确,应选B.8(2022福建泉州第二次质检)某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,那么()A.70,s275C.70,s275 D.75
6、答案A解析70,设收集的48个准确数据分别记为x1,x2,x48,那么75(x170)2(x270)2(x4870)2(6070)2(9070)2(x170)2(x270)2(x4870)2500,s2(x170)2(x270)2(x4870)2(8070)2(7070)2(x170)2(x270)2(x4870)21003.841,所以在犯错误的概率不超过0.05的前提下能认为“获奖与女生、男生有关14(2022聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如下图(1)估算这批学生的作业平均用时情况;
7、(2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有很大关系,如果用时四十分钟之内评价为优异,一个小时以上为一般,其他评价为良好现从优异和良好的学生里面用分层抽样的方法抽取300人,其中女生有90人(优异20人)请完成列联表,并根据列联表分析能否在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系?男生女生合计良好优异合计附:K2,其中nabcd.P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解(1)10(350.01450.02550.03650.025750.01850.005)57.所以批学
8、生作业用时的平均数为57.(2)优异学生数与良好学生数之比为0.01(0.020.03)15,按照分层抽样得300人中优异50人,良好250人;女生90人,男生210人;女生优异20,良好70人,男生优异30人,良好180人,列联表如下:男生女生合计良好18070250优异302050合计21090300K22.8572,s1s2 B.1s2C.12,s1s2 D.12,s12,s1b,a B.b,aC.a D.b,a答案C解析描出散点图,易观察出a,应选C.6(2022四川乐山第三次调研)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位
9、分布条形图,那么以下结论中不一定正确的选项是()注:90后指1990年及以后出生,80后指19801989年之间出生,80前指1979年及以前出生A互联网行业从业人员中90后占一半以上B互联网行业中从事技术岗位的人数超过总人数的20%C互联网行业中从事运营岗位的人数90后比80前多D互联网行业中从事技术岗位的人数90后比80后多答案D解析对于选项A,互联网行业从业人员中90后占56%,占一半以上,所以正确;对于选项B,互联网行业中90后从事技术岗位的人数占总人数的39.6%56%22.176%,超过总人数的20%,所以正确;对于选项C,互联网行业中从事运营岗位的人数90后占总人数的56%17%
10、9.52%,比80前多,所以正确;对于选项D,互联网行业中从事运营岗位的人数90后占总人数的56%17%9.52%,80后占总人数的41%,所以互联网行业中从事运营岗位的人数90后不一定比80后多,所以不一定正确,应选D.7针对“中学生追星问题,某校团委对“学生性别和中学生追星是否有关作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.假设有95%的把握认为是否追星和性别有关,那么男生至少有()A11人 B12人 C18人 D24人附表及公式:K2,nabcd.P(K2k0)0.0500.0250.0100.005k03.8415.0246.6357
11、.879答案B解析设男生人数为x,依题意可得列联表如下:喜欢追星不喜欢追星总计男生x女生总计x假设在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,那么K23.841,由K23.841,解得x10.24,为整数,假设在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,那么男生至少有12人,应选B.8(2022江西南昌一模)具有线性相关的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到回归直线方程l1:ybxa,过点A1,A2的直线方程l2:ymxn,那么以下四个命题中:mb,an;直线l1过点A3; (yibxia
12、)2 (yimxin)2;|yibxia|yimxin|.正确命题有()A1个 B2个 C3个 D4个答案B解析由所给的数据计算可得3,2,回归方程为y0.6x0.2,过点A1,A2的直线方程为yx,逐一考查所给的结论:mb,an,该说法正确;直线l1过点A3即回归方程过样本中心点,该说法正确; (yibxia)20.8, (yimxin)29,说法错误;|yibxia|1.6,|yimxin|5,说法错误,综上可得正确命题的个数有2个,应选B.二、填空题9空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,050为优;5
13、1100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图根据该统计数据,估计此地该年AQI大于100的天数为_(该年为365天)答案146解析该样本中AQI大于100的频数为4,频率为,以此估计此地全年AQI大于100的频率为,故此地该年AQI大于100的天数约为365146.10某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.答案185解析
14、设父亲身高为x cm,儿子身高为y cm,那么x173170176y170176182173,176,1, 17611733,所以x3,当x182时,185.11甲、乙两人要竞争一次大型体育竞技比赛射击工程的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,那么参加比赛的最正确人选为_答案乙解析甲的平均数140.250.170.380.190.2100.17.0,乙的平均数250.160.270.480.290.17.0,所以12;甲的方差s(74)22(75)21(77)23(78)21(79)22(710)214,乙的方差s(75)21(76)22(77)24(78)22(79)211.
15、2,所以ss,即参加比赛的最正确人选为乙12某学校开展一次“五四知识竞赛活动,共有三个问题,其中第1、2题总分值都是15分,第3题总分值是20分每个问题或者得总分值,或者得0分活动结果显示,每个参赛选手至少答对一道题,有6名选手只答对其中一道题,有12名选手只答对其中两道题答对第1题的人数与答对第2题的人数之和为26,答对第1题的人数与答对第3题的人数之和为24,答对第2题的人数与答对第3题的人数之和为22.那么参赛选手中三道题全答对的人数是_;所有参赛选手得分的平均数是_答案229.5解析设x1,x2,x3分别表示答对第1题、第2题、第3题的人数,那么有解得x114,x212,x310,又只
16、答对一道题的人数为6,只答对两道题的人数为12,设答对三道题的人数为x,那么全班人数为612x,611223x36,解得x2,三道题全答对的人数是2,所有参赛选手得分的平均数是(141512151020)29.5.三、解答题13(2022长沙一模)某互联网公司为了确定下一季度的前期广告投入方案,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如下图的残差图及一些统计量
17、的值:xiyix7301464.24364(1)根据残差图,比拟模型,的拟合效果,应选择哪个模型?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量x18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为:, .解(1)应该选择模型,因为模型的残差点比拟均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高(2)()剔除异常数据,即3月份的数据后,得(766)7.
18、2,(30631.8)29.64.xiyi1464.24631.81273.44,x36462328.3, 29.6437.28.04.所以y关于x的回归方程为3x8.04.()把x18代入()中所求回归方程得3188.0462.04,故预报值为62.04万元14(2022云南省第二次高三统一检测)在某市创立全国文明城市的过程中,创文专家组对该市的中小学进行了抽检,其中抽检的一个环节是对学校的教师和学生分别进行问卷测评下表是被抽检到的五所学校A,B,C,D,E的教师和学生的测评成绩(单位:分):学校ABCDE教师测评成绩x9092939496学生测评成绩y8789899293(1)建立y关于x
19、的回归方程x;(2)现从A,B,C,D,E这五所学校中随机选两所派代表参加座谈,求A,B两所学校至少有一所被选到的概率P.附:, .解(1)依据题意计算得93,90, (xi)2(3)2(1)202123220, (xi)(yi)(3)(3)(1)(1)0(1)123321, 9093.所求回归方程为x.(2)从A,B,C,D,E这5所学校中随机选2所,具体情况为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共有10种等可能的结果A,B两所学校至少有一所被选到的为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共有7种所以A,B两所学校至少有一所被选到的概率P.- 13 -