1、2020-2021高中数学 第八章 成对数据的统计分析素养检测新人教A版选择性必修第三册2020-2021高中数学 第八章 成对数据的统计分析素养检测新人教A版选择性必修第三册年级:姓名:单元素养检测(三)(第八章)(100分钟120分)一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数【解析】选B.因为拟合效果的好坏是由残差平方和来体现的,而拟合效果即数据点和它在回归直线上相应位置的差异,故数据点和它在回归直线上相
2、应位置的差异是通过残差平方和来体现的.2.从某大学中随机选取8名女大学生,其身高x(单位:cm)与体重Y(单位:kg)数据如表:x165165157170175165155170Y4857505464614359若已知Y与x的经验回归方程为=0.85x-85.71,那么选取的女大学生身高为175 cm时,相应的残差为()A.-0.96B.0.96C.63.04D.-4.04【解析】选B.已知Y与x的经验回归方程为=0.85x-85.71.当x=175时,=63.04.相应的残差为:64-63.04=0.96.3.在对人们休闲方式的一次调查中,根据数据建立22列联表:性别休闲合计看电视运动男82
3、028女161228合计243256为了判断休闲方式是否与性别有关,根据表中数据,得到2=4.667.因为3.84126.635,所以推断休闲方式与性别有关系,那么这种判断出错的可能性不大于()(参考数据:P0.05,P0.01)A.0.001B.0.01C.0.05D.0.005【解析】选C.结合题意和独立性检验的结论,由于4.6673.841,故这种判断出错的概率不大于0.05.4.2020年初,新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:周数(x)12345治愈人数(Y)21736
4、93142由表格可得Y关于x的二次回归方程为=6x2+a,则此回归模型第4周的残差(观测值与预测值之差)为()A.5B.4C.1D.0【解析】选A.设t=x2,则=11,=58,a=58-611=-8,所以=6x2-8.令x=4,得e4=y4-4=93-642+8=5.5.在变量Y与x的回归模型中,它们对应的相关系数r的值如表,其中拟合效果最好的模型是()模型1234r0.480.150.960.30A.模型1B.模型2C.模型3D.模型4【解析】选C.线性回归分析中,相关系数为r,越接近于1,相关程度越大;越小,相关程度越小,因为模型3的相关系数r最大,所以拟合效果最好.6.为大力提倡“厉行
5、节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:性别光盘行动合计做不到“光盘”能做到“光盘”男451055女301545合计7525100附:0.100.050.01x2.7063.8416.6352=.参照附表,得到的正确结论是()A.在犯错误的概率不大于0.01的前提下,认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不大于0.01的前提下,认为“该市居民能否做到光盘与性别无关”C.在犯错误的概率不大于0.1的前提下,推断“该市居民能否做到光盘与性别有关”D.在犯错误的概率不大于0.1的前提下,推断“该市居民能否做到光盘与性别无关”
6、【解析】选C.由表计算得:2=3.032.706=x0.1,所以在犯错误的概率不大于0.1的前提下推断“该市居民能否做到光盘与性别有关”.7.给出以下四个说法:残差点分布的带状区域的宽度越窄,决定系数越小;在刻画回归模型的拟合效果时,决定系数R2越接近于1,说明拟合的效果越好;在经验回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预测值平均增加0.2个单位:对分类变量X与Y,若它们的随机变量2的值越小,则判断“X与Y有关系”的把握程度越大.其中正确的说法是()A.B.C.D.【解析】选D.对于,在回归分析中,残差图中残差点分布的带状区域的宽度越窄,说明拟合的精确度越高,决定系数的
7、绝对值越接近于1,而不是越小,错误;对于,相关指数R2来刻画拟合效果时,R2的值越大,说明模型的拟合效果越好,正确;对于,在经验回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预测值平均增加0.2个单位,正确;对于,对分类变量X和Y,它们的随机变量2的值越大,“X与Y有关系”的把握程度越大,错误.8.(2020全国卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图:由此散点图,在10至40之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类
8、型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+bln x【解析】选D.由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的回归方程类型的是y=a+bln x.二、多项选择题(本大题共4小题,每小题5分,共20分,在每小题给出的四个选项中,有多项符合题目要求.全部选对的得5分,选对但不全的得3分,有选错的得0分)9.下列叙述正确的是()A.相关关系是一种确定性关系,一般可分为正相关和负相关B.经验回归直线一定过样本点的中心C.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好D.某同学研究卖出的热饮杯数y与气温x的
9、关系,得到经验回归方程=-2.35x+146.7,则气温为2 时,一定可卖出142杯热饮【解析】选BC.对于A:相关关系是不确定的关系,故A错误;对于B:经验回归直线必过样本中心,故B正确;对于C:决定系数越大,相关性越强,故R2为0.98的模型比R2为0.80的模型拟合的效果好,故C正确;对于D:根据经验回归直线,可预测大概卖出142杯,而不是一定卖出142杯,故D错误.10.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到相应的列联表.经计算24.762,则可以推断出()性别服务合计满意不满意男302050女4010
10、50合计70301000.10.050.01x2.7063.8416.635A.该学校男生对食堂服务满意的概率的估计值为B.调研结果显示,该学校男生比女生对食堂服务更满意C.在犯错误的概率不大于0.05的前提下推断男、女生对该食堂服务的评价有差异D.在犯错误的概率不大于0.01的前提下推断男、女生对该食堂服务的评价有差异【解析】选AC.对于选项A,该学校男生对食堂服务满意的概率的估计值为=,故A正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为=,故B错误;因为24.7623.841=x0.05,所以在犯错误的概率不大于0.05的前提下推断男、女生对该食堂服务的评价有差异,故C正确,D
11、错误.11.下列说法中错误的是()A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变B.设有一个经验回归方程=3-5x,变量x增加1个单位时,平均增加5个单位C.设具有相关关系的两个变量x,Y的相关系数为r,则越接近于0,x和Y之间的线性相关程度越强D.在一个22列联表中,由计算得2的值,则2的值越大,判断两个变量间有关联的把握就越大【解析】选BC.对于A:方差反映一组数据的波动情况,将一组数据中每一个数据都加上或减去同一个常数后,波动情况不变,方差不变,故A正确;对于B:经验回归方程=3-5x,变量x增加1个单位时,平均减少5个单位,故B错误;对于C:相关系数越接近于0,相关性越
12、弱,相关系数越接近于1,相关性越强,故C错误;对于D:2的值越大,两个变量间有关系的可信度越大,判断两个变量间有关联的把握就越大,故D正确.12.下列说法正确的是()A.在经验回归方程=-0.85x+2.3中,当解释变量x每增加1个单位时,响应变量平均减少2.3个单位B.两个具有线性相关关系的变量,决定系数R2的值越接近于0,则这两个变量的相关性就越强C.若两个变量的决定系数R2=0.88,则说明预测值的差异有88%是由解释变量引起的D.在经验回归方程=-0.85x+2.3中,相对于样本点的残差为-0.25【解析】选CD.对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量平均减少
13、0.85个单位,A错误;对于B,当决定系数R2的值越接近于1,两个变量的相关性就越强,B错误;对于C,由决定系数R2的意义可知C正确;对于D,当解释变量x=1时,预测值=1.45,则样本点的残差为-0.25,D正确.三、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)13.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如表:性别专业合计非统计专业统计专业男131023女72027合计203050为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到2=(保留三位小数),所以判定(填“能”或“不能”)在犯错误的概率不超过0.05的前提下认为主修
14、统计专业与性别有关系.【解析】根据提供的表格得2=4.8443.841=x0.05.所以可以在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.答案:4.844能14.某工厂为研究某种产品产量x(吨)与所需某种原材料Y(吨)的相关性,在生产过程中收集4组对应数据(x,Y),如表所示:(残差=观测值-预测值)x3456Y2.534m根据表中数据,得出Y关于x的经验回归方程为:=0.7x+.据此计算出在样本处的残差为-0.15,则表中m的值为.【解析】根据题意计算出在样本处的残差为-0.15,可得=3.15,则当x=4时,3.15=0.74+,所以=0.35,由题意可知:产量x的平均
15、值为=(3+4+5+6)=4.5,由经验回归方程为=0.7x+过样本中心点(,),则=0.74.5+=3.15+,所以=-3.15=(9.5+m)-3.15,解得:m=4.5.答案:4.515.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到数据如表单价x/元88.28.48.68.89销量Y/件908483807568由表中数据,求得经验回归方程为=-20x+.若在这些样本中任取一点,则它在经验回归直线左下方的概率为.【解析】由表格数据可知:=8.5,=80.因为=-20,=-,所以=80+208.5=250,所以经验回归方程为=-20x+250.分别将6个点
16、的横坐标代入方程得到的小于其观测值的点有,两个点,则在这些样本点中任取一点,共有6种不同的取法,其中恰好在经验回归直线左下方的共有2种不同的取法,故满足条件的概率P=.答案:16.如图所示的是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条形区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的经验回归方程为=3.193x+88.193,若受教育的人口百分比相差10%,则其人均收入相差.【解析】设受教育的人口百分比分别为a%,b%,且a-b=10,根据经验回归方程为=3.193x+88.193,得收入相差大约为:3.193a+88.193-(3.193b+88
17、.193)=3.19310=31.93,即受教育的人口百分比相差10%时,其人均收入相差约31.93美元.答案:31.93美元四、解答题(本大题共4个小题,共40分,解答时写出必要的文字说明、证明过程或演算步骤)17.(10分)某公司为了提高某产品的收益,向各地作了广告推广,同时广告对销售收益也有影响,在若干地区各投入4万元广告费用,并将各地区的销售收益绘制成频率分布直方图(如图所示),且拟定一个合理的收益标准t(百万元),由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图,计算图中各小长方形的宽度;(2)按照类似的研究方法,测得另外一些数据,并整理
18、得到表格:广告投入x(单位:万元)12345销售收益Y(单位:百万元)23257表中的数据显示,x与Y之间存在线性相关关系,计算Y关于x的经验回归方程.(经验回归直线的斜率和截距的最小二乘估计公式分别为=,=-)【解析】(1)设各小长方形的宽度为m,由频率分布直方图各小长方形面积总和为1,可知(0.08+0.1+0.14+0.12+0.04+0.02)m=0.5m=1,故m=2;(2)由题意可知,=3,=3.8,xiyi=12+23+32+45+57=69,=12+22+32+42+52=55,根据公式,可求得=1.2,=3.8-1.23=0.2,即经验回归方程为=1.2x+0.2.18.(1
19、0分)某大学读书协会为了解本校大学生网上阅读与传统纸质阅读的情况,调查了该大学1 000名大学生(男、女各占一半),就偏向网上阅读和偏向传统纸质阅读的情况做了调查记录.记录显示,偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1 000名大学生中,偏向传统纸质阅读的大学生共有400人.(1)根据题意,完成22列联表:性别阅读方式合计偏向网上阅读偏向传统纸质阅读男女合计1 000 (2)依据小概率值=0.001的独立性检验,推断该大学的大学生的阅读方式与性别是否有关联.附:2=(n=a+b+c+d).0.050.010.001x3.8416.63510.828【解析】(1)根据题
20、意,该大学1 000名大学生中(男、女各占一半),偏向网上阅读的男大学生比偏向传统纸质阅读的男大学生多300人,这1 000名大学生中,偏向传统纸质阅读的大学生共有400人,可得22列联表如表:性别阅读方式合计偏向网上阅读偏向传统纸质阅读男400100500女200300500合计6004001 000 (2)由(1)中的表格中的数据,可得2=10.828=x0.001,根据小概率值=0.001的独立性检验,推断该大学的大学生的阅读方式与性别有关联.19.(10分)某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50 kg,每件尺寸限制为40 cm60 cm100 c
21、m,其中头等舱乘客免费行李额为40 kg,经济舱乘客免费行李额为20 kg.某调研小组随机抽取了100位国内航班旅客进行调查,得到如下数据:携带行李重量(kg)(0,20(20,30(30,40(40,50头等舱乘客人数833122经济舱乘客人数37530合计4538152 (1)请完成22列联表,试根据小概率值=0.05的独立性检验,分析托运超额行李与乘客乘坐座位的等级是否有关;(2)调研小组为感谢参与调查的旅客,决定从托运行李超出免费行李额且不超过10 kg的旅客中随机抽取2人赠送“100元超额行李补助券”,求这2人中至少有1人是头等舱乘客的概率.参考公式2=,其中n=a+b+c+d.参考
22、数据:0.0500.0100.001x3.8416.63510.828【解析】(1)根据表格中数据,可得头等舱乘客托运免费行李的人数为8+33+12=53(人),头等舱乘客托运超额行李的人数为2人,经济舱乘客托运免费行李的人数为37人,经济舱乘客托运超额行李的人数为5+3=8(人),可得22列联表如表:行李合计托运免费行李托运超额行李头等舱乘客人数53255经济舱乘客人数37845合计9010100因为2=5.503.841=x0.05,所以根据小概率值=0.05的独立性检验,推断托运超额行李与乘客乘坐座位的等级有关.(2)由题意可知托运行李超出免费行李额且不超过10 kg的旅客有7人,其中头
23、等舱乘客有2人,记为A,B,经济舱乘客有5人,记为a,b,c,d,e.从这7人中随机抽取2人的情况有AB,Aa,Ab,Ac,Ad,Ae,Ba,Bb,Bc,Bd,Be,ab,ac,ad,ae,bc,bd,be,cd,ce,de,共21种,其中符合条件的情况有AB,Aa,Ab,Ac,Ad,Ae,Ba,Bb,Bc,Bd,Be,共11种,故所求概率P=.20.(10分)某省级示范高中高三年级对各科考试的评价指标中,有“难度系数”和“区分度”两个指标,难度系数=,区分度=.(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩
24、分别为97,102,113.通过样本估计本次考试的区分度(精确到0.01).(2)如下表格是该校高三年级6次数学考试的统计数据:难度系数x0.640.710.740.760.770.82区分度Y0.180.230.240.240.220.15计算相关系数r,|r|0.75时,认为相关性弱;|r|0.75时,认为相关性强.通过计算说明,能否利用线性回归模型描述Y与x的关系(精确到0.01).ti=|xi-0.74|(i=1,2,6),求出Y关于t的经验回归方程,并预测x=0.75时的值(精确到0.01).附注:参考数据:xiyi=0.930 9,0.011 2,tiyi=0.048 3,=0.0
25、07 3.参考公式:相关系数r=,经验回归直线=t+的斜率和截距的最小二乘估计分别为=,=-.【解析】(1)实验班三人成绩的平均值为=142,普通班三人成绩的平均值为=104,故估计本次考试的区分度为0.25.(2)由题中的表格可知=(0.64+0.71+0.74+0.76+0.77+0.82)=0.74,=(0.18+0.23+0.24+0.24+0.22+0.15)=0.21,故r=-0.13.因为|r|0.75,所以相关性弱,故不能利用线性回归模型描述Y与x的关系;Y与t的值如表t0.100.0300.020.030.08区分度Y0.180.230.240.240.220.15因为=-0.86,所以=-=0.21+0.860.25,所以所求经验回归方程=-0.86t+0.25,当x=0.75时,此时t=0.01,则0.24.