1、 第48讲 统计案例 一、单选题 1.(2021·宁夏·银川一中三模(文))关于线性回归的描述,有下列命题: ①回归直线一定经过样本中心点; ②相关系数的绝对值越大,拟合效果越好; ③相关指数越接近1拟合效果越好; ④残差平方和越小,拟合效果越好. 其中正确的命题个数为( ) A.1 B.2 C.3 D.4 【答案】C 【分析】 根据回归直线方程的性质,相关系数、相关系数及残差平方和的意义判断各项的正误即可. 【详解】 对于①,回归直线一定经过样本中心点,故正确; 对于②,相关系数的绝对值越接近于1,相关性越强,故错误; 对于③,相关指数越接近1拟合
2、效果越好,故正确; 对于④,残差平方和越小,拟合效果越好,故正确. 故选:C. 2.(2021·河南·高三月考(文))某外语学校要求学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取名学生,得到下面的数据表: 选择德语 选择日语 男生 女生 根据表中提供的数据可知( ) 附:,. A.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别无关 B.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关 C.有的把握认为选择第二外语的倾
3、向与性别无关 D.有的把握认为选择第二外语的倾向与性别有关 【答案】D 【分析】 直接利用列联表中的数据和公式计算,再根据临界值表进行判断即可 【详解】 由题意得, 所以有的把握认为选择第二外语的倾向与性别有关,或在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关, 故选:D 3.(2021·广东·肇庆市第一中学高三月考)据一组样本数据,,…,,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.2,则( ) A.变量与具有正相关关系 B.去除两个误差较大的样本点后,重新求得的回归方程仍为 C.去
4、除两个误差较大的样本点后,的估计值增加速度变快 D.去除两个误差较大的样本点后,相应于样本点的残差为0.05 【答案】A 【分析】 由条件可知样本中心不变,可求出新的回归直线方程,即可判断. 【详解】 因为重新求得的经验回归直线的斜率为1.2,所以变量与具有正相关关系,故A正确; 当时,,设去掉两个误差较大的样本点后,横坐标的平均值为,纵坐标的平均值为, 则,, 因为去除两个误差较大的样本点后,重新求得回归直线的斜率为1.2, 所以,解得, 所以去除两个误差较大的样本点后的经验回归方程为,故B错误; 因为,所以去除两个误差较大的样本点后的估计值增加速度变慢,故C错误;
5、 因为,所以,故D错误. 故选:A. 4.(2021·广东天河·高三月考)下列表述中,正确的个数是( ) ①将一组数据中的每一个数据都加上同一个常数后,方差不变; ②设有一个回归方程,变量增加1个单位时,平均增加5个单位; ③设具有相关关系的两个变量,的相关系数为,那么越接近于0,,之间的线性相关程度越高; ④在一个列联表中,根据表中数据计算得到的观测值,若的值越大,则认为两个变量间有关的把握就越大. A.0 B.1 C.2 D.3 【答案】C 【分析】 ①根据方差的性质即可判断,②由回归方程一次项的系数符号可知增减情况,③根据相关系数的含义判断正误,④根据卡方检验的
6、观测值的意义判断正误. 【详解】 ①将一组数据中的每一个数据都加上同一个常数后,方差不变,正确; ②设有一个回归方程,变量增加1个单位时,平均减少5个单位,错误; ③设具有相关关系的两个变量,的相关系数为,那么越接近于1,,之间的线性相关程度越高,错误; ④在一个列联表中,根据表中数据计算得到的观测值,若的值越大,两个变量有关系的出错概率越小,则认为两个变量间有关的把握就越大,正确. 故选:C 5.(2021·江西·南昌市豫章中学高三开学考试(理))对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( ) A. B. C. D. 【答案】A 【分
7、析】 由给出的四组数据的散点图,结合相关系数的概念,逐图判定,即可求解. 【详解】 由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0, 题图2和题图4是负相关,相关系数小于0, 题图1和题图2的点相对更加集中,所以相关性更强,所以接近于1,接近于, 由此可得. 故选:A. 6.(2021·云南师大附中高三月考(文))对于样本点分布在指数函数曲线(其中,为待定参数且)周围时,令,,经过变换后得到的线性回归方程为( ) A. B. C. D. 【答案】C 【分析】 对两边取对数,得到经过变换后得到的线性回归方程. 【详解】 ∵,∴,∴
8、故选:C. 7.(2021·安徽马鞍山·二模(理))2020年初,从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、早涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量与温度的关系可以用模型拟合,设,其变换后得到一组数据: 由上表可得线性回归方程,则( ) A. B. C. D. 【答案】B 【分析】 由表格数据计算可得,代入线性回归方程可求得,进而求得回归模型,对应可得结果. 【详解】 由表格数据知:,, 代入得:,,即, ,. 故选:B. 8.(2021·江西·南昌市八一
9、中学三模(文))已知变量关于的回归方程为,其一组数据如表所示:若,则预测值可能为( ) A. B. C. D. 【答案】D 【分析】 将回归方程左右同时取对数得:,看作回归直线的形式,由回归直线过样本中心点可构造方程求得,由此得到回归方程;将代入回归方程即可求得结果. 【详解】 由得:,, 解得:,回归方程为,若,则. 故选:D. 【点睛】 关键点点睛:本题考查非线性回归中的预估值的求解,解题关键是能够通过对指数型回归模型左右同时取对数,将其变为线性回归的形式来进行求解. 二、多选题 9.(2021·湖北武汉·二模)
10、在对具有相关关系的两个变量进行回归分析时,若两个变量不呈线性相关关系,可以建立含两个待定参数的非线性模型,并引入中间变量将其转化为线性关系,再利用最小二乘法进行线性回归分析.下列选项为四个同学根据自己所得数据的散点图建立的非线性模型,且散点图的样本点均位于第一象限,则其中可以根据上述方法进行回归分析的模型有( ) A. B. C. D. 【答案】ABC 【分析】 将非线性模型,通过变形转化为线性模型,再利用最小二乘法进行线性回归分析. 【详解】 对于选项A :,令 则; 对于选项B: 令; 对于选项 C: 即 令 则; 对于选项D: 令则 此时斜率为 ,与最
11、小二乘法不符. 故选:ABC 10.(2021·全国·高三专题练习)(多选题)下列说法中,正确的命题是( ) A.已知随机变量服从正态分布,,则. B.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和0.3. C.已知两个变量具有线性相关关系,其回归直线方程为,若,,,则. D.若样本数据,,…,的方差为2,则数据,,…,的方差为16. 【答案】BC 【分析】 根据正态分布性质求即可判断A;根据方程变形即可确定,的值,再判断B; 根据回归直线方程过样本中心,即可判断C;根据数据变化与方差变化关系判断D. 【详解】 因为随机变量服
12、从正态分布,, 所以,即A错; ,,从而,即B正确; 过, ,即C正确; 因为样本数据,,…,的方差为2,所以数据,,…,的方差为,即D错误; 故选:BC 【点睛】 本题考查正态分布、方差性质以及线性回归方程及其性质,考查基本分析求解能力,属基础题. 三、填空题 11.(2021·广东·江门市新会陈瑞祺中学高三月考)某市政府调查市民收入增减与旅游需求的关系时,采用独立性检验法抽查了人,计算发现,根据这一数据查阅下表,市政府断言市民收入增减与旅游需求有关的可信度是___________. 附 … 0.100 0.025 0.010 0.005 … k
13、 … 2.706 5.024 6.635 7.879 … 【答案】 【分析】 根据即可求解. 【详解】 由已知可得, 所以市政府断言市民收入增减与旅游需求有关的可信度是, 故答案为:. 12.(2021·江苏·海安高级中学高三月考)根据下列数据: x 9 9.5 10 10.5 11 y 11 10 8 6 5 求得y关于x的回归直线方程为.则这组数据相对于所求的回归直线方程的5个残差的方差为______.(注:残差是实际观察值与估计值之间的差) 【答案】 【分析】 根据表格中的数据,求得,,代入回归方程,求得,结合残差的公式,即
14、可求解. 【详解】 根据数据,可得,,代入,可得,即, 因此残差的方差为. 故答案为:. 13.(2021·四川·仁寿一中高三开学考试(理))有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据: 近视 不近视 总计 少看手机 多看手机 总计 则在犯错误的概率不超过__________的前提下认为近视与多看手机有关系. 附表: 参考公式:,其中. 【答案】 【分析】 根据列联表计算得,进而得答案. 【详解】 解:根据列联表计算, 所以在犯错
15、误的概率不超过的前提下认为近视与多看手机有关系. 故答案为: 14.(2021·黑龙江·佳木斯一中三模(理))下列说法正确的有_____. ①统计中用相关系数r来衡量两个变量之间的线性关系的强弱.线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱. ②在线性回归模型中,计算相关指数R2≈0.6,表明解释变量解释了60%预报变量的变化. ③为了了解本校高三学生1159名学生的三模数学成绩情况,准备从中抽取一个容量为50的样本,现采用系统抽样的方法,需要从总体中剔除9个个体,在整体抽样过程中,每个个体被剔除的概率和每个个体被抽到的概率分别是和. ④随机变量X~N(μ,σ
16、2),则当μ一定时,曲线的形状由σ确定,σ越小,曲线越“矮胖”. ⑤身高x和体重y的关系可以用线性回归模型y=bx+a+e来表示,其中e叫随机误差,则它的均值E(e)=0. 【答案】②⑤ 【分析】 本题考查的是统计中的一些基础知识的理解与辨析,弄清楚每个基本量在统计中表示什么与影响什么,即可做出判断. 【详解】 ①统计中用相关系数r来衡量两个变量之间的线性关系的强弱, 线性相关系数|r|越大,两个变量的线性相关性越强;反之,线性相关性越弱,故①错误; ②在线性回归模型中,相关系数r可以衡量两个变量之间的相关关系的强弱, 相关指数,表明解释变量解释了60%预报变量的变化,故②正
17、确; ③为了了解本校高三学生1159名学生的三模数学成绩情况, 准备从中抽取一个容量为50的样本,现采用系统抽样的方法, 需要从总体中剔除9个个体, 在整体抽样过程中,每个个体被剔除的概率和每个个体被抽到的概率分别是和,故③错误; ④随机变量X~N(μ,σ2),则当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,故④错误; ⑤随机误差是衡量预报精确度的一个量,它满足,故⑤正确; 综上可知②⑤正确. 故答案为:②⑤. 15.(2021·江西南昌·一模(理))2020年,全球展开了某疫苗研发竞赛,我为处于领先地位,为了研究疫苗的有效率,在某地进行临床试验,对符合一定条件的1
18、0000名试验者注射了该疫苗,一周后有20人感染,为了验证疫苗的有效率,同期,从相同条件下未注射疫苗的人群中抽取2500人,分成5组,各组感染人数如下: 调查人数 300 400 500 600 700 感染人数 3 3 6 6 7 并求得与的回归方程为,同期,在人数为10000的条件下,以拟合结果估算未注射疫苗的人群中感染人数,记为;注射疫苗后仍被感染的人数记为,则估计该疫苗的有效率为__________. (疫苗的有效率为;参考数据:;结果保留3位有效数字) 【答案】 【分析】 先求出线性回归方程中的值,从而可求,再根据题设中的计算方法可求疫苗的有效率.
19、详解】 由题设表格中的数据可得,故, 故,而, 故疫苗有效率为, 故答案为:. 16.(2021·全国·高三专题练习)和的散点图如图所示,则下列说法中所有正确命题的序号为______. ①,是负相关关系; ②,之间不能建立线性回归方程; ③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则. 【答案】①③ 【分析】 由图可知,散点图呈整体下降趋势,据此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;. 【详解】
20、在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确; x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误; 由散点图知用拟合比用拟合效果要好,则,故③正确. 故答案为:①③. 【点睛】 本题考查由散点图反应两个变量的相关关系,散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,属于中档题. 四、解答题 17.(2021·全国·高三月考)击鼓传花,也称传彩球,是中国民间游戏,数人或几十人围成圆圈坐下,其中一人拿花(或一小物件
21、另有一人背着大家或蒙眼击鼓(桌子、黑板或其他能发出声音的物体),鼓响时众人开始传花(顺序不定),至鼓停止为止.此时花在谁手中(或其座位前),谁就上台表演节目,某单位组织团建活动,9人一组,共10组,玩击鼓传花,(前五组)组号与组内女性人数统计结果如表: 1 2 3 4 5 2 2 3 3 4 (Ⅰ)女性人数与组号(组号变量依次为1,2,3,4,5,…)具有线性相关关系,请预测从第几组开始女性人数不低于男性人数; 参考公式: (Ⅱ)在(Ⅰ)的前提下,从10组中随机抽取3组,求若3组中女性人数不低于5人的有组,求的分布列与期望; (Ⅲ)游戏开始后,若传给相邻
22、的人得1分,间隔人传得2分,每击一次鼓传一次花,得1分的概率为0.2,得2分的概率为0.8.记鼓声停止后得分恰为分的概率为,求. 【答案】(Ⅰ)从第8组开始女性人数不低于男性人数;(Ⅱ)分布列见解析,;(Ⅲ). 【分析】 (Ⅰ)根据题中表格结合参考公式即可求解;(Ⅱ)先写出的所有可能取值,再求出对应的概率,即可求解;(Ⅲ)根据对立事件列出关系式,再利用等比数列的定义和通项公式即可求解. 【详解】 (Ⅰ)由题可得, , . 则, , ∴, 当时,, ∴预测从第8组开始女性人数不低于男性人数. (Ⅱ)由题可知的所有可能取值为0,1,2,3, , , , , 则的
23、分布列为 0 1 2 3 ∴. (Ⅲ)在得分为分的基础上再传一次,则得分可能为分或分,记“合计得分”为事件,“合计得分”为事件,事件与为对立事件. ∵,, ∴, ∴. 18.(2021·全国·高三开学考试)足不出户,手机下单,送菜到家,轻松逛起手机“菜市场”,拎起手机“菜篮子”,省心又省力.某手机(应用程序)公司为了了解居民使用这款使用者的人数及满意度,对一大型小区居民开展个月的调查活动,从使用这款的人数的满意度统计数据如下: 月份 不满意的人数 使用 不使用 女性 男性 (1
24、请利用所给数据求不满意人数与月份之间的回归直线方程,并预测该小区月份的对这款不满意人数: (2)工作人员发现使用这款居民的年龄近似服从正态分布,求的值; (3)工作人员从这个月内的调查表中随机抽查人,调查是否使用这款与性别的关系,得到上表:能否据此判断有的把握认为是否使用这款与性别有关? 参考公式:,. 【答案】(1),人;(2)0.9759;(3)有. 【详解】 解:(1)由表中的数据可知:,, ,, 所求得回归直线方程为, 当时,, 该小区月份的对这款不满意人数预估为人; (2). (3)提出假设:是否使用这款与性别无关, 由表中的数据可得, 根据临界值可得,
25、有的把握认为是否使用这款与性别有关. 19.(2021·福建宁德·高三期中)近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表: 月 份 5月 6月 7月 8月 9月 月份代码 1 2 3 4 5 产值亿元 16 20 27 30 37 (1)根据上表数据,计算与的线性相关系数,并说明与的线性相关性强弱;(,则认为与线性相关性很强;,则认为与线性相关性不强) (2)求出关于的线性回归方程,并预测10月该企业的产值. 参考公式:; 参考数据:. 【答案】 (1);相关系数较强; (2)
26、10月该企业的产值约为亿元 【分析】 (1)利用表中数据求出 ,再由相关系数的求解公式即可求解. (2)利用最小二乘法即可求解. (1) ,, , 因为,所以与线性相关性较强. (2) 设线性回归方程为:; , , 即, 10月份对应的代码为, , 10月该企业的产值约为亿元. 20.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①,②,其中,,,均为常数,为自然对数的底数.现该公司对收集的近12年的年研发资金投入量
27、和年销售额()的数据作了初步处理,令,,经计算得到如下数据: 20 66 770 200 460 4.2 3125000 21500 0.308 14 (1)设和的样本相关系数为,和的样本相关系数为,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好; (2)(i)根据(1)的选择及表中数据,建立关于的非线性经验回归方程; (ii)若下一年销售额需达到90亿元,预测下一年的研发资金投入量约为多少亿元? 参考数据为,,. 【答案】(1)模型的拟合效果更好;(2)(i);(ii)36.66亿元. 【分析】 (
28、1)从样本相关系数计算可得,即可得到答案; (2)(i)由两边取对数得:,即,求出的值,可得线性回归方程,即可得到答案; (ii)将代入,结合提供的数据,即可求出的值; 【详解】 (1), , 因为,所以从样本相关系数的角度判断,模型的拟合效果更好. (2)(i)先建立关于的经验回归方程. 由,得,即. , , 所以关于的经验回归方程为, 所以,即. (ii)若下一年销售额需达到90亿元,则由,得, 又,所以, 所以, 所以预测下一年的研发资金投入量约为36.66亿元. 21.(2021·江苏南通·高三月考)为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通
29、过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2019年种植的一批试验紫甘薯在温度升高时6组死亡的株数. 温度/℃ 21 23 24 27 29 30 死亡数/株 6 11 20 27 57 77 经计算,,,,, ,,,其中,分别为试验数据中的温度和死亡株数,. (1)若用一元线性回归模型,求关于的经验回归方程(结果精确到0.1); (2)若用非线性回归模型求得关于的非线性经验回归方程,且相关指数为. (i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好; (ii)用拟
30、合效果好的模型预测温度为35℃时该批紫甘薯的死亡株数(结果取整数). 【答案】(1);(2)(i)的拟合效果更好,(ii)92. 【分析】 (1)利用公式即求; (2)(i)由相关指数公式求出,然后比较即可;(ii)代入回归方程即得. 【详解】 (1)由题意,得, ∴, ∴关于的经验回归方程为. (2)(i)经验回归方程对应的决定系相关指数为 , 因为, 所以经验回归方程比非线性经验回归方程的拟合效果更好. (ii)当时, , 即当温度为35℃时,该批紫甘薯的死亡株数为92. 22.(2021·黑龙江肇州·模拟预测(文))如图是某小区2020年1月至2021年1
31、月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择和两个模型进行拟合,经过数据处理得到两个回归方程分别为和,并得到以下一些统计量的值: 残差平方和 总偏差平方和 (1)请利用相关指数判断哪个模型的拟合效果更好; (2)估计该小区2021年6月份的二手房均价.(精确到万元/平方米) 参考数据:,,,,,,,. 参考公式:相关指数. 【答案】(1)模型;(2)(万元/平方米). 【分析】 (1)计算出相关指数后可判断哪一个函数拟合效果好. (2)根据(1)的中的模型可计算
32、二手房的均价. 【详解】 (1)设模型和的相关指数分别为和, 则,. 因为,所以. 所以模型的拟合效果更好. (2)由(1)知,模型的拟合效果更好, 利用该模型预测可得,这个小区2021年6月份的在售二手房均价为: (万元/平方米). 23.(2021·福建·泉州科技中学高三月考)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫()内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛. (1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度(秒)
33、与训练天数(天)有关,经统计得到如表的数据: (天) 1 2 3 4 5 6 7 (秒) 990 990 450 320 300 240 210 现用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度约为多少秒? (2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中) 1845 0.37 0.55 参考公
34、式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,. 【答案】(1),经过100天训练后,每天解题的平均速度约为140秒;(2). 【分析】 (1)先求得,结合,求得,,写出回归方程,再将,代入求解; (2)设比赛再继续进行局小明最终获得比赛,则最后一局一定是小明获胜,根据最多再进行4局就有胜负,分,,,利用独立事件的概率,结合互斥事件的概率求解. 【详解】 (1)由题意,, 令,设关于的线性回归方程为,则 , 则. ∴,又, ∴关于的回归方程为, 故时,. ∴经过100天训练后,每天解题的平均速度约为140秒. (2)设比赛再继续进行局小
35、明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负. 当时,小明胜,∴; 当时,小明胜,∴; 当时,小明胜,∴. ∴小明最终赢得比赛的概率为. 24.(2021·陕西渭南·高三月考(理))某保险公司根据官方公布的历年营业收入,制成表格如下: 表1 年份 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 年份序号x 1 2 3 4 5 6 7 8 9 10 营业收入y(亿元) 0.52 9.36 33.6 132 352 571 912 1207
36、 1682 2135 由表1,得到下面的散点图: 根据已有的函数知识,某同学选用二次函数模型(b和a是待定参数)来拟合y和x的关系.这时,可以对年份序号做变换,即令,得,由表1可得变换后的数据见表2. 表2 T 1 4 9 16 25 36 49 64 81 100 Y 0.52 9.36 33.6 132 352 571 912 1207 1682 2135 (1)根据表中数据,建立y关于t的回归方程(系数精确到个位数); (2)根据(1)中得到的回归方程估计2021年的营业收入,以及营业收入首次超过4000亿元的年份. 附:对
37、于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,. 参考数据:. 【答案】(1);(2)估计2021年的营业收入约为2518亿元,估计营业收入首次超过4000亿元的年份为2024年. 【分析】 (1)根据的公式,将题干中的数据代入,即得解; (2)代入,可估计2021年的营业收入;令,可求解的范围,继而得到的范围,即得解 【详解】 (1), , 故回归方程为. (2)2021年对应的t的值为121,营业收入, 所以估计2021年的营业收入约为2518亿元. 依题意有,解得,故. 因为, 所以估计营业收入首次超过4000亿元的年份序号为14,即2024年.
38、25.(2021·重庆市实验中学高三开学考试)某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如下处理:令,,得到相关数据如表所示: 15 15 (1)从①;②;③三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出与的回归方程; (3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?结果保留到万元 参考数据: 参考公式:回归方程中斜率和截距的最小二乘估计公式分别为 【答案】(1)选择回归类型更好;(2);(3)下一年
39、应至少投入万元广告费用. 【分析】 (1)根据散点图形状可确定回归类型; (2)对两边取对数,利用最小二乘法可求得,由此可得回归方程; (3)令可解出的范围,进而确定结果. 【详解】 (1)由散点图知,年广告费用和年利润额的回归类型并不是直线型的,而是曲线型的, 所以选择回归类型更好. (1)对两边取对数,得:,即, 由表中数据得:,,, 年广告费用和年利润额的回归方程为. (3)由(2)知:, 令得:,解得:, ,(十万元),十万元万元 下一年应至少投入万元广告费用. 26.(2021·重庆市第十一中学校高三月考)某创业者计划在南山旅游景区附近租赁一套农房发展成
40、特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以入住天数的频率作为各自的“入住率”,收费标准x与入住率y的散点图如图. x 100 150 200 300 450 y 90 65 45 30 20 (1)若从以上五家“农家乐”中随机抽取两家深入调查,记为“入住率”超过的农家乐的个数,求的分布列; (2)令,由散点图判断与哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;(,的
41、结果精确到) (3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销售额Q最大?(100天销售额入住率收费标准x) 参考数据:,,,,,,,,,. 【答案】(1)分布列见解析;(2)更适合于此模型,回归方程为;(3)150(元/日). 【分析】 (1)的所有可能取值为0,1,2,分别求出相应的概率,由此能求出的分布列. (2)由散点图可知更适合于此模型,求出,,,由此能求出回归方程. (3)依题意,,则,利用导数性质能求出当收费标准约为150(元日)时,100天销售额最大. 【详解】 解:(1)的所有可能取值为0,1,2, 则,, ∴的分布列是 0
42、 1 2 (2)由散点图可知更适合于此模型. 依题意,, 则, , 所求的回归方程为. (3)依题意,, 则, 由,得,,由,得,, ∴在上递增,在上递减, ∴当时,取到最大值. ∴当收费标准约为150(元/日)时,100天销售额L最大. 27.(2021·海南二中高三月考)为了使房价回归到收入可支撑的水平,让全体人民住有所居,近年来全国各一、二线城市打击投机购房,陆续出台了住房限购令.某市一小区为了进一步了解已购房民众对市政府岀台楼市限购令的认同情况,随机抽取了本小区50户住户进行调查,各户人平均月收入(单位:千元)的户数频率分布直方图
43、如图,其中赞成限购的户数如下表: 人平均月收入 赞成户数 4 9 12 6 3 1 (1)若从人平均月收入在的住户中再随机抽取两户,求所抽取的两户至少有一户赞成楼市限购令的概率; (2)若将小区人平均月收入不低于7千元的住户称为“高收入户”,人平均月收入低于7千元的住户称为“非高收入户”根据已知条件完成如图所给的列联表,并判断是否有的把握认为“收入的高低”与“赞成楼市限购令”有关. 非高收入户 高收入户 总计 赞成 不赞成 总计 附:临界值表 0.1 0.05 0.010 0.00
44、1 2.706 3.841 6.635 10.828 参考公式:,. 【答案】 (1) (2)列联表见解析,没有. 【分析】 (1)根据频率分布直方图,算出月收入在的住户数,并计算出赞成数与不赞成数,利用古典概率公式求得概率. (2)根据题意列出列联表,根据表中数据计算出,与6.635比较,来判断是否相关. (1) 由直方图知,月收入在的住户共有户,其中有3户赞成,3户不赞成. 设事件为“所抽取的两户中至少有一户赞成楼市限购令”,则由古典概型概率计算公式可知. (2) 依题意可得,列联表如下: 非高收入户 高收入户 总计 赞成 25 10
45、35 不赞成 5 10 15 总计 30 20 50 根据列联表中的数据可得,的观测值, 所以没有的把握认为“收入的高低”与“赞成楼市限购令”有关. 28.(2021·全国·高三课时练习)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按,,,,分组,绘制频率分布直方图如图所示.试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.假设小白鼠注射疫苗后是否产生抗体相互独立. (1)填写下面的列联表,并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生
46、抗体与指标值不小于60有关. 单位:只 抗体 指标值 合计 小于60 不小于60 有抗体 没有抗体 合计 (2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小白鼠产生抗体. (i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率; (ii)以(i)中确定的概率作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记个人注射2次疫苗后产生抗体的数量为随机变量.试验后统计数据显示,当时,取最大值,求参加人体接种试验的人数及. 参考公式: (其中为样本容量) 参
47、考数据: 0.50 0.40 0.25 0.15 0.100 0.050 0.025 0.455 0.708 1.323 2.072 2.706 3.841 5.024 【答案】(1)列联表答案见解析,认为注射疫苗后小白鼠产生抗体与指标值不小于60有关;(2)(i);(ii)当接种人数为n=99时,;当n=100时,. 【分析】 (1)根据频率分布直方图算出每个区间段的小白鼠数量,然后根据指标值完成列联表,并根据参考公式进行运算,然后进行数据比对,最终得到答案; (2)(i)根据古典概型公式,结合对立事件概率求法即可得到答案; (ii)根据最大
48、结合二项定理概率求法列出不等式组解出X,最后求出期望. 【详解】 (1)由频率分布直方图,知200只小白鼠按指标值分布为: 在内有(只); 在内有(只); 在内有(只); 在内有(只); 在内有(只). 由题意,有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有(只),所以指标值小于60且没有抗体的小白鼠有20只,同理,指标值不小于60且没有抗体的小白鼠有20只,故列联表如下: 单位:只 抗体 指标值 合计 小于60 不小于60 有抗体 50 110 160 没有抗体 20 20 40 合计 70 130 200 零假设为:注
49、射疫苗后小白鼠产生抗体与指标值不小于60无关联. 根据列联表中数据,得. 根据的独立性检验,推断不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.05. (2)(i)令事件“小白鼠第一次注射疫苗产生抗体”,事件“小白鼠第二次注射疫苗产生抗体”,事件“小白鼠注射2次疫苗后产生抗体”. 记事件A,B,C发生的概率分别为,,, 则,,. 所以一只小白鼠注射2次疫苗后产生抗体的概率. (ii)由题意,知随机变量,(). 因为最大, 所以, 解得,因为是整数,所以或,所以接受接种试验的人数为99或100. ①当接种人数为99时,; ②当接种
50、人数为100时,. 29.(2021·重庆南开中学高三月考)中国职业篮球联赛(CBA联赛)分为常规赛和季后赛.由于新冠疫情关系,今年联赛采用赛会制:所有球队集中在同一个地方比赛,分两个阶段进行,每个阶段采用循环赛,分主场比赛和客场比赛,积分排名前8的球队进入季后赛.季后赛的总决赛采用五场三胜制(“五场三胜制”是指在五场比赛中先胜三场者获得比赛胜利,胜者成为本赛季的总冠军).下表是队在常规赛60场比赛中的比赛结果记录表. 阶段 比赛场数 主场场数 获胜场数 主场获胜场数 第一阶段 30 15 20 10 第二阶段 30 15 25 15 (1)根据表中信息,是否






