资源描述
2020-2021高中数学 第八章 成对数据的统计分析 8.2 一元线性回归模型及其应用素养检测新人教A版选择性必修第三册
2020-2021高中数学 第八章 成对数据的统计分析 8.2 一元线性回归模型及其应用素养检测新人教A版选择性必修第三册
年级:
姓名:
十七 一元线性回归模型及其应用
(20分钟 40分)
一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全的得3分,有选错的得0分)
1.(多选题)研究变量x,Y得到一组样本数据,进行回归分析,以下说法正确的是 ( )
A.残差平方和越小的模型,拟合的效果越好
B.用相关指数R2来刻画回归效果,R2越小说明拟合效果越好
C.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量平均增加0.2个单位
D.若变量Y和x之间的相关系数为r=-0.946 2,则变量Y和x之间的负相关性很强
【解析】选ACD.A可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故A正确;
B用相关指数R2来刻画回归效果,R2越大说明拟合效果越好,故B错误;
C在经验回归方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量平均增加0.2个单位,故C正确;
D若变量Y和x之间的相关系数为r=-0.946 2,r的绝对值趋向于1,则变量Y和x之间的负相关性很强,故D正确.
2.为研究某种细菌在特定环境下随时间变化的繁殖情况,得到如表实验数据:
天数x/天
3
4
5
6
繁殖个数Y/千个
2.5
3
4
4.5
由最小二乘法得Y与x的经验回归方程为=x+0.35,则样本在(4,3)处的残差为 ( )
A.-0.15 B.0.15 C.-0.25 D.0.25
【解析】选A.因为==4.5,==3.5,
所以有3.5=4.5+0.35⇒=0.7,
当x=4时,=0.7×4+0.35=3.15,所以样本在(4,3)处的残差为:3-3.15=-0.15.
3.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg、64 kg、58 kg、60 kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与响应变量的回归方程为=x+,其中=0.5,据此模型预测他的孙子的体重约为 ( )
A.58 kg B.61 kg C.65 kg D.68 kg
【解析】选B.由于体重是隔代遗传,且呈线性相关,
则取数据(58,58),(64,62),(58,60),
得==60,==60,
即样本点的中心为(60,60),代入=x+,
得=60-0.5×60=30,则=0.5x+30,
取x=62,可得=0.5×62+30=61 kg.
故预测他的孙子的体重约为61 kg.
4.某养殖场需要通过某装置对养殖车间进行恒温控制,为了解用电量Y(kW·h)与气温x(℃)之间的关系,随机统计了某5天的用电量与当天气温,并制作了对照表:
气温/℃
3
4
5
6
7
用电量/kW·h
2.5
3
4
4.5
6
若利用经验回归方程预测x=10℃时的用电量为8.25 kW·h,则预测x=12℃时的用电量为 ( )
A.8.75 kW·h B.9.86 kW·h
C.9.95 kW·h D.12.24 kW·h
【解析】选C.由表中数据得==5,
==4,
设经验回归方程为=x+,
所以,
解得=0.85,=-0.25,
所以经验回归方程为=0.85x-0.25,
当x=12℃时,=0.85×12-0.25=9.95(kW·h).
二、填空题(每小题5分,共10分)
5.某数学老师身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.
【解析】设父亲身高为x cm,儿子身高为Y cm,则
x
173
170
176
Y
170
176
182
=173,=176,==1,
=-=176-1×173=3,
所以=x+3,当x=182时,=185.
答案:185
6.已知变量x,Y线性相关,由观测数据算得样本的平均数=4,=5,经验回归方程=x+中的系数,满足+=4,则经验回归方程为 .
【解析】由题知,点(4,5)在回归直线上,则4+=5,又+=4,
所以=,=,
即经验回归方程为=x+.
答案:=x+
三、解答题
7.(10分)光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能,近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如表:
年份
2012年
2013年
2014年
2015年
2016年
2017年
2018年
2019年
年份代码
1
2
3
4
5
6
7
8
新增光伏发电
装机量Y兆瓦
0.4
0.8
1.6
3.1
5.1
7.1
9.7
12.2
某位同学分别用两种模型:
①=x2+;
②=x+进行拟合,得到相应的经验回归方程并进行残差分析,残差图如表(注:残差等于yi-).
经过计算得=72.8,
=42,
=686.8,
=3 570,其中ti=,=ti.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由.
(2)根据(1)的判断结果及表中数据建立Y关于x的经验回归方程,并预测该地区2021年新增光伏装机量是多少.(在计算回归系数时精确到0.01)
附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=-.
【解析】(1)选择模型①.
理由如下:根据残差图可以看出,模型①的估计值和真实值比较相近,模型②的残差值相对较大一些,所以模型①的拟合效果相对较好.
(2)由(1)可知,Y关于x的经验回归方程为=x2+,
令t=x2,则=t+.
由所给数据可得=ti=×(1+4+9+16+25+36+49+64)=25.5.
=yi=×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,
所以==≈0.19,
=-≈5-0.19×25.5≈0.16,
所以Y关于x的经验回归方程为=0.19x2+0.16
预测该地区2021年新增光伏发电装机量为=0.19×102+0.16=19.16(兆瓦).
(20分钟 40分)
一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全的得3分,有选错的得0分)
1.已知变量x,Y的取值如表:
x
1
2
3
4
5
Y
10
15
30
45
50
由散点图分析可知Y与x线性相关,且求得经验回归方程为=x-3,据此可预测:当x=8时,的值为 ( )
A.63 B.74 C.85 D.96
【解析】选C.由题得==3,
==30.
故样本点的中心的坐标为(3,30),
代入=x-3,得==11.
所以=11x-3,取x=8,得=11×8-3=85.
2.两个线性相关变量x与Y的统计数据如表:
x
9
9.5
10
10.5
11
Y
11
10
8
6
5
其经验回归方程是=x+40,则相对应于点的残差e为 ( )
A.0.1 B.0.2 C.-0.1 D.-0.2
【解析】选B.==10,
==8,
所以8=×10+40,所以=-3.2,故=-3.2x+40.
当x=11时,=-3.2×11+40=4.8,
故e=5-4.8=0.2.
3.(多选题)设某大学的女生体重Y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(i=1,2,…,n),用最小二乘法建立的经验回归直线方程为=0.85x-85.71,则下列结论中正确的是 ( )
A.Y与x具有正的线性相关关系
B.回归直线过样本中心点(,)
C.若该大学某女生身高增加2 cm,则其体重约增加1.70 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
【解析】选ABC.根据Y与x的经验回归直线方程为=0.85x-85.71,其中0.85>0说明y与x具有正的线性相关关系,A正确;
回归直线过样本中心点(,),B正确;
由回归直线方程知,若该大学某女生身高增加1 cm,则其体重约增加0.85 kg,那么若该大学某女生身高增加2 cm,则其体重约增加1.70 kg,故C正确;
若该大学某女生身高为170 cm,则可预测其体重为58.79 kg,不可断定其体重必为58.79 kg,D错误.
4.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归直线方程=0.2x+3,则c,k的值分别是 ( )
A.e2,0.6 B.e2,0.3
C.e3,0.2 D.e4,0.6
【解析】选C.因为y=cekx,等式两边同时取对数可得ln y=ln(cekx)=ln c+ln ekx=kx+ln c,
设z=ln y,则上式可化为z=kx+ln c,
因为z=0.2x+3,则k=0.2,ln c=3,
所以c=e3,k=0.2.
二、填空题(每小题5分,共10分)
5.某公司调查了商品A的广告投入费用x(万元)与销售利润Y(万元)的统计数据,如表:
广告费用x(万元)
2
3
5
6
销售利润Y(万元)
5
7
9
11
由表中的数据得经验回归直线方程为=x+,则当x=7时销售利润y的估值为 万元.
【解析】由题表中数据可得==4,==8,所以=
==1.4,
所以=-=8-1.4×4=2.4,
故经验回归方程为=1.4x+2.4,
所以当x=7时,=1.4×7+2.4=12.2.
答案:12.2
6.在研究两个变量的相关关系时,观察散点图,发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得经验回归方程=0.25x-2.58,则该模型的经验回归方程为 .
【解析】由经验回归方程=0.25x-2.58得ln =0.25x-2.58,
整理得=e0.25x-2.58,
所以该模型的经验回归方程为=e0.25x-2.58.
答案:=e0.25x-2.58
三、解答题
7.(10分)生物学家预言,21世纪将是细菌发电造福人类的时代.说起细菌发电,可以追溯到1910年,英国植物学家利用铂作为电极放进大肠杆菌的培养液里,成功地制造出世界上第一个细菌电池.然而各种细菌都需在最适生长温度的范围内生长.当外界温度明显高于最适生长温度,细菌被杀死;如果在低于细菌的最低生长温度时,细菌代谢活动受抑制.为了研究某种细菌繁殖的个数Y是否与在一定范围内的温度x有关,现收集了该种细菌的6组观测数据如表:
温度x/℃
21
23
24
27
29
32
繁殖个数Y/个
7
11
21
24
58
77
经计算得=550,
=3 946,
线性回归模型的残差平方和=345.
其中xi,yi分别为观测数据中的温度与繁殖数,i=1,2,3,4,5,6.
参考数据:e7.446≈1 713,e8.0605≈3 167,
(1)求Y关于x的经验回归方程=x+a(精确到0.1);
(2)若用非线性回归模型求得Y关于x回归方程为=0.075e0.219x,且非线性回归模型的残差平方和=319.
(ⅰ)用决定系数R2说明哪种模型的拟合效果更好;
(ⅱ)用拟合效果好的模型预测温度为34℃时,该种细菌的繁殖数(结果取整数).
附:一组数据,,…,,其回归直线=x+的斜率和截距的最小二乘法估计为=,=-;
决定系数R2=1-
【解析】(1)由题意得=xi=26,
=yi=33,=84,
==≈6.5,
=33-6.5×26=-136,
所以y关于x的经验回归方程为=6.5x-136.
(2)(ⅰ)经验回归方程=6.5x-136对应的决定系数为
=1-=1-.
非线性回归模型=0.075e0.219x对应的决定系数为
=1-=1-.
因为345>319,所以<,
所以回归方程=0.075e0.219x比经验回归方程=6.5x-136拟合效果更好.
(ⅱ)由(ⅰ)得当温度x=34℃时,=0.075e0.219×34≈0.075×1 713≈128,
即当温度x=34℃时,该种细菌的繁殖数估计为128个.
展开阅读全文