资源描述
[学业水平训练]
1.(2014·景德高二检测)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析:选C.对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,所以有r2<0<r1.
2.(2014·厦门高二检测)观察两个相关变量的如下数据:
x
-1
-2
-3
-4
-5
y
-0.9
-2
-3.1
-3.9
-5.1
x
5
4
3
2
1
y
5
4.1
2.9
2.1
0.9
则两个变量间的回归直线方程为( )
A.=0.5x-1 B.=x
C.=2x+0.3 D.=x+1
解析:选B.=(-1-2…-5+5+4+…+2+1)=0,
=(-0.9-2-…-5.1+5+…+0.9)=0.
由回归直线方程过样本中心点(,)知B正确.
3.工人工资(元)依劳动生产率变化的回归直线方程为=80x+50,下列判断正确的是( )
A.劳动生产率为1时,工资为80元
B.劳动生产率提高1时,工资提高80元
C.劳动生产率提高1时,工资提高130元
D.当月工资为250元时,劳动生产率为2
解析:选B.回归直线斜率为80,所以x每增加1,增加80,即劳动生产率提高1时,工资提高80元.根据线性回归直线方程,相应于x=1的估计值y=130,故A错,应选B.
4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y与x的回归直线的斜率为b,纵截距为a,则必有( )
A.b与r的符号相同 B.a与r的符号相同
C.b与r的符号相反 D.a与r的符号相反
解析:选A.线性回归方程为y=bx+a,b>0时,x与y正相关,b<0时,x与y负相关,因此b与r的符号相同,故选A.
5.(2014·宁德高三检测)为了表示n个点与相应直线在整体上的接近程度,我们常用的表示法为( )
A.(yi-) B.(-yi)
C.(yi-)2 D.(yi-)2
解析:选C.由回归直线方程=+x可知,为一个量的估计值,而yi为它的实际值,在最小二乘估计中(yi-a-bxi)2,即(yi-)2.
6.(2014·武汉调研)在=- 中,(,)称为________;=________,被称为________.
答案:样本点的中心 yi- 残差
7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.
答案:1
8.(2014·青岛高二检测)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性进行分析,并用回归分析的方法分别求得相关指数R2与残差平方和Q(,)如下表:
甲
乙
丙
丁
R2
0.67
0.61
0.48
0.72
Q(+)
106
115
124
103
则能体现A,B两个变量有更强的线性相关性的为________.
解析:丁同学所求得的相关指数R2最大,残差平方和Q(,)最小.此时,A,B两变量线性相关性更强.
答案:丁
9.针对下表中某工厂某种产品产量x(103件)与单位成本y(元/件)的资料进行线性回归分析,并指出产品产量与单位成本之间的变化关系.
月份
产量x(103件)
单位成本y(元/件)
x2
xy
1
2
73
4
146
2
3
72
9
216
3
4
71
16
284
4
3
73
9
219
5
4
69
16
276
6
5
68
25
340
合计
21
426
79
1 481
解:设回归直线方程为=x+,
=3.5,==71,
=79,iyi=1 481,代入公式,
得==
=≈-1.82,
=71-(-1.82)×3.5=77.37.
故回归直线方程为=77.37-1.82x.
由于回归系数为-1.82,由回归系数的意义可知:产量每增加1 000件,单位成本下降1.82元.
10.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)=(8+8.2+8.4+8.6+8.8+9)=8.5,=(90+84+83+80+75+68)=80,
从而=+20=80+20×8.5=250,
故=-20x+250.
(2)由题意知,工厂获得利润z=(x-4)y=-20x2+330x-1 000=-202+361.25,
所以当x==8.25时,zmax=361.25(元),
即当该产品的单价定为8.25元时,工厂获得最大利润.
[高考水平训练]
1.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )
A.10亿 B.9亿
C.10.5亿 D.9.5亿
解析:选C.∵x=10时,y=0.8×10+2+e=10+e.
又∵|e|≤0.5,∴y≤10.5.
2.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:
=,=71,=79,iyi=1 481.
则销量每增加1 000箱,单位成本下降________元.
解析:由题意知=≈-1.818 2,
=71-(-1.818 2)×≈77.36,=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.
答案:1.818 2
3.假设关于某设备的使用年限x年和支出的维修费用y(万元),有如下表的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系,试求:
(1)线性回归方程=x+;
(2)估计使用年限为10年时,维修费用是多少?
(3)计算总偏差平方和、残差平方和及回归平方和;
(4)求R2并说明模型的拟合效果.
解:(1)将已知条件制成下表:
i
1
2
3
4
5
合计
xi
2
3
4
5
6
20
yi
2.2
3.8
5.5
6.5
7.0
25
xiyi
4.4
11.4
22.0
32.5
42.0
112.3
x
4
9
16
25
36
90
=4;=5;=90;iyi=112.3
于是有===1.23,
=- =5-1.23×4=0.08,
回归直线方程是y=1.23x+0.08.
(2)当x=10时,y=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
(3)总偏差平方和(yi-)2=15.78,
残差平方和1=2.46+0.08=2.54,2=3.77,
3=5,4=6.23,5=7.46,(yi-i)2=0.651,
回归平方和:15.78-0.651=15.129.
(4)R2=1-=1-=0.958 7,
模型的拟合效果较好,使用年限解释了95.87%的维修费用支出.
4.(2014·高考课标全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
=,=- .
解:(1)由所给数据计算得=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14.
===0.5,
=-t=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入(1)中的回归方程,
得=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
展开阅读全文