资源描述
测试题
1.下列说法中错误的是( )
A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…, n)将散布在一条直线附近
B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。
C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数
D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是( )
A. B. C. D.
3.回归直线必过点( )
A.(0,0) B. C. D.
4.在画两个变量的散点图时,下面叙述正确的是( )
A.预报变量在轴上,解释变量在轴上
B.解释变量在轴上,预报变量在轴上
C.可以选择两个变量中任意一个变量在轴上
D.可以选择两个变量中任意一个变量在轴上
5.两个变量相关性越强,相关系数r( )
A.越接近于0 B.越接近于1 C.越接近于-1 D.绝对值越接近1
6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为( )
A.0 B.1 C.-1 D.-1或1
7.一位母亲记录了她儿子3到9岁的身高,数据如下表:
年龄(岁)
3
4
5
6
7
8
9
身高(
94.8
104.2
108.7
117.8
124.3
130.8
139.0
由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,
则下面的叙述正确的是( )
A.她儿子10岁时的身高一定是145.83
B.她儿子10岁时的身高在145.83以上
C.她儿子10岁时的身高在145.83左右
D.她儿子10岁时的身高在145.83以下
8.两个变量有线性相关关系且正相关,则回归直线方程中,的系数( )
A. B. C. D.
能力提升:
9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:
x
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
(1)画出散点图;
(2)求每月产品的总成本y与该月产量x之间的回归直线方程。
10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:
产量x(千件)
40
42
48
55
65
79
88
100
120
140
生产费用y(千元)
150
140
160
170
150
162
185
165
190
185
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行相关性检验;
(3)设回归直线方程为,求系数,。
综合探究:
11.一只红铃虫的产卵数y和温度x有关。现收集了7对观测数据列于表中,试建立y与x之间的回归方程。
温度x/℃
21
23
25
27
29
32
35
产卵数y/个
7
11
21
24
66
115
325
参考答案:
基础达标:
1.B
尽管两个变量x与y之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。
2.A
由回归直线经过样本点的中心,由题中所给出的数据,将,代入中适合,故选A。
3.D
回归直线,必然经过样本点的中心,其坐标为,故选D。
4.B
5.D
6.B
7.C
8.A
9.解析:
(1)画出的散点图如图所示:
(2),,,
∴,
。
所以所求回归直线方程为。
10.解析:
(1)制表:
1
40
150
1600
22500
6000
2
42
140
1764
19600
5880
3
48
160
2304
25600
7680
4
55
170
3025
28900
9350
5
65
150
4225
22500
9750
6
79
162
6241
26244
12798
7
88
185
7744
34225
16280
8
100
165
10000
27225
16500
9
120
190
14400
36100
22800
10
140
185
19600
34225
25900
合计
777
1657
70903
277119
132938
,,,,
∴,
即x与y的相关系数r≈0.808。
(2)因为,所以可以认为x与y之间具有很强的线性相关关系。
(3),。
综合探究:
11.解析:
散点图如图所示:
由散点图可以看出:这些点分布在某一条指数函数的图象的周围。
现在,问题变为如何估计待定参数c1和c2,我们可以通过对数变换把指数关系变为线性关系。
令,则变换后样本点应该分布在直线(,)的周围。
这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了。
由题中所给数据经变换后得到如下的数据表及相应的散点图
x
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。
计算得,,,。
设所示的线性回归方程为,
则有,
,
得到线性回归方程,
因此红铃虫的产卵数对温度的非线性回归方程为。
总结升华:
(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能
直接利用线性回归方程来建立两个变量之间的关系。根据已有的函数知识,可以发现样本点分布
在一条指数函数曲线的周围,其中c1和c2是待定参数。
(2)选择适当的非线性回归方程。然后通过变量代换,将非线性回归方程化为线性回归方程,并由此
来确定非线性回归方程中的未知参数。
(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有
回归分析
撰稿 吕宝珠 审稿 谷丹 责编:严春梅
课程标准的要求
回归分析的基本思想及其初步应用:
(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;
(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;
(3)理解线性回归模型;
(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体
计算公式.
(5)了解解释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方和 ;了解样本的
数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样
本的各个点的随机误差的效应的平方和)的参数:残差平方和 ;了解表示解释变量效应的参数:
回归平方和;了解刻画回归效果的相关指数的含义及计算公式。
(有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的).
(6)了解残差分析的方法及意义,会读或会作残差图.
重点和难点分析
回归分析的基本思想及其初步应用。
内容精讲
1.相关关系:
当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系
相关关系与函数关系的异同点如下:
相同点:均是指两个变量的关系。
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间
的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
2.回归分析:
一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。
对于线性回归分析,我们要注意以下几个方面:
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析
的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,
在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意
义,否则,求出的回归直线方程毫无意义。
3.散点图:
表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度。粗略地看,散点分布具有一定的规律。
4. 回归直线
设所求的直线方程为,其中a、b是待定系数.
, ,
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。
5.相关系数:
相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把
=
叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.
6.相关系数的性质:
≤1,且越接近1,相关程度越大;且越接近0,相关程度越小.
7.显著性水平:
显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。它必须在每一次统计检验之前确定。
8.显著性检验:
由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数 在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0.05或r0.01;例如n=7时,r0.05=0.754,r0.01=0.874 求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当≤r0.05或r0.01,认为线性关系不显著。
典型例题:
1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
X
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
Y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
1)画出散点图;
2)检验相关系数r的显著性水平;
3)求月总成本y与月产量x之间的回归直线方程.
解析:
i
1
2
3
4
5
6
7
8
9
10
11
12
xi
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
yi
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
xiyi
2.43
2.264
2.856
3.264
3.590
4.07
4.643
5.090
5.652
6.096
6.653
7.245
,,,,
1)画出散点图:
2)
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值
r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相
关关系。
3)设回归直线方程,
利用,
计算a,b,得b≈1.215, ,
∴回归直线方程为:
2.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
1)画出散点图;
2)检验相关系数r的显著性水平;
3)求月总成本y与月产量x之间的回归直线方程。
解析:
1)画出散点图如下:
2)检验相关系数r的显著性水平:
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330
345
365
405
445
450
455
xiyi
4950
6950
9125
12150
15575
18000
20475
,,,,
,
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值
r0.05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。
3)设回归直线方程,利用
计算a,b, 得
a=399.3-4.75×30≈257,则回归直线方程
3.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:
年份
1985
1986
1987
1988
1989
1990
1991
1992
x(kg)
70
74
80
78
85
92
90
95
y(t)
5.1
6.0
6.8
7.8
9.0
10.2
10.0
12.0
年份
1993
1994
1995
1996
1997
1998
1999
x(kg)
92
108
115
123
130
138
145
y(t)
11.5
11.0
11.8
12.2
12.5
12.8
13.0
(1)求x与y之间的相关系数,并检验是否线性相关;
(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,
每单位面积蔬菜的年平均产量。
分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界比较,若则线性相关,否则不线性相关。
解析:
(1)列出下表,并用科学计算器进行有关计算:
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
70
74
80
78
85
92
90
95
92
108
115
123
130
138
145
5.1
6.0
6.8
7.8
9.0
10.2
10.0
12.0
11.5
11.0
11.8
12.2
12.5
12.8
13.0
357
444
544
608.4
765
938.4
900
1140
1058
1188
1357
1500.6
1625
1766.4
1885
,,
,,。
故蔬菜产量与放用氮肥量的相关系数
。
由于n=15,故自由度15-2=13。
由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值,
则,
从而说明蔬菜产量与氮肥量之间存在着线性相关关系。
(2)设所求的回归直线方程为,
则,
,
∴回归直线方程为。
点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用含统计的科学计算器,能简单得到,,,,这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数据进行处理。
4.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知y对x呈线性相关关系。试求:
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。
解析:
(1)列表如下:
i
1
2
3
4
5
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
4.4
11.4
22.0
32.5
42.0
4
9
16
25
36
, , ,
于是,
。
∴线性回归方程为:。
(2)当x=10时,(万元)
即估计使用10年时维修费用是12.38万元。
点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的
展开阅读全文