资源描述
学习变量的相关性切莫忽视散点图
一.学习变量的相关性应留意以下两点
1.对相关关系的理解应当留意以下两点:
(1)相关关系是非随机变量与随机变量之间的关系,而函数关系可以看成是两个非随机变量之间的关系,因此不能把相关关系等同于函数关系.其散点图也不能形成连续的图像.
(2)函数关系是一种因果关系,而相关关系不肯定是因果关系,也可能是伴随关系.因此变量的间散点图中的点的排列是没有规律的.
2.在分析两个变量的相关关系时,可依据样本散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.
一.求回归直线先看散点图
例1.下表是某地年降雨量与年平均气温,推断两者是线性相关吗?求回归直线有意义吗?
年平均气温( 0C )
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降雨量( mm )
748
542
507
813
574
701
432
解:以X轴为年平均气温,轴为年降水量,可得相应散点图:
X年平均气温0C
12
12.5
13
13.5
400
500
600
700
800
0
Y年降水量mm
.
.
.
.
.
.
.
.
由于图中各点并不在一条直线的四周,所以两者不具有相关关系,没有必要用回归直线进行拟合,假如用公式求得回归直线方程也是没有意义的.
二.散点图大致表现为线性相关时,方可用回归直线方程解决问题
例2、某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:
广告支出x(单位:万元)
1
2
3
4
销售收入y(单位:万元)
12
28
42
56
(1) 画出表中数据的散点图
(2)求出y对x的回归直线方程
(3)若广告费为9万元,则销售收入约为多少万元?
6.解:(1)作出的散点图如下图所示0
1
2
3
4
x(万元)
Y(万元)
10
20
30
40
50
60
.
.
.
.
(2)观测散点图可知各点大致分布在一条直线四周,由此可知散点图大致表现为线性相关.列出下表:
序号
x
y
X2
xy
1
1
12
1
12
2
2
28
4
56
3
3
42
9
126
4
4
56
16
224
10
138
30
418
易得
所以
故y对x的回归直线方程为
(3)当x=9时,
故当广告费为9万元时,销售收入约为129.4万元.
点评:(1)只有散点图大致表现为线性相关时,求回归直线方程才有意义;
(2)求回归直线应给出线性回归系数公式,在求解时为了计算更便利精确 不妨列出上表;
(3)回归直线过点.
三.利用散点图识别负相关关系 建立回归直线方程解决问题
例3.有一位同学家开了一个小卖部,他为了争辩气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:
温度( 0C )
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1) 画出散点图
(2) 你能从散点图中发觉气温与热饮销售杯数之间的一般规律吗?
(3) 求回归方程
(4) 假如某天的气温是2 0C猜测这天卖出的热饮杯数
解:(1)以x轴表示温度,以y轴表示热饮杯数,可作散点图:
-5
0
5
10
15
20
25
30
35
40
20
40
60
80
100
120
140
160
.
.
.
.
.
.
.
.
.
.
x
y
(2)从图中可以看出,各点散布在从左上角到右下角的区域内,气温与热饮销售杯数之间是负相关关系,即气温越高,卖出的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的四周,因此,可用公式求出回归方程的系数,利用计算器求得回归方程为
(4)当x=2时,.因此,某天的气温为20C,这天大约可卖出143杯热饮.
点评:所谓“负相关关系”就相当于函数关系中的单调递减关系,即一个变量变大时另一个变量减小.该题的散点图就呈现这种关系,所以是“负相关关系”.但是,“负相关关系”仍旧表明变量间具有线性相关,仍旧可以建立回归直线方程解决问题.
展开阅读全文