资源描述
2. 3变量间的相关关系(讲)
一、相关关系:
自变量取值确定时,因变量的取值带有确定随机性的两个变量之间的关系,叫做相关关系。
【说明】函数关系是一种格外确定的关系,而相关关系是一种非确定性关系。
思考探究:
1、有关法律规定,香烟盒上必需印上“吸烟有害健康”的警示语。吸烟是否确定会引起健康问题?你认为“健康问题不愿定是由吸烟引起的,所以可以吸烟”的说法对吗?
2、某地区的环境条件适合天鹅栖息繁衍,有人经统计发觉了一个好玩的现象,假如村庄四周栖息的天鹅多,那么这个村庄的婴儿诞生率也高,天鹅少的地方婴儿诞生率低,于是他得出了一个结论:天鹅能够带来孩子。你认为这样的结论牢靠吗?如何证明这个问题的牢靠性?
分析:(1)吸烟只是影响健康的一个因素,对健康的影响还有其他的一些因素,两者之间非函数关系即非因果关系;
(2)不对,这也是相关关系而不是函数关系。
上面提到了很多相关关系,那它们之间的相关关系强还是弱?我们下面来争辩一下。
二、散点图
探究:在一次对人体脂肪含量和年龄关系的争辩中,争辩人员获得了一组样本数据:
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30. 8
33.5
35.2
34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数。
思考探究:
1、对某一个人来说,他的体内脂肪含量不愿定随年龄增长而增加或削减,但是假如把很多个体放在一起,就可能表现出确定的规律性.观看上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
2、为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
在平面直角坐标系中,
表示具有相关关系的
两个变量的一组数据图
形称为散点图。
3、观看人的年龄的与人体脂肪含量散点图的大致趋势,有什么样的特点?阅读课本,这种相关关系我们称为什么?还有没有其他的相关关系?它又有怎样的特点?
三、线性相关、回归直线方程和最小二乘法
在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有确定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
假如散点图中的点的分布,从整体上看大致在一条直线四周,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
我们所画的回归直线应当使散点图中的各点在整体上尽可能的与其接近。我们怎么来实现这一目的呢?说一说你的想法。
设所求的直线方程为=bx+a,其中a、b是待定系数。
则i=bxi+a(i=1,2,…,n).于是得到各个偏差
yi-i =yi-(bxi+a)(i=1,2,…,n)
显见,偏差yi-i 的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故接受n个偏差的平方和
Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2
表示n个点与相应直线在整体上的接近程度。
记Q=
这样,问题就归结为:当a、b取什么值时Q最小,a、b的值由下面的公式给出:
其中=,=,a为回归方程的斜率,b为截距。
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫最小二乘法。
【例题精析】
有一个同学家开了一个小卖部,他为了争辩气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:
摄氏温度
-5
0
4
7
12
15
19
23
27
31
36
热饮杯数
156
150
132
128
130
116
104
89
93
76
54
(1)画出散点图;
(2)从散点图中发觉气温与热饮杯数之间关系的一般规律;
(3)求回归方程;
(4)假如某天的气温是2℃,猜想这天卖出的热饮杯数。
解:
(4)当x=2时,y=143.063
反思总结,当堂检测。
1、求样本数据的线性回归方程,可按下列步骤进行:
(1)计算平均数,;
(2)求a,b;
(3)写出回归直线方程。
2、回归方程被样本数据惟一确定,对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.。
3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,假如这组数据不具线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的。因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程
展开阅读全文