资源描述
2.3变量间相关关系(预)
一、预习目标
1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观生疏变量间的相关关系;
2. 知道最小二乘法的思想,能依据给出的线性回归方程系数公式建立线性回归方程。
二、预习内容
1.举例说明函数关系为什么是确定关系?
2.一个人的身高与体重是函数关系吗?
3. 相关关系的概念:
4. 什么叫做散点图?
5.回归分析,(1)求回归直线方程的思想方法;(2)回归直线方程的求法
三、提出怀疑
同学们,通过你的自主学习,你还有哪些怀疑,请把它填在下面的表格中
怀疑点
怀疑内容
课内探究学案
一、学习目标
1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观生疏变量间的相关关系.
2.经受用不同估算方法描述两个变量线性相关的过程,知道最小二乘法的思想,能依据给出的线性回归方程系数公式建立线性回归方程.
二、学习重难点:
重点:作出散点图和依据给出的线性回归方程系数公式建立线性回归方程
难点:对最小二乘法的理解。
三、学习过程
思考:考察下列问题中两个变量之间的关系:
(1)商品销售收入与广告支出经费;
(2)粮食产量与施肥量;
(3)人体内的脂肪含量与年龄.
这些问题中两个变量之间的关系是函数关系吗?
(一)、相关关系:
自变量取值确定时,因变量的取值带有确定随机性的两个变量之间的关系,叫做相关关系。
【说明】函数关系是一种格外确定的关系,而相关关系是一种非确定性关系。
思考探究:
1、有关法律规定,香烟盒上必需印上“吸烟有害健康”的警示语。吸烟是否确定会引起健康问题?你认为“健康问题不愿定是由吸烟引起的,所以可以吸烟”的说法对吗?
2、某地区的环境条件适合天鹅栖息繁衍,有人经统计发觉了一个好玩的现象,假如村庄四周栖息的天鹅多,那么这个村庄的婴儿诞生率也高,天鹅少的地方婴儿诞生率低,于是他得出了一个结论:天鹅能够带来孩子。你认为这样的结论牢靠吗?如何证明这个问题的牢靠性?
(二)、散点图
探究:在一次对人体脂肪含量和年龄关系的争辩中,争辩人员获得了一组样本数据:
年龄
23
27
39
41
45
49
50
脂肪
9.5
17.8
21.2
25.9
27.5
26.3
28.2
年龄
53
54
56
57
58
60
61
脂肪
29.6
30.2
31.4
30.8
33.5
35.2
34.6
其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数。
思考探究:
1、对某一个人来说,他的体内脂肪含量不愿定随年龄增长而增加或削减,但是假如把很多个体放在一起,就可能表现出确定的规律性.观看上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?
2、为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?
3、观看人的年龄的与人体脂肪含量散点图的大致趋势,有什么样的特点?阅读课本,这种相关关系我们称为什么?还有没有其他的相关关系?它又有怎样的特点?
(三)、线性相关、回归直线方程和最小二乘法
在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有确定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?
假如散点图中的点的分布,从整体上看大致在一条直线四周,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
我们所画的回归直线应当使散点图中的各点在整体上尽可能的与其接近。我们怎么来实现这一目的呢?说一说你的想法。
这样,问题就归结为:当a、b取什么值时Q最小,a、b的值由下面的公式给出:
其中=,=,a为回归方程的斜率,b为截距。
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫最小二乘法。
【例题精析】
【例1】下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:
气温/℃
26
18
13
10
4
-1
杯数
20
24
34
38
50
64
(1)将上表中的数据制成散点图.
(2)你能从散点图中发觉温度与饮料杯数近似成什么关系吗?
(3)假如近似成线性关系的话,恳求出回归直线方程来近似地表示这种线性关系.
(4)假如某天的气温是-5℃时,猜想这天小卖部卖出热茶的杯数.
(四)反思总结
1、求样本数据的线性回归方程,可按下列步骤进行:
(1)计算平均数,;
(2)求a,b;
(3)写出回归直线方程。
2、回归方程被样本数据惟一确定,对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.。
3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,假如这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的。因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程。
(五)当堂检测
1.有关线性回归的说法,不正确的是
A.相关关系的两个变量不是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有回归方程
2.下面哪些变量是相关关系
A.出租车费与行驶的里程 B.房屋面积与房屋价格
C.身高与体重 D.铁的大小与质量
3.回归方程=1.5x-15,则
A.=1.5-15 B.15是回归系数a
C.1.5是回归系数a D.x=10时,y=0
4.r是相关系数,则结论正确的个数为
①r∈[-1,-0.75]时,两变量负相关很强
②r∈[0.75,1]时,两变量正相关很强
③r∈(-0.75,- 0.3]或[0.3,0.75)时,两变量相关性一般
④r=0.1时,两变量相关很弱
A.1 B.2 C.3 D.4
5.线性回归方程=bx+a过定点________.
6.一家工厂为了对职工进行技能检查,对某位职工进行了10次试验,收集数据如下:
零件数x(个)
10
20
30
40
50
60
70
80
加工时间y(分钟)
12
25
33
48
55
61
64
70
(1)画出散点图;
(2)求回归方程.
参考答案:
1. 答案:D解析:只有线性相关的数据才有回归直线.
2. 答案:C解析:A、B、D都是函数关系,其中A一般是分段函数,只有C是相关关系.
3. 答案:A解析:D中x=10时=0,而非y=0,系数a、b的意义要分清.
4. 答案:D解析:相关系数r的性质.
5.答案:(,)解析:=bx+a,=bx+-b,(-)=b(x-)
课后练习与提高
1.下列两个变量之间的关系不具有线性关系的是( )
A.小麦产量与施肥值
B.球的体积与表面积
C.蛋鸭产蛋个数与饲养天数
D.甘蔗的含糖量与生长期的日照天数
2.下列变量之间是函数关系的是( )
A.已知二次函数,其中,是已知常数,取为自变量,因变量是这个函数的判别式:
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食亩产量
3.下面现象间的关系属于线性相关关系的是( )
A.圆的周长和它的半径之间的关系
B.价格不变条件下,商品销售额与销售量之间的关系
C.家庭收入愈多,其消费支出也有增长的趋势
D.正方形面积和它的边长之间的关系
4.下列关系中是函数关系的是( )
A.球的半径长度和体积的关系
B.农作物收获和施肥量的关系
C.商品销售额和利润的关系
D.产品产量与单位成品成本的关系
5.设有一个回归方程为,则变量x增加一个单位时( )
A.平均增加1.5单位 B. 平均增加2单位
C. 平均削减1.5单位 D. 平均削减2单位
6.工人月工资(元)与劳动生产率(千元)变化的回归直线方程为,下列判
断不正确的是( )
A.劳动生产率为1000元时,工资约为130元
B.劳动生产率提高1000元时,则工资平均提高80元
C.劳动生产率提高1000元时,则工资平均提高130元
D.当月工资为210元时,劳动生产率约为2000元
7.某城市近10年居民的年收入x与支出y之间的关系大致符合(单位:亿元),估量今年该城市居民年收入为15亿元,则年支出估量是 .
8、在某种产品表面进行腐蚀线试验,得到腐蚀深度y与腐蚀时间x之间对应的一组数据:
时间t(s)
5
10
15
20
30
40
50
60
70
90
120
深度y(μm)
6
10
10
13
16
17
19
23
25
29
46
(1)画出散点图;
(2)试求腐蚀深度y对时间t的回归直线方程。
展开阅读全文