资源描述
回归分析
1.回归直线:
假如散点图中点的分布从整体上看大致在一条直线四周,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.
求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来推断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数 →③写出回归直线方程 ,并利用回归直线方程进行猜想说明.
2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法.
建立回归模型的基本步骤是:
①确定争辩对象,明确哪个变量是解释变量,哪个变量是预报变量;
②画好确定好的解释变量和预报变量的散点图,观看它们之间的关系(线性关系).
③由阅历确定回归方程的类型.
④按确定规章估量回归方程中的参数 (最小二乘法);
⑤得出结论后在分析残差图是否特殊,若存在特殊,则检验数据是否有误,后模型是否合适等.
3.利用统计方法解决实际问题的基本步骤:
①提出问题;
②收集数据;
③分析整理数据;
④进行猜想或决策.
4.残差变量e 的主要来源:
①用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差.可能存在非线性的函数能够更好地描述y 与x 之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差.这种由于模型近似所引起的误差包含在e 中.
②忽视了某些因素的影响.影响变量y 的因素不只变量x 一个,可能还包含其他很多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在e 中.
③观测误差.由于测量工具等缘由,得到的y 的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在e 中.上面三项误差越小,说明我们的回归模型的拟合效果越好.
名师要点解析
例1争辩某浇灌渠道水的流速 与水深 之间的关系,测得一组数据如下:
水深x/m
1.40
1.50
1.60
1.70
1.80
1.90
2.00
2.10
流速y/(m/s)
1.70
1.79
1.88
1.95
2.03
2.10
2.16
2.21
(1)求y对x的回归直线方程;
(2)猜想水深为1.95m时水的流速是多少?
【分析】 本题考查如何求回归直线的方程,可先把有关数据用散点图表示出来,若这些点大致分布在通过散点图中心的一条直线四周,说明这两个变量线性相关,从而可利用我们学过的最小二乘估量思想及计算公式求得线性回归直线方程.
【解】
(1)由于问题中要求依据水深预报水的流速,因此选取水深为解释变量,流速为预报变量,作散点图:
由图简洁看出,x与y之间有近似的线性关系,或者说,可以用一个回归直线方程
来反映这种关系.由计算器求得 .
对x的回归直线方程为 .
(2)由(1)中求出的回归直线方程,把x=1.95代入,易得
.
计算结果表示,当水深为1.95m,时可以猜想渠水的流速为2.12m/s.
【点评】建立回归模型的一般步骤:
(1)确定争辩对象,明确两个变量即解释变量和预报变量;
(2)画出散点图,观看它们之间的关系;
(3)由阅历确定回归方程类型(若呈线性关系,选用线性回归方程);
(4)按确定规章估量回归方程中的参数(如最小二乘法);
(5)得出结果后分析残差图是否有特殊(个别数据对应残差过大,或残差毁灭不随机的规律性,等等),若存在特殊,则检查数据是否有误,或模型是否合适等.
例2电容器充电后,电压达到 ,然后开头放电,由阅历知道,此后电压 随时间 变化的规律公式 表示,观测得时间 时的电压 如下表所示:
0
1
2
3
4
5
6
7
8
9
10
100
75
55
40
30
20
15
10
10
5
5
试求电压 对时间 的回归方程.
【分析】由于两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系,我们可通过对数变换把指数关系变为线性关系,通过线性回归模型来建立 与 之间的非线性回归方程.
【解】对 两边取自然对数得
,令 ,即.
由所给数据可得
0
1
2
3
4
5
6
7
8
9
10
4.6
4.3
4.0
3.9
3.4
2.9
2.7
2.3
2.3
1.6
1.6
其散点图为:
由散点图可知 与 具有线性相关关系,可用 来表示.经计算得: (最小二乘法), , 即 .所以, .
【点评】一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型争辩呈非线性回归关系的两个变量之间的关系:
(1)假如散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模;
(2)假如散点图中的点的分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性回归模型来建模.
展开阅读全文