1、 相关关系相关关系 相关关系 函数关系函数关系:如如:销售额与销售量销售额与销售量;圆面积和圆半径圆面积和圆半径.统计关系统计关系:如如:收入和消费收入和消费;身高的遗传身高的遗传.1 相关关系相关关系例:某个保险公司承保汽车例:某个保险公司承保汽车5 5万辆,平均每万辆,平均每辆保费收入为辆保费收入为10001000元,则该保险公司汽元,则该保险公司汽车承保总收入为车承保总收入为50005000万元。如果把承保万元。如果把承保总收入设为总收入设为y,y,承保汽车辆数设为承保汽车辆数设为x x,则,则y=1000 xy=1000 x,x x与与y y两个变量间完全表现为一两个变量间完全表现为一
2、种确定性关系,即函数关系。种确定性关系,即函数关系。2 相关关系相关关系 Y=1000 xX(万辆)Y(万元)3 相关关系相关关系 储蓄额与居民的收入密切相关,还与通货膨胀、股票储蓄额与居民的收入密切相关,还与通货膨胀、股票储蓄额与居民的收入密切相关,还与通货膨胀、股票储蓄额与居民的收入密切相关,还与通货膨胀、股票价格指数、利率、投资意识等有关。价格指数、利率、投资意识等有关。价格指数、利率、投资意识等有关。价格指数、利率、投资意识等有关。广告费与商品销售额广告费与商品销售额广告费与商品销售额广告费与商品销售额 在应用统计中,我们把上述变量间具有密切关系而在应用统计中,我们把上述变量间具有密切
3、关系而在应用统计中,我们把上述变量间具有密切关系而在应用统计中,我们把上述变量间具有密切关系而又不能用函数关系精确表达的关系,称为变量间的相又不能用函数关系精确表达的关系,称为变量间的相又不能用函数关系精确表达的关系,称为变量间的相又不能用函数关系精确表达的关系,称为变量间的相关关系。关关系。关关系。关关系。宝马车与交通事故,宝马车与交通事故,宝马车与交通事故,宝马车与交通事故,2003200320032003年在哈尔滨市,一辆宝马车年在哈尔滨市,一辆宝马车年在哈尔滨市,一辆宝马车年在哈尔滨市,一辆宝马车撞倒撞倒撞倒撞倒1 1 1 1人,并将拖死,另外还导致人,并将拖死,另外还导致人,并将拖死
4、,另外还导致人,并将拖死,另外还导致12121212人受伤,人受伤,人受伤,人受伤,2004200420042004年在年在年在年在长沙市,一位女性驾驶一辆宝马撞伤长沙市,一位女性驾驶一辆宝马撞伤长沙市,一位女性驾驶一辆宝马撞伤长沙市,一位女性驾驶一辆宝马撞伤7 7 7 7人。人。人。人。6 相关关系相关关系 (广告费:万元)Y(商品销售额:万元).Y与x非确定性关系图7 一元线性回归一元线性回归 回归分析的步骤:回归分析的步骤:1 1。做出散点图,观察变量间的趋势。做出散点图,观察变量间的趋势。2 2。考察数据的分布,进行必要的处理。考察数据的分布,进行必要的处理。3 3。进行直线回归分析。
5、进行直线回归分析。4 4。残差分析。这是模型拟合完后对模型。残差分析。这是模型拟合完后对模型的诊断。的诊断。残差间是否独立:采用残差间是否独立:采用Durbin-WatsonDurbin-Watson8 一元线性回归一元线性回归 残差序列相关性检验进行分析,该统计量的取值在残差序列相关性检验进行分析,该统计量的取值在0-40-4之间,如果残差间相互独立,则取值在之间,如果残差间相互独立,则取值在2 2附近。附近。残差分布是否正态:可采用观察残察图法。残差分布是否正态:可采用观察残察图法。9 一元线性回归一元线性回归 在上三幅残差图中,第一幅残差分布非在上三幅残差图中,第一幅残差分布非常好,没有
6、什么问题;第二幅图中残差常好,没有什么问题;第二幅图中残差虽然围绕均线均匀分布,但波动范围随虽然围绕均线均匀分布,但波动范围随着拟合值增大而增大,提示方差不齐,着拟合值增大而增大,提示方差不齐,模型假设不成立,应当进行变量变换,模型假设不成立,应当进行变量变换,或采用加权最小二乘法分析;第三幅图或采用加权最小二乘法分析;第三幅图最惨,提示应变量与自变量间并非直线最惨,提示应变量与自变量间并非直线关系,应该按曲线趋势进行拟合。关系,应该按曲线趋势进行拟合。10 一元线性回归一元线性回归 回归分析的步骤:回归分析的步骤:5 5。强影响点的诊断及多重共线性。强影响点的诊断及多重共线性(Colline
7、arity)Collinearity)问题的判断。问题的判断。注:强影响点即为异常点或离群点。注:强影响点即为异常点或离群点。注:强影响点即为异常点或离群点。注:强影响点即为异常点或离群点。11 一元线性回归一元线性回归 一元线性回归是描述两个变量之间相关关系一元线性回归是描述两个变量之间相关关系一元线性回归是描述两个变量之间相关关系一元线性回归是描述两个变量之间相关关系的最简单的回归模型。的最简单的回归模型。的最简单的回归模型。的最简单的回归模型。通常我们对所研究的问题,首先要收集与它通常我们对所研究的问题,首先要收集与它通常我们对所研究的问题,首先要收集与它通常我们对所研究的问题,首先要收
8、集与它有关的有关的有关的有关的n n n n组样本数据(组样本数据(组样本数据(组样本数据(x x x xi i i i,y,y,y,yi i i i),),),),i=1,2,.i=1,2,.i=1,2,.i=1,2,.N.N.N.N.为了直观地发现样本数据的分布规律,画出为了直观地发现样本数据的分布规律,画出为了直观地发现样本数据的分布规律,画出为了直观地发现样本数据的分布规律,画出n n n n个样本的散点图。个样本的散点图。个样本的散点图。个样本的散点图。12 一元线性回归一元线性回归我们用下面的数学模型来描述:我们用下面的数学模型来描述:我们用下面的数学模型来描述:我们用下面的数学模
9、型来描述:13 模型的假设条件模型的假设条件高斯假设条件:以下三个假设条件是由德国数学家高斯(Gauss)首先提出的,所以称为高斯假设条件。其假设条件如下:对总体中各次观察的随机误差14 模型的假设条件模型的假设条件(1)零均值性:即在自变量取一定值Xi的条件下,(2)等方差性:即在自变量取一定值Xi的条件下,15 模型的假设条件模型的假设条件(3)误差项之间相互独立(即不相关)性:即在自变量取任意不同值xi和xj时,其误差项之间相互独立。其数学表达式为:16 一元线性回归一元线性回归 一般情况下,对我们所研究的某个经济问一般情况下,对我们所研究的某个经济问题所获得的题所获得的n n组样本观测
10、值组样本观测值 若若17 一元线性回归一元线性回归 18 一元线性回归一元线性回归最小二乘法(最小平方法)最小二乘法(最小平方法)19 举例(举例(194194页)页)举例:随机抽查了某企业中的举例:随机抽查了某企业中的举例:随机抽查了某企业中的举例:随机抽查了某企业中的10101010家工厂。得到家工厂。得到家工厂。得到家工厂。得到它们的产量与生产费用如下:它们的产量与生产费用如下:它们的产量与生产费用如下:它们的产量与生产费用如下:试求生产费用对产量的回归直线方程试求生产费用对产量的回归直线方程试求生产费用对产量的回归直线方程试求生产费用对产量的回归直线方程20 举例(举例(194194页
11、)页)21 举例(举例(194194页)页)22 相关系数及检验相关系数及检验23 证明证明证明:24 证明证明证明:25 相关系数及检验相关系数及检验 26 相关系数及检验相关系数及检验 r即为相关系数即为相关系数 一般的一般的一般的一般的 高度相关高度相关高度相关高度相关 显著相关显著相关显著相关显著相关 低度相关低度相关低度相关低度相关 无相关无相关无相关无相关 完全相关完全相关完全相关完全相关27 相关系数及检验相关系数及检验举例:28 相关系数及检验相关系数及检验显著性检验(显著性检验(significance testsignificance test)当我们得到一个实际的经验回归
12、方程当我们得到一个实际的经验回归方程 还不能马上就用它去作经济分析和还不能马上就用它去作经济分析和经济预测。还需运用统计方法对回归方经济预测。还需运用统计方法对回归方程进行检验。程进行检验。29 相关系数及检验相关系数及检验(1 1)相关分析)相关分析 相关系数检验表,给出了不同相关系数检验表,给出了不同n n在在不同显著性水平下,相关系数达到显著不同显著性水平下,相关系数达到显著的最小值。的最小值。30 相关系数及检验相关系数及检验(2)F检验31 相关系数及检验相关系数及检验例:32 相关系数及检验相关系数及检验 T检验:33 相关系数及检验相关系数及检验 T检验:34 相关系数及检验相关系数及检验采用SPSS软件计算35 相关系数及检验相关系数及检验采用SPSS软件计算36 相关系数及检验相关系数及检验采用SPSS软件计算37 相关系数及检验相关系数及检验采用SPSS软件计算38