1、统计案例之回归分析1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则其中,b是回归方程的斜率,a是在y轴上的截距4样本相关系数,用它来衡量两个
2、变量间的线性相关关系(1)当r0时,表明两个变量正相关;(2)当r0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r|0.75时,认为两个变量有很强的线性相关关系5线性回归模型(1)ybxae中,a、b称为模型的未知参数;e称为随机误差(2)相关指数 用相关指数R2来刻画回归的效果,其计算公式是:R2 ,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好例1对于自变量x和因变量y,当x取值一定时
3、,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫()A函数关系 B线性关系C相关关系 D回归关系例2.下面哪些变量是相关关系()A出租车车费与行驶的里程 B房屋面积与房屋价格C身高与体重 D铁块的大小与质量例3.对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui、vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关例4设两个变量x和y之间具有线性相关关系,它们的相关系数是,关于的回归直线的回归系
4、数为,回归截距是,那么必有 A 与的符号相同 B. 与的符号相C. 与的符号相反 D. 与的符号相反例5下列说法中正确的是 (填序号) 回归分析就是研究两个相关事件的独立性;回归模型都是确定性的函数回归模型都是线性的;回归分析的第一步是画散点图或求相关系数;回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.例6、为研究变量和的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程和,两人计算知相同,也相同,下列正确的是( )(A) 与重合 (B) 与一定平行 (C) 与相交于点 (D) 无法判断和是否相交例7从某大学随机选取8名女大学生,其身高(cm)和体重
5、(kg)的回归方程为 ,则身高172cm的女大学生,由回归方程可以预报其体重 ( )A.为6 0.316 B. 约为6 0.316 C.大于6 0.316 D.小于6 0.316例8工人月工资y(元)关于劳动生产率x(千元)的回归方程为y65080x,下列说法中正确的个数是()劳动生产率为1000元时,工资为730元;劳动生产率提高1000元,则工资提高80元;劳动生产率提高1000元,则工资提高730元;当月工资为810元时,劳动生产率约为2000元A1 B2 C3 D4例9.已知x、y的取值如下表所示:x234y645如果y与x呈线性相关,且线性回归方程为bx,则b()A. B C. D1
6、例10 两个相关变量满足如下关系:x1015202530y10031005101010111014则两变量的回归直线方程为()A.0.56x997.4 B.0.63x231.2C.0.56x501.4 D.60.4x400.7例11. 某校医务室抽查了10名学生在高一和高二时的体重(单位:kg)如下表:高一74717268767367706574高二76757170767965776272(1)利用相关系数r判断与是否具有相关关系?(2)若与具有相关关系,试估计高一体重为78kg的学生在高二时的体重例12以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格例13某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345(1)求年推销金额y与工作年限x之间的相关系数;来源:学科网ZXXK(2)求年推销金额y关于工作年限x的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额(参考数据:1.02;由检验水平0.01及n23,查表得r0.010.959)