1、统计案例之回归分析 1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关. 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据: (x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则 其中,b是回归方程
2、的斜率,a是在y轴上的截距. 4.样本相关系数 , 用它来衡量两个变量间的线性相关关系. (1)当r>0时,表明两个变量正相关; (2)当r<0时,表明两个变量负相关; (3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型 (1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差. (2)相关指数 用相关指数R2来刻画回归的效果,其计算公式是:R2= ,R2的值越大,说明残差 平方和越小,也就是说模
3、型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好. 例1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫( ) A.函数关系 B.线性关系 C.相关关系 D.回归关系 例2.下面哪些变量是相关关系( ). A.出租车车费与行驶的里程 B.房屋面积与房屋价格 C.身高与体重 D.铁块的大小与质量 例3.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui、vi)(i=1,2,…,10),得散点图(
4、2).由这两个散点图可以判断 ( ). A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 例4.设两个变量x和y之间具有线性相关关系,它们的相关系数是,关于的回归直线的回归系数为,回归截距是,那么必有 A. 与的符号相同 B. 与的符号相 C. 与的符号相反 D. 与的符号相反 例5.下列说法
5、中正确的是 (填序号) ① 回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数 ③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数; ⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法. 例6、为研究变量和的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程和,两人计算知相同,也相同,下列正确的是( ) (A) 与重合 (B) 与一定平行 (C) 与相交于点 (D
6、) 无法判断和是否相交 例7.从某大学随机选取8名女大学生,其身高(cm)和体重(kg)的回归方程为 ,则身高172cm的女大学生,由回归方程可以预报其体重 ( ) A.为6 0.316 B. 约为6 0.316 C.大于6 0.316 D.小于6 0.316 例8.工人月工资y(元)关于劳动生产率x(千元)的回归方程为y=650+80x,下列说法中正确的个数是( ) ①劳动生产率为1000元时,工资为730元; ②劳动生产率提高1000元,则工资提高80元; ③劳动生产率提高1000元,则工资提高730元; ④当月工资为810元时,劳动生产率约为20
7、00元. A.1 B.2 C.3 D.4 例9.已知x、y的取值如下表所示: x 2 3 4 y 6 4 5 如果y与x呈线性相关,且线性回归方程为=bx+,则b=( ) A. B.- C. D.1 例10. 两个相关变量满足如下关系: x 10 15 20 25 30 y 1003 1005 1010 1011 1014 则两变量的回归直线方程为( ) A.=0.56x+997.4 B.=0.63x-231.2 C.=0.56x+501.4 D.=60.4x+400.7 例11. 某校医务室抽查了1
8、0名学生在高一和高二时的体重(单位:kg)如下表: 高一 74 71 72 68 76 73 67 70 65 74 高二 76 75 71 70 76 79 65 77 62 72 (1)利用相关系数r判断与是否具有相关关系? (2)若与具有相关关系,试估计高一体重为78kg的学生在高二时的体重. 例12.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据: 房屋面积(m2) 115 110 80 135 105 销售价格(万元) 24.8 21.6 18.
9、4 29.2 22 (1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)根据(2)的结果估计当房屋面积为150 m2时的销售价格. 例13.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表: 推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y与工作年限x之间的相关系数;[来源:学科网ZXXK] (2)求年推销金额y关于工作年限x的线性回归方程; (3)若第6名推销员的工作年限为11年,试估计他的年推销金额. (参考数据:≈1.02;由检验水平0.01及n-2=3,查表得r0.01=0.959)






