收藏 分销(赏)

文科统计与概率1-回归分析.doc

上传人:精**** 文档编号:2627825 上传时间:2024-06-03 格式:DOC 页数:8 大小:599.54KB
下载 相关 举报
文科统计与概率1-回归分析.doc_第1页
第1页 / 共8页
文科统计与概率1-回归分析.doc_第2页
第2页 / 共8页
文科统计与概率1-回归分析.doc_第3页
第3页 / 共8页
文科统计与概率1-回归分析.doc_第4页
第4页 / 共8页
文科统计与概率1-回归分析.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、文科统计与概率1回归分析一、回归分析1、函数关系 函数关系是一种确定性的关系,如一次函数,二次函数2、相关关系 变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系带有随机性3、 散点图 把两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图,通过散点图可以初步判断两个变量之间是否具有相关关系。(1) 正相关 散点图中,点分布在左下角到右上角的区域(2) 负相关 散点图中,点分布在坐上角到右下角的区域4、回归直线: 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。5、求回归直线方程的一般步骤:

2、作出散点图由样本点是否呈条状分布来判断两个量是否具有线性相关关系(粗略)或者计算相关系数( 越接近于1,两个变量的线性相关性越强),若存在线性相关关系求回归系数 写出回归直线方程 ,并利用回归直线方程进行预测说明.6、线性回归方程: 其中, 注意:线性回归直线经过定点,点称为样本点的中心。最小二乘法是使得样本数据的点到回归直线的距离的平方和最小的方法,以上公式是和的值的最好估计是斜率的估计值,若0,每增加一个单位,的值就增加;若0时,变量正相关;此时相当于回归直线方程中的斜率为正 0时,变量负相关;此时相当于回归直线方程中的斜率为负 越接近于1,两个变量的线性相关性越强; 接近于0时,两个变量

3、之间几乎不存在线性相关关系。 通常当时,认为两个变量有很强的线性相关关系。如果两个变量不具有线性相关关系,即使求出回归方程也毫无意义,用其进行预测也是不可信的。8、 回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。9、 回归方程拟合效果分析评价回归效果的三个统计量:总偏差平方和(总的效应);残差平方和(随机误差的效应);回归平方和(解释变量的效应).(1) 计算每组观测数据残差,列出样本编号与对应残差(2) 选样本编号为横坐标,残差为纵坐标,作出的图形称为残差图(3) 分析残差图。残差点比较均匀落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域宽度越窄,说明模型拟合精度

4、越高,回归方程的预报精度越高。(每一个残差的绝对值越小,带状区域宽度越窄,拟合效果越好)(4) 可根据残差图,查找异常样本数据(5) 计算残差的平方和,残差平方和越小,拟合效果越好。(6) 计算相关指数,指数越大,残差平方和越小,拟合效果越好。(其中称为总偏差平方和,回归平方和=总偏差平方和 - 残差平方和)10、 非线性回归问题 非线性回归问题有时并不给出经验公式,此时可画出已知数据的散点图,把它与以前学过的各种函数(幂函数、指数函数、对数函数等)图像做比较,挑选一种跟这些散点图拟合得最好的函数,然后采用适当的变量置换,把问题转化为线性回归分析问题,使之得到解决。 11、 两种非线性回归方程

5、拟合效果的比较(高中阶段不涉及)(1) 对于给定的样本点,明确哪个变量是解释变量x,哪个是预报变量y,画出散点图后,根据已知的函数知识,分别建立两个回归方程.(2)若为非线性回归方程,可通过适当的变量置换,转化为线性回归方程非线性回归问题的处理方法:指数函数型 函数的图像: 处理方法:两边取对数得,即.令把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出。对数曲线型 函数的图像 处理方法:设,原方程可化为再根据线性回归模型的方法求出.二次函数型处理方法:设,原方程可化为,再根据线性回归模型的方法求出.(3)按一定规则估计回归方程中的参数(如最小二乘法),求得线性回归方程后可再转

6、化为原来的非线性回归方程(4)分析拟合效果。分别计算残差,列表比较,残差的绝对值越小,拟合效果越好。(5)一般情况下,比较两个模型的残差比较困难,原因是某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反.此时需计算残差的平方和,残差平方和越小,拟合效果越好.(6)也可计算相关指数,指数越大,残差平方和越小,拟合效果越好。(其中称为总偏差平方和,回归平方和=总偏差平方和 - 残差平方和)二、历年高考试题汇编(2012年文科新课标卷)3、在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(

7、i=1,2,,n)都在直线y=x+1上,则这组样本数据的样本相关系数为 (A)1 (B)0 (C) (D)1 (2009年文科新课标卷)3对变量有观测数据(,)(),得散点图1;对变量有观测数据(,)(i=1,2,10),得散点图2。 由这两个散点图可以判断 A变量x与y正相关,u与v正相关 B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关 D变量x与y负相关,u与v负相关(2015年文科新课标2卷)3根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是A逐年比较,2008年减少二氧化硫排放量的效果最显著 B2007年我国治理二氧化

8、硫排放显现成效 C2006年以来我国二氧化硫年排放量呈减少趋势 D2006年以来我国二氧化硫年排放量与年份正相关(2015年新课标1卷)19. (本小题满分12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费和年销售量(=1,2,,8)数据作了初步处理,得到下面的散点图及一些统计量的值。 46.65636。8289.81.61469108.8表中,(I)根据散点图判断,与,哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);(II)根据(I)的判断结果及表中数据,

9、建立y关于x的回归方程;(III)已知这种产品的年利润z与x,y的关系为 ,根据(II)的结果回答下列问题:(i)当年宣传费=49时,年销售量及年利润的预报值时多少?(ii)当年宣传费为何值时,年利润的预报值最大?附:对于一组数据(,),(,),(,),其回归直线的斜率和截距的最小二乘估计分别为,三、模拟演练1。 下列两个变量具有相关关系的是( )A. 正方体的体积与边长 B. 人的身高与视力C。人的身高与体重 D.匀速直线运动中的位移与时间2。 在画两个变量的散点图时,下面哪个叙述是正确的( )A。 预报变量在x 轴上,解释变量在 y 轴上 B. 解释变量在x 轴上,预报变量在 y 轴上C.

10、 可以选择两个变量中任意一个变量在x 轴上 D. 可选择两个变量中任意一个变量在 y 轴上3. 回归直线必过( )A. B。 C. D. 4。 两个变量 y与x的回归模型中,分别选择了 4 个不同模型,它们的相关指数如下 ,其中拟合效果最好的模型是( ).A. 模型1的相关指数为 0.98 B。 模型2的相关指数为 0.80C. 模型3的相关指数为 0.50D。 模型4的相关指数为 0。255。 在回归分析中,残差图中纵坐标为( )。A. 残差 B. 样本编号 C. x D。 6。 通过来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( )。A.回归分析 B.独立性检验分析C

11、。残差分析 D. 散点图分析7. 两个变量 y与x的回归模型中,求得回归方程为,当解释变量时( ).A。 预报变量 B。 预报变量大于C. 预报变量小于 D. 预报变量在左右8. 在回归分析中,求得相关指数,则( ).A. 解释变量对总效应的贡献是 B。 解释变量对总效应的贡献是 C. 随机误差的贡献是 D. 随机误差的贡献是9、越接近于1,两个变量的线性相关关系 。10、已知回归直线方程,则时,y的估计值为 .11、越接近1,回归的效果 .12、在研究身高与体重的关系时,求得相关指数 ,可以叙述为“身高解释了的体重变化,而随机误差贡献了剩余 ”所以身高对体重的效应比随机误差的 .13、(07

12、广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗 (吨标准煤)的几组对照数据 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值)14、假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456维修费用y2。23。85.56.57。0若由资料知y对x呈线性相关关系,试求:(1)线性回归方程(2)估计使用年限为10年时,维修费用是多少?15、关于与y有如下数据:245683040605070为了对、y两个变量进行统计分析,现有以下两种线性模型:,试比较哪一个模型拟合的效果更好?16、测得10对某国父子身高(单位:英寸)如下:父亲身高(x)60626465666768707274儿子身高(y)63.665.26665。566.967.167。468.370.170(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为73英寸,估计儿子的身高。(1英寸=2。54cm)

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服