收藏 分销(赏)

第十二章-相关与回归分析.doc

上传人:精**** 文档编号:2618015 上传时间:2024-06-03 格式:DOC 页数:11 大小:209.04KB
下载 相关 举报
第十二章-相关与回归分析.doc_第1页
第1页 / 共11页
第十二章-相关与回归分析.doc_第2页
第2页 / 共11页
第十二章-相关与回归分析.doc_第3页
第3页 / 共11页
第十二章-相关与回归分析.doc_第4页
第4页 / 共11页
第十二章-相关与回归分析.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、第十二章 相关与回归分析第一节 变量之间的相关关系相关程度与方向因果关系与对称关系第二节 定类变量的相关双变量交互分类(列联表)削减误差比例(PRE)系数与系数第三节 定序变量的相关分析同序对、异序对和同分对Gamma系数肯德尔等级相关系数(a系数、b与c系数)萨默斯系数(d系数)斯皮尔曼等级相关(相关)肯德尔和谐系数第四节 定距变量的相关分析相关表和相关图积差系数的导出和计算积差系数的性质第五节 回归分析线性回归积差系数的PRE性质相关指数R第六节 曲线相关与回归可线性化的非线性函数实例分析(二次曲线指数曲线)一、填空1对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般

2、是( )变量。2变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是( )。3依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值是服从( );(2)分布中围绕每个可能的值的( )是相同的.4在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( )的变量,因变量是随( )的变化而发生相应变化的变量。5根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称

3、为( ),并据以进行估计和预测.这种分析方法,通常又称为( )。6积差系数r是( )与X和Y的标准差的乘积之比.二、单项选择1当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在( )关系。A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关2评价直线相关关系的密切程度,当r在0。50.8之间时,表示( )。A 无相关 B 低度相关 C 中等相关 D 高度相关3相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( )。A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在

4、相关分析中,相关的两变量都是随机的。4关于相关系数,下面不正确的描述是( )。A当01时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系. 5欲以图形显示两变量X和Y的关系,最好创建( )。A 直方图 B 圆形图 C 柱形图 D 散点图6两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( ).A 0。50 B 0.80 C 0.64 D 0。907在完成了构造与评价一个回归模型后,我们可以( )。A 估计未来所需样本的容量B 计算相关系数和判定系数C 以给定的因变量的值估计自变量的值D 以给

5、定的自变量的值估计因变量的值8两变量的线性相关系数为0,表明两变量之间( ).A 完全相关 B 无关系 C 不完全相关 D 不存在线性相关9身高和体重之间的关系是( )。A 函数关系 B 无关系 C 共变关系 D 严格的依存关系10在相关分析中,对两个变量的要求是( )。A 都是随机变量 B 都不是随机变量C 其中一个是随机变量,一个是常数 D 都是常数11在回归分析中,两个变量( )。A 都是随机变量 B 都不是随机变量C 自变量是随机变量 D 因变量是随机变量12一元线性回归模型和多元线性回归模型的区别在于只有一个( )。A 因变量 B 自变量 C 相关系数 D 判定系数13以下指标恒为正

6、的是( )。A 相关系数r B 截距a C 斜率b D 复相关系数14下列关系中,属于正相关关系得是( )。A 身高与体重 B 产品与单位成本C 正常商品的价格和需求量 D 商品的零售额和流通费率三、多项选择1关于积差系数,下面正确的说法是( )。A 积差系数是线性相关系数B 积差系数具有PRE性质C 在积差系数的计算公式中,变量X和Y是对等关系D 在积差系数的计算公式中,变量X和Y都是随机的2关于皮尔逊相关系数,下面正确的说法是( )。 A 皮尔逊相关系数是线性相关系数 B 积差系数能够解释两变量间的因果关系 C r公式中的两个变量都是随机的 D r的取值在1和0之间E 皮尔逊相关系数具有P

7、RE性质,但这要通过r2加以反映3简单线性回归分析的特点是( )。A 两个变量之间不是对等关系B 回归系数有正负号C 两个变量都是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程4反映某一线性回归方程y=a+bx好坏的指标有( ).A 相关系数 B 判定系数C b的大小 D 估计标准误 E a的大小5模拟回归方程进行分析适用于( )。A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间存在线性相关D 变量之间存在曲线相关E 时间序列变量和时间之间6判定系数r2=80和含义如下( )。A 自变量和因变量之间的相关关系的密切程度B 因变量y的总变

8、化中有80可以由回归直线来解释和说明C 总偏差中有80可以由回归偏差来解释D 相关系数一定为0.64 E 判定系数和相关系数无关7回归分析和相关分析的关系是( )。A 回归分析可用于估计和预测B 相关分析是研究变量之间的相互依存关系的密切程度C 回归分析中自变量和因变量可以互相推导并进行预测D 相关分析需区分自变量和因变量E 相关分析是回归分析的基础8以下指标恒为正的是( )。A 相关系数 B 判定系数 C 复相关系数 D 偏相关系数 E 回归方程的斜率9一元线性回归分析中的回归系数b可以表示为( )。A 两个变量之间相关关系的密切程度B 两个变量之间相关关系的方向C 当自变量增减一个单位时,

9、因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量E 回归模型的拟合优度10关于回归系数b,下面正确的说法是( ). A b也可以反映X和Y之间的关系强度。; B 回归系数不解释两变量间的因果关系; C b公式中的两个变量都是随机的; D b的取值在1和-1之间;E b也有正负之分。四、名词解释1消减误差比例2 确定性关系3非确定性关系4因果关系5单相关和复相关6正相关与负相关7散点图8皮尔逊相关系数r9同序对10异序对11同分对五、判断题1由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。 ( )2不管相关关系表现形式如

10、何,当1时,变量X和变量Y都是完全相关。( )3不管相关关系表现形式如何,当0时,变量X和变量Y都是完全不相关。( )4通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。 ( ) 5如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。 ( )6从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 ( )六、计算题1对某市市民按老中青进行喜欢民族音乐情况

11、的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:转化为相对频数的联合分布列联表转化为相对频数的条件分布列联表;指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。 对于民族音乐的态度(Y)年岁(X)老 中 青 喜 欢 不喜欢38 38 3015 33 462已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量).身高(cm)171167177154169体重(kg)5356644955身高(cm)175163152172162体重(kg)665247

12、5850某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数c。 文化程度婚姻美满大学中学小学美 满9165一 般83018不美满347以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010某原始资料

13、为:X65739188765396678285Y571313。574。5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。 根据下述假设资料求回归方程。X1234567Y23。023.424.125.226.126.927。38某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:收入(X)20303340151326382543支出(Y)7981154810910要求:1)写出最小平方法计算的回归直线方程; 2)在95。46把握下,当X45时,写出Y的预测区间。9根据下述假设资料,试用积差法求相关系数。输出X(亿元)1

14、2106168910输出Y(亿元)12861110811 10下面是对50名被调查者的英语成绩和法语成绩的抽样调查:求Gamma系数。 英语 法语 优 中 差优中差 10 5 3 4 10 6 2 6 411青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数.(10分) 选手名 A B C D E F G H I J 演唱水平(X)综合素质(Y) 1 2 3 4 5 6 7 8 9 10 2 1 5 3 7 4 9 10 6 8 七、问答题1简述积差系数

15、的特性。2简述回归分析和相关分析之间的密切联系。参考答案一、填空1随机性 2削减误差比例 3 4变化根据 自变量 5 回归方程 回归分析 6 协方差 二、单项选择1A 2C 3D 4B 5D 6C 7D 8D 9C 10A 11D 12B 13D 14 A 三、多项选择1ABCD 2ACE 3ABE 4ABD 5ACDE 6ABC 7ABE 8BC 9BC 10AE四、名词解释1消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差,减去知道Y与X有关系时预测Y的误差,再将其化为比例来度量。将削减误差比例记为PRE。2. 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。确定

16、性关系往往表现成函数形式。3非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。4因果关系变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。5单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。6正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,

17、另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。7散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。8皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。9同序对在观察X序列时,如果看到,在Y中看到的是,则称这一配对是同序对.10异序对在观察X序列时,如果看到,在Y中看到的是,则称这一配对是异序对.11同分对如果在X序列中,我们观察到(此时Y序列中无),则这个配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们观察到(此时X序列中无),则这个配对仅是Y方向而非X方向的同分

18、对;我们观察到,也观察到,则称这个配对为X与Y同分对。五、判断题1( ) 2( ) 3( ) 4( ) 5( ) 6( )六、计算题1相对频数的联合分布列联表 对于民族音乐的态度(Y)年岁(X)老 中 青 喜 欢 不喜欢019 0.19 0.150。075 0。165 0。23转化为相对频数的条件分布列联表对于民族音乐的态度(Y)年岁(X)老 中 青 喜 欢 不喜欢053 0。54 0。390.47 0.46 0.61 民族音乐的态度与被调查者的年岁有关系2 编号 身高(cm)x体重(kg)yxy1171532924128099063216756278893136935231776431329

19、409611328415449237162401754651695528561302592956175663062543561155071635226569270484768152472310422097144917258295843364997610162502624425008100合计16625502768623060091830斯皮尔曼相关系数【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54。48+0.66X】 =9(30+18+4+7)+16(18+7)+8(4+7)+307=1229=5(30+8+3+4)+18(3+4)+16(8+3)+303=61

20、70.18 7根据下述假设资料求回归方程。9 1011七、问答题1简述积差系数的特性。答:(1)皮尔逊相关系数是线性相关系数。下一节在学习回归分析后我们将了解,积差相关系数的平方()才是对于最小平方直线的拟合性量度。当X和Y之间无相关时,散点图上是随机分布的点,r必等于0.但反过来r0,并不能肯定X和Y无相关,因为这时它们之间可能存在着非线性相关关系。 (2) r的取值在1和1之间。绝对值越大,相关程度越高;绝对值越小,相关程度越小。但必须指出,对于判断相关关系的密切程度,是r2而不是r有着直观的解释意义。例如,当r2075时,表示当知道X和Y有线性相关关系后,可以改善预测程度75%或可以用X

21、削减Y的75的误差。所以,对于以积差系数的大小表示关联程度,一般认为:相关系数r值在03以下为无相关,03 05表示低度相关,05 08表示中等相关,08以上表示高度相关。当然相关程度理解还与不同的研究目的和得到它的环境有关。(3)皮尔逊相关系数具有PRE性质,但这也要通过r2加以反映。对此,下一节我们学习回归分析时再行推导。(4) 积差系数不解释两变量间的因果关系。在r公式中,变量X和Y的关系是对等的。所以对两个定距变量来说,X和Y的相关也就是Y和X的相关,不分彼此.但下面回归分析中,则要根据研究目的分别确定其中的自变量和因变量,因而回归系数b是非对称的. (5) r公式中的两个变量都是随机

22、的,因而改变两者的位置并不影响r的数值。而在下面的回归分析中,通过回归方程,我们要以自变量X的值去预测因变量Y的值,因而自变量不是随机的,只有因变量才是随机的。2简述回归分析和相关分析之间的密切联系.答:一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值.相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些.

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服