资源描述
WORD格式可编辑
第十二章 相关与回归分析
一、填空
1.如果两变量的相关系数为0,说明这两变量之间_____________。
2.相关关系按方向不同,可分为__________和__________。3.相关关系按相关变量的多少,分为______和复相关。
4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据 )的变量,因变量是随(自变量 )的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性 )变量。
6.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例 )。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值是服从( );(2)分布中围绕每个可能的值的( )是相同的。
7.已知:工资(元)倚劳动生产率(千元)的回归方程为,因此,当劳动生产率每增长1千元,工资就平均增加 80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为(回归分析 )。
9.积差系数r是(协方差 )与X和Y的标准差的乘积之比。
二、单项选择
1.欲以图形显示两变量X和Y的关系,最好创建(D )。A 直方图 B 圆形图 C 柱形图 D 散点图
2.在相关分析中,对两个变量的要求是( A )。
A 都是随机变量 B 都不是随机变量 C 其中一个是随机变量,一个是常数 D 都是常数
3. 相关关系的种类按其涉及变量多少可分为( )。
A. 正相关和负相关 B. 单相关和复相关 C. 线性相关和非线性相关 D. 不相关、不完全相关、完全相关
4.关于相关系数,下面不正确的描述是( B )。
A当01时,表示两变量不完全相关; B当r=0时,表示两变量间无相关;
C两变量之间的相关关系是单相关; D如果自变量增长引起因变量的相应增长,就形成正相关关系。
5. 当变量X按一定数量变化时,变量Y也随之近似地以固定的数量发生变化,这说明X与Y之间存在( )。
A. 正相关关系 B. 负相关关系 C. 直线相关关系 D. 曲线相关关系
6.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在( A )关系。
A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关
7.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示( C )。
A 无相关 B 低度相关 C 中等相关 D 高度相关
8.两变量的相关系数为0.8,说明( )
A.两变量不相关 B.两变量负相关C.两变量不完全相关 D.两变量完全正相关
9.两变量的线性相关系数为0,表明两变量之间( D )。
A 完全相关 B 无关系 C 不完全相关 D 不存在线性相关
10.兄弟两人的身高之间的关系是( )A.函数关系 B.因果关系 C.互为因果关系 D.共变关系
11.身高和体重之间的关系是(C )。A 函数关系 B 无关系 C 共变关系 D 严格的依存关系
12.下列关系中,属于正相关关系得是(A )。
A 身高与体重 B 产品与单位成本C 正常商品的价格和需求量 D 商品的零售额和流通费率
13如果变量x和变量y之间的皮尔逊相关系数为-1,说明这两个变量之间是( )
A.低度相关 B.完全相关 C.高度相关 D.完全不相关
28.定类变量的相关分析可以使用( )A. λ系数 B. ρ系数 C. r系数 D. τα系数
14.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。
A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;
C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。
15. 一元一次回归方程Y=a+bx中的a表示( )。 A. 斜率 B. 最小平均法 C. 回归直线 D. 截距
16.当所有的观察值都落在直线上时,则与之间的相关系数为( B )。
A、r=0 B、r=1 C、-1<r<1 D、0<r<1
17.回归直线方程XC=c+dY,其中Y为自变量,则( )
A.可以根据Y值推断X B.可以根据X值推断Y C.可以互相推断 D.不能进行推断
18.对于有线性相关关系的两变量建立的直线回归方城Y=a+bx中,回归系数b ( B )。
A.肯定是正数 B.显著不为0 C.可能为0 D.肯定为负数
19.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )
A.增加70元 B.减少70元 C.增加80元 D.减少80元
20产量X(千件)与单位成本Y(元)之间的回归方程为Y=77-3X,这表示产量每提高1000件,单位成本平均( )
A.增加3元 B.减少3000元 C.增加3000元 D.减少3元
21.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。A 0.50 B 0.80 C 0.64 D 0.90
22.在完成了构造与评价一个回归模型后,我们可以( D )。
A 估计未来所需样本的容量 B 计算相关系数和判定系数
C 以给定的因变量的值估计自变量的值 D 以给定的自变量的值估计因变量的值
23.对相关系数的显著性检验,通常采用的是(① )① T检验 ② F检验 ③ Z 检验
24.回归估计标准误差的计量单位与( )
A.自变量相同 B.因变量相同 C.相关系数相同 D.自变量、因变量及相关系数均不同
25.在回归分析中,两个变量( D )。
A 都是随机变量 B 都不是随机变量 C 自变量是随机变量 D 因变量是随机变量
26.已知变量X和Y之间的关系如图所示,则变量X和Y的相关系数为(D )。
A、0.29 B、-0.86 C、1.04 D、0.91
27.一元线性回归模型和多元线性回归模型的区别在于只有一个(B )。
A 因变量 B 自变量 C 相关系数 D 判定系数
28.以下指标恒为正的是( D )。A 相关系数r B 截距a C 斜率b D 复相关系数
29.对两变量进行回归分析时,( )
A.前提是两变量之间存在较高的相关关系 B.其中任一变量都可以成为自变量或因(依)变量
C.两变量都是随机变量 D.一变量是随机变量,另一变量是非随机变量
E.一变量是自变量,另一变量是因(依)变量
三、多项选择
1.判定现象之间有无相关系数的方法是( ABC )。
A、对客观现象作定性分析 B、编制相关表 C、绘制相关图D、计算相关系数 E、计算估计标准误
2.回归分析和相关分析的关系是(ABE )。
A 回归分析可用于估计和预测 B 相关分析是研究变量之间的相互依存关系的密切程度
C 回归分析中自变量和因变量可以互相推导并进行预测 D 相关分析需区分自变量和因变量
E 相关分析是回归分析的基础
3.关于积差系数,下面正确的说法是(ABCD )。
A 积差系数是线性相关系数 B 在积差系数的计算公式中,变量X和Y是对等关系
C 积差系数具有PRE性质 D 在积差系数的计算公式中,变量X和Y都是随机的
4.关于皮尔逊相关系数,下面正确的说法是(ACE )。
A 皮尔逊相关系数是线性相关系数 B 积差系数能够解释两变量间的因果关系
C r公式中的两个变量都是随机的 D r的取值在1和0之间
E 皮尔逊相关系数具有PRE性质,但这要通过r2加以反映
5.简单线性回归分析的特点是( ABE )。
A 两个变量之间不是对等关系 B 回归系数有正负号 C 两个变量都是随机的
D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程
6.反映某一线性回归方程y=a+bx好坏的指标有(ABD )。
A 相关系数 B 判定系数 C b的大小 D 估计标准误 E a的大小
7.模拟回归方程进行分析适用于(ACDE )。
A 变量之间存在一定程度的相关系数 B 不存在任何关系的几个变量之间
C 变量之间存在线性相关 D 变量之间存在曲线相关 E 时间序列变量和时间之间
8.判定系数r2=80%和含义如下(ABC )。
A 自变量和因变量之间的相关关系的密切程度B 因变量y的总变化中有80%可以由回归直线来解释和说明
C 总偏差中有80%可以由回归偏差来解释D 相关系数一定为0.64 E 判定系数和相关系数无关
9.以下指标恒为正的是(BC )。
A 相关系数 B 判定系数 C 复相关系数 D 偏相关系数 E 回归方程的斜率
10.一元线性回归分析中的回归系数b可以表示为(BC )。
A 两个变量之间相关关系的密切程度 B 两个变量之间相关关系的方向
C 当自变量增减一个单位时,因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量
E 回归模型的拟合优度
11.关于回归系数b,下面正确的说法是(AE )。
A b也可以反映X和Y之间的关系强度。;B 回归系数不解释两变量间的因果关系;
C b公式中的两个变量都是随机的; D b的取值在1和-1之间;E b也有正负之分。
12、如果两个变量之间有一定的相关性,则以下结论中正确的是 ( ①②③ )
①、回归系数的绝对值大于零 ②、判定系数大于零 ③、相关系数的绝对值大于0.3
13、当所有的观察值都落在回归直线上时,下述备选答案成立的有(②③ )
①r=0 ② ∣r∣= 1 ③=0
五、判断题
1.相关关系和函数关系都属于完全确定性的依存关系。( )
2.不管相关关系表现形式如何,当=1时,变量X和变量Y都是完全相关。(√ )
3.不管相关关系表现形式如何,当=0时,变量X和变量Y都是完全不相关。(× )
4.若x与y之间的相关系数r=-0.9,表示二者“不相关”。( )
5.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。 (× )
6.如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。 ( √ )
7.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。 ( √ )
8.不论是相关分析还是回归分析,都必须确定自变量和因变量。( )
9.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 (× )
10、 在回归分析中,通常假定 (0, )。( √ )
11.只有当两个变量之间存在较高程度的相关关系时,回归分析才有意义。( )
六、计算题
1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。
对于民族音乐的
态度(Y)
年岁(X)
Σ
老 中 青
喜 欢
不喜欢
38 38 30
15 33 46
Σ
解:①相对频数的联合分布列联表
对于民族音乐的
态度(Y)
年岁(X)
Σ
老 中 青
喜 欢
不喜欢
0.19 0.19 0.15
0.075 0.165 0.23
Σ
②转化为相对频数的条件分布列联表
对于民族音乐的
态度(Y)
年岁(X)
Σ
老 中 青
喜 欢
不喜欢
0.53 0.54 0.39
0.47 0.46 0.61
Σ
③民族音乐的态度与被调查者的年岁有关系
2.已知直线回归方程中,b=17.5;又知n=30,,,则可知a= 。答案:240
解:根据正规方程组中的一个方程:
两边同除以n 并移项后得
将已知数据代入方程:
3.已知回归方程,n=40 ,,,,试计算估计标准误差。
解:估计标准误差的计算公式为:
将已知数据代入公式有:
4.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。
环境名次
3
9
7
5
12
8
10
2
11
4
1
6
体质名次
5
9
6
7
12
8
11
1
10
3
2
4
解:
5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数τc。
文化程度
婚姻美满
大学
中学
小学
美 满
9
16
5
一 般
8
30
18
不美满
3
4
7
解:=9×(30+18+4+7)+16×(18+7)+8×(4+7)+30×7=1229
=5×(30+8+3+4)+18×(3+4)+16×(8+3)+30×3=617
0.18
6.以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
参赛人
A
B
C
D
E
F
G
H
I
J
评判员1
评判员2
1
1
2
2
4
3
3
4
5
5
8
6
6
7
7
8
9
9
10
10
解:
7.根据下述假设资料,试用积差法求相关系数。
输出X(亿元)
12
10
6
16
8
9
10
输出Y(亿元)
12
8
6
11
10
8
11
解:
8.下面是对50名被调查者的英语成绩和法语成绩的抽样调查:求Gamma系数。
英语
法语
优 中 差
优
中
差
10 5 3
4 10 6
2 6 4
解:
9.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数。(10分)
选手名
A B C D E F G H I J
演唱水平(X)
综合素质(Y)
1 2 3 4 5 6 7 8 9 10
2 1 5 3 7 4 9 10 6 8
解:
10.某原始资料为:
X
65
73
91
88
76
53
96
67
82
85
Y
5
7
13
13.5
7
4.5
15
6.7
10
11
要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。
解:
11.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。
身高(cm)
171
167
177
154
169
体重(kg)
53
56
64
49
55
身高(cm)
175
163
152
172
162
体重(kg)
66
52
47
58
50
解:
编号
身高(cm)x
体重
(kg)y
xy
1
171
53
29241
2809
9063
2
167
56
27889
3136
9352
3
177
64
31329
4096
11328
4
154
49
23716
2401
7546
5
169
55
28561
3025
9295
6
175
66
30625
4356
11550
7
163
52
26569
2704
8476
8
152
47
23104
2209
7144
9
172
58
29584
3364
9976
10
162
50
26244
2500
8100
合计
1662
550
276862
30600
91830
斯皮尔曼相关系数
【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】
12.根据下述假设资料求回归方程。
X
1
2
3
4
5
6
7
Y
23.0
23.4
24.1
25.2
26.1
26.9
27.3
解:
13.某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:
收入(X)
20
30
33
40
15
13
26
38
25
43
支出(Y)
7
9
8
11
5
4
8
10
9
10
要求:1)写出最小平方法计算的回归直线方程;
2)在95.46%把握下,当X=45时,写出Y的预测区间。
解:
14、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:
产品产量(台)xi
40
50
50
70
80
生产费用(万元)yi
130
140
145
150
156
要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R2。
附:
解
① 计算估计的回归方程:
==0.567 2分
144.2 – 0.567×58=111.314 2分
估计的回归方程为:=111.314+0.567 2分
② 计算判定系数:
4分
专业知识整理分享
展开阅读全文