资源描述
高中数学选修2-3
第三章 统计案例 章末检测题
(满分150分,时间120分钟)
一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.分析人的身高与体重的关系,可以用( )
A.残差分析 B.回归分析
C.等高条形图 D.独立性检验
【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决.
【答案】B
2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K2≈0.99,根据这一数据分析,下列说法正确的是( )
A.有99%的人认为栏目优秀
B.有99%的人认为栏目是否优秀与改革有关系
C.有99%的把握认为电视栏目是否优秀与改革有关系
D.没有理由认为电视栏目是否优秀与改革有关系
【解析】由于K2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.
【答案】D
3.已知一个线性回归方程为=1.5x+45,其中x的取值依次为1,7,5,13,19,则=( )
A.58.5 B.46.5
C.60 D.75
【解析】==9,因为回归直线方程过点(,),所以=1.5×+45=1.5×9+45=58.5
【答案】A
4.设有一个回归方程为=3-5x,当变量x增加一个单位时( )
A.y平均增加3个单位 B.y平均减少5个单位
C.y平均增加5个单位 D.y平均减少3个单位
【解析】-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.
【答案】B
5.若由一个2×2列联表中的数据计算得K2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )
A.0.025 B.0.01
C.0.005 D.0.001
【解析】∵P(K2>5.024)=0.025.
又K2=6.630>5.024,∴犯错误的最大概率为0.025.
【答案】A
6.如图5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变小
C.相关指数R2变大
D.解释变量x与预报变量y的相关性变强
【解析】由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.
【答案】B
7.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
以下数据中,对于同一样本能说明X与Y有关的可能性最大的一组为( )
A.A=5,b=4,c=3,d=2
B.A=5,b=3,c=4,d=2
C.A=2,b=3,c=4,d=5
D.A=2,b=3,c=5,d=4
【解析】可计算|ad-bc|的值,值越大说明X与Y有关的可能性越大.
【答案】D
8.变量x、y具有线性相关关系,当x取值为16,14,12,8时,通过观测得到y的值分别为11,9,8,5.若在实际问题中,y最大取值是10,则x的最大取值不能超过( )
A.14 B.15 C.16 D.17
【解析】根据题意y与x呈正相关关系,由最小二乘法或计算器求得回归系数≈-0.857,≈0.729,所以线性回归方程为=0.729x-0.857.当=10时,得x≈15.
【答案】B
9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:
学 位
性别
硕士
博士
合计
男
162
27
189
女
143
8
151
合计
305
35
340
根据以上数据,则( )
A.性别与获取学位类别有关 B.性别与获取学位类别无关
C.性别决定获取学位的类别 D.以上都是错误的
【解析】由列联表可得:博士:男性占≈77%,女性占≈23%,相差很大,所以性别与获取学位的类别有关,故选A.
【答案】A
10.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的R2如下,其中拟合效果最好的模型是( )
A.模型1的R2为0.30 B.模型2的R2为0.50
C.模型3的R2为0.75 D.模型4的R2为0.98
【解析】R2越大,拟合效果越好.
【答案】D
11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为( )
A.y=x-1 B.y=x+1 C.y=88+x D.y=176
【解析】将表中的五组数据分别代入选项验证,可知y=88+x最适合.
【答案】C
12.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么的值为( )
A.241.06 B.2 410.6 C.253.08 D.2 530.8
【解析】R2=1-,
得0.95=1-,
得==2 410.6.
【答案】B
二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)
13.在两个变量的回归分析中,R2=________,R2的值越________________________________________________________________________,
说明残差平方和越________,也就是说模型的拟合效果越________.
【答案】1- 大 小 好
14.已知样本数为11,计算得i=510,i=214,回归方程为=0.3x+,则≈________,≈________.(精确到0.01)
【解析】由题意,=i=≈46.36,=i=,因为=0.3+,所以=0.3×+,可求得≈5.55.
【答案】46.36 5.55
15.某单位为了了解用电量y(度)与气温x(°C)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程=x+,其中=-2.现预测当气温为-4°C时,用电量的度数约为________.
用电量y(度)
24
34
38
64
气温x(°C)
18
13
10
-1
【解析】由题意可知
=(18+13+10-1)=10,
=(24+34+38+64)=40,
=-2.
又回归方程=-2x+过点(10,40),故=60,
所以当x=-4时,=-2×(-4)+60=68.
【答案】68
16.若两个分类变量X与Y的列联表为:
y1
y2
总 计
x1
10
15
25
x2
40
16
56
总 计
50
31
81
则“X与Y之间有关系”这个结论出错的概率为________.
【解析】由列联表数据,可求得随机变量K2的观测值
k=≈7.227>6.635.因为P(K2≥6.635)≈0.01.所以“x与y之间有关系”出错的概率仅为0.01.
【答案】0.01
三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.
【解析】根据题中数据得如下列联表:
及格
不及格
总计
男生
290
160
450
女生
100
350
450
总计
390
510
900
由列联表中的数据得K2的观测值为
k=≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”
18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:
机床运转速度
(转/秒)
每小时生产
二级品数量(个)
8
5
12
8
14
9
16
11
(1)作出散点图;
(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;
(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?
【解析】(1)散点图如下图所示:
(2)易求得=12.5,=8.25,
∴=≈0.728 6,
=-=-0.857 5,
即所求回归直线的方程为:
=0.728 6x-0.857 5.
(3)根据公式,要使≤10,
只要0.728 6x-0.857 5≤10,
解得x≤14.901 9,
即机床的运转速度不能超过14.901 9转/秒.
19.(本小题满分12分)有两个分类变量X与Y,其一组观测值如下面的2×2列联表所示:
y1
y2
x1
a
20-a
x2
15-a
30+a
其中,a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.10的前提下认为“X与Y之间有关系”?
【解析】要使在犯错误的概率不超过0.10的前提下认为“X与Y之间有关系”,需要随机变量K2的观测值大于2.706.
∵a+(20-a)=20,
(15-a)+(30+a)=45,
a+(15-a)=15,(20-a)+(30+a)=50,
a+(20-a)+(15-a)+(30+a)=65,则
K2=
=>2.706,
解之可得,a>7.19或a<2.04,
而由原题知a>5且15-a>5,a∈Z,即a=6,7,8,9.
故当a=8或9时,可在犯错误的概率不超过0.10的前提下认为X和Y之间有关系.
20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(2)请求出R2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
【解析】(1)iyi=66.5,=32+42+52+62=86,
=4.5,=3.5
===0.7
=-=3.5-0.7×4.5=0.35
所求的线性回归方程为=0.7x+0.35
(2)计算得残差及偏差的数据如下表:
yi-i
0.05
-0.15
0.15
-0.05
yi-
-1
-0.5
0.5
1
从而得(yi-i)2=0.05,(yi-)2=2.5
所以R2=1-=1-=0.98.
所以残差变量对预报变量的贡献率约为2%.
21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.
(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?
(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人?
【解析】设男生人数为x,依题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
x
女生
总计
x
x
(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则K2>3.841,
由K2==x>3.841,
解得x>10.24,
∵,为整数,
∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;
(2)若没有充分的证据显示是否喜欢韩剧和性别有关,
则K2≤2.706,
由K2==x≤2.706,
解得x≤7.216,
∵,为整数,
∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.
22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:
温度x(°C)
21
23
25
27
29
32
35
产卵数y(个)
7
11
21
24
66
115
325
试根据上表中的数据估计温度在50°C时的产卵数量.
【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t=x2,得到下表:
t
441
529
625
729
841
1 024
1 225
产卵数y(个)
7
11
21
24
66
115
325
再做出y和t的散点图(如图2),发现这些点分布在一条直线的附近,所以y与t线性相关,由公式可计算求得:=≈0.37,=-=-204.90,于是=0.37t-204.90,故y与x之间的回归方程是=0.37x2-204.90,当x=50时,代入可得=720.1,故由此可以估计温度在50°C时的产卵数量大约为720个.
展开阅读全文