资源描述
《第八章成对数据的统计分析》章末复习
【知识网络】
成对数据
【考点突破】
一、变量的相关性.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散 点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.
1 .在学习该局部知识时,体会直观想象和数学运算的素养.
例1 (1)以下两个变量具有相关关系且不是函数关系的是()A.圆的半径与面积
B.匀速行驶的车辆的行驶距离与时间C.庄稼的产量与施肥量
【).人的身高与视力答案C
解析对于A,圆的半径与面积是确定的关系,是函数关系;对于B,匀速行驶的车辆的行 驶距离与时间是确定的关系,是函数关系;对于C,庄稼的产量与施肥量在一定范围内有 相关关系,不是函数关系;对于D,人的身高与视力,不具有相关关系,也不是函数关 系.应选C.
(2)在一次试验中,测得(x, y)的四组值分别为(1,2), (2, 0), (4, -4), (-1,6),那么y 与x的样本相关系数为.
答案一1 44
解析 方法一x =1.5, y =1, Zx?=22, ££=56,1=1i=l
抽样的方法较好地保持「样本结构与总体结构的一致性,提高了样本的代表性,从而可以 获得该地区这种野生动物数量更准确的估计.
2.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100天空气中的PM?5和SO?浓度(单位:H g/m:1),得下表:
PM2.5
[0, 50]
(50,150]
(150,475]
[0, 35]
32
18
4
(35, 75]
6
8
12
(75, 115]
3
7
10
(1)估计事件“该市一天空气中PM一浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2X2列联表:
PM2.5
[0, 150]
(150,475]
[o, 75]
(75,115]
(3)根据(2)中的列联表,依据小概率值a =0.010的独立性检验,分析该市一天空气中
PM2.5浓度与SO?浓度是否有关.
附.x2=二 ad —叩,a+bc + da+c b+d ,
解(D由表格可知,该市100天中,空气中的PM「浓度不超过75,且SO:,浓度不超过150 的天数为 32+6+18+8=64,所以该市一天中,空气中的PM?.5浓度不超过75,且SO?浓度不超过150的概率的估计值为
64
100
=0. 64.
(2)由所给数据,
可得2X2列联表:
PM2.5
[0, 150]
(150,475]
[0, 75]
64
16
(75, 115]
10
10
(3)零假设为Ho:该市一天空气中PM一浓度与SO?浓度无关.
根据列联表中数据,经计算得到
2n ad-be “xa+b c+da+c b+d
100X 64X10 — 16X10=80X20X74X26
比7. 484>6. 635^X0,010,根据小概率值a =0. 010的独立性检验,我们推断H0不成立,即认为该市一天空气中PM2 5 浓度与SO?浓度有关.
《第八章 成对数据的统计分析》单元检测试卷(一)
(时间:120分钟 总分值:150分)
一、单项选择题(本大题共8小题,每题5分,共40分).对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x, y之间的这种非确 定性关系叫做()
A.函数关系B.线性关系C.相关关系D.回归关系
答案C.以下两个变量之间的关系是相关关系的为()
A.正方体的体积与校长的关系B.学生的成绩和体重
C.路上酒后驾驶的人数和交通事故发生的多少D.水的体枳和重量
答案C解析A中,由正方体的棱长和体积的公式知,V=a3(a>0),是确定的函数关系,故A错 误;
B中,学生的成绩和体重,没有关系,故B错误;C中,路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相 关性,故C正确;
D中,水的体枳V和重量x的关系为V=k-x,是确定的函数关系,故D错误.
3 .以下四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是。①"°②③④*
A.①③B.①@C.②③D. ®®
答案B解析对于两个变量的散点图,假设样本点成带状分布,那么两个变量具有线性相关关系,所 以两个变量具有线性相关关系的图是①和④.应选B.
4 .有以下五组变量:
①某商品的销售价格与销售量:
②学生的学籍号与学生的数学成绩:
③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;
⑤电瓶车的重量和行驶每千米的耗电量.
其中两个变量成正相关的是()A.①③B.②®
C.②⑤D. @@答案D
解析对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对于②,学生的 学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚持每天吃早餐的人数与 患胃病的人数成负相关关系;对于④,一般情况下,气温与冷饮销售量成正相关关系:对 于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中 两个变量成正相关的序号是④⑤.
5 .每一-吨铸铁本钱y (元)与铸件废品率斓建立的经验回归方程为y=56+8x,以下说法正 确的是()A.废品率每增加设,本钱每吨增加64元
B.废品率每增加1%,本钱每吨增加8%C.废品率每增加陶,本钱每吨增加8元
D.如果废品率增加现,那么每吨本钱为56元答案C
6.对于给定的两个变量的统计数据,以下说法正确的选项是()A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系答案C
解析 给出一组样本数据,总可以作出相应的散点图,故C正确;但不一定能分析出两个 变量的关系,故A错误;更不一定符合线性相关,不一定能用一条直线近似的表示,故B 错误;两个变量的统计数据不一定具有函数关系,故D错误.
7 .某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500 名未使用过血清的人一年中的感冒记录进行比拟,提出假设H。: “这种血清不能起到预防 感冒的作用“,利用2X2列联表计算得x2^3.918,经查临界值表知P(x223.841)"0.05.对此,有以下四个结论,正确的选项是( )
A.依据小概率值a =0.05的独立.性检验,可以认为“这种血清能起到预防感冒的作用”.假设某人未使用该血清,那么他在一年中有95用的可能性得感冒
C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%
答案A解析 由题意,因为x 2g3. 918, P(x2^3. 841)^0. 05,所以依据小概率值a =0. 05的 独立性检验,可以认为“这种血清能起到预防感冒的作用”.
8 .根据如下成对样本数据:
X
3
4
5
6
7
8
y
4
2.5
-0.5
0.5
-2
-3
得到的经验回归方程为丫=1»+@,贝版 )
A.a>0, b<0B.a>0, b>0C.a<0, b>0D. a<0, b<0
答案A解析根据题意,画出散点图(图略).根据散点图,知两个变量为负相关,且经验回归直
线与y轴的交点在y轴正半轴,所以a>0, b<0.
二、多项选择题(本大题共4小题,每题5分,共20分.全部选对的得5分,局部选对 的得3分,有选错的得。分)以下有关样本相关系数r的说法正确的选项是()
A.样本相关系数r可用来衡量x与y之间的线性相关程度|r|Wl,且|r|越接近0,相关程度越小
B. |r|<l,且|r|越接近1,相关程度越大|r|2l,且|r|越接近1,相关程度越大
答案ABC解析样本相关系数是来衡量两个变量之间的线性相关程度的,样本相关系数是一个绝对 值小于等于1的量,并且它的绝对值越大就说明相关程度越大,应选ABC.
10.变量x, y之间的经验回归方程为y=-0.7x+10.3,且变量x, y之间的一组相关 数据如下表所示,那么以下说法正确的选项是()
X
6
8
10
12
y
6
m
3
2
A.变量x, y之间成负相关关系m=4
C.可以预测,当x=ll时,丫约为2.6D.由表格数据知,该经验回归直线必过点⑼4)
答案AC1) 解析 由y=-0.7x+10.3得b=-0.7<0,所以x, y成负相关关系,故A正确;当
A.该学校男生对食堂服务满意的概率的估计值为V
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.依据a =0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异
D.依据a =0.01的独立性检验,可以认为男、女生对该食堂服务的评价有差异 答案AC
当
A.该学校男生对食堂服务满意的概率的估计值为V
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.依据a =0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异
D.依据a =0.01的独立性检验,可以认为男、女生对该食堂服务的评价有差异 答案AC
=11时,丫的预测值为2.6,故C正确;—6+8+10+12 八 lt一 八 ',八八
x ==9, 故 y =—0. 7X9+10. 3=4.
故经验回归直线过(9, 4),故D正确;因为y =4,所以
因为y =4,所以
=4, m=5,故B错误.
综上,选ACD.
11 .某大学为了解学生对学校食堂服务的满意度,随机调查了 50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算 x 2-4. 762,那么可以推断出()
满意
不满意
男
30
20
女
40
10
303解析 对于选项A,该学校男生对食堂服务满意的概率的估计值为正工证=*故A正确;
对于选项B,该学校女生对食堂服务满意的概率的估计值为行先=<>2故B错误;因为x2^4. 762>3. 841=xo.o5,所以依据a =0. 05的独立性检验,可以认为男、女生对该 食堂服务的评价有差异,故C正确,D错误.
应选AC.
12 .针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调杳,其中被调杳的男女生人数相同,男生喜欢抖音的人数占男生人数的女生喜欢抖音的 O
9人数占女生人数的彳,假设有95%的把握认为是否喜欢抖音和性别有关,那么调查人数中男生可
能有()临界值表:
a
0. 050
0.010
Xa
3. 841
6. 635
附.x2=n ad —be
a+b c + d a+c b+dA. 30 人B. 54 人
B. 60 人D. 75 人答案BC
解析 设男生的人数为6n(n£N'),根据题意列出2X2列联表如下表所示:
男生
女生
合计
喜欢抖音
5n
4n
9n
不喜欢抖音
n
2n
3n
合计
6n
6n
12n
nl 2 12nX 5nX2n—4nXn ' 4n
人」6nX6nX9nX3n 9 '由于有95%的把握认为是否喜欢抖音和性别有关,
那么 3. 84K x2<6. 635,4n
BP 3. 841<—<6. 635,得 8. 642 3Wn<14.929,*'
因为n£N\那么n的可能取值有9, 10, 11, 12, 13,因此,调查人数中男生人数的可能值为54, 60, 66, 72, 78.应选 BC.
三、填空题(本大题共4小题,每题5分,共20分)13.假设一组观测值(X】,yi),(X2, 丫2),…,(xn, y)之间满足 yi=bxi+a+ei(i =
1,2,…,n),且 ei=0,那么 N为.
答案1解析 由 ei = 0,知 w=w,即 yi—w=0,
Z y-y* 2 i = l故 R2=l=1-0=1.
n2
L yL y i=i14.一个经验回归方程为y=L5x+45, xe(l,5, 7,13,19),那么y =_
答案58.5
解析
且y=L 5x4-45,
— 1+5+7+13+19 八•・• x =:=9 :.y =1.5X9+45 = 58.5.
15 .对某台机器购置后的运营年限x(x=l, 2, 3,…)与当年利润y的统计分析知具备线性相关关系,经验回归方程为y= 10.47-1. 3x,估计该台机器使用 年最合算.
答案8 解析只要预计利润不为负数,使用该机器就算合算,即y20,所以10.47 —1.3x20,解 得XW8.05,所以该台机器使用8年最合算.
16 .下面是一个2X2列联表:
X
Y
合计
y«
Y2
X)
a
21
70
X2
5
c
30
合计
b
d
100
那么b-d=, x%.(保存小数点后3位)(此题第一空2分,第二空3分)
答案 8 24.047解析由2X2列联表得:
a=49, b=54, c = 25, d=46.
Ab-d=54-46=8.
2 100X 49X25-5X21 2x 2=^24 047
70X30X54X46U四、解答题(本大题共6小题,共70分)
17. (1()分)在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比拟喜欢 哪一种进行了调查.调查结果:接受调查总人数为110,其中男性、女性各55人:受调查 者中,女性有30人比拟喜欢看电视,男性有35人比拟喜欢运动.
(1)请根据题目所提供的调查结果填写以下2X2列联表;
性别
休闲方式
合计
看电视
运动
女
男
合计
(2)依据小概率值a =0.05的独立性检验,是否可以推断“性别与休闲方式有关系”?
附:X、,+b(其中 n=a+b+c+d 为样本容量).
a
0. 10
0. 05
0.010
Xu
2. 706
3. 841
6. 635
解(1)根据题目所提供的调查结果,可得以下2X2列联表:
性另IJ
休闲方式
合计
看电视
运动
女
30
25
55
男
20
35
55
合计
50
60
110
⑵零假设H。:性别与休闲方式无关.
x2=U0X 黑*鬃25仁3. 667<3. 841=xo.o5,依据小概率值a =0. 05的独立性 oUXbUXooXoo检验,没有充分证据推断用不成立,所以不能在犯错误的概率不超过0.05的前提下认为
“性别与休闲方式有关系”.
18. (12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y (小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的经验I可归方程y = bx+a,并在坐标系中画出经验回归直线;
(3)试预测加工1()个零件需要多少时间? n
Zxiyi — n x y
• i = l・ ■
附:b=, a= y —b x .
n
十 22
工 xln X
i - 1
(2)求出y关于x的经验I可归方程y = bx+a,并在坐标系中画出经验回归直线;
(3)试预测加工1()个零件需要多少时间? n
Zxiyi — n x y
• i = l・ ■
附:b=, a= y —b x .
n
十 22
工 xln X
i - 1
解(1)散点图如图.
解(1)散点图如图.
(2)由表中数据得Zx¥ = 52. 5, i-l_ 4
x =3. 5, y =3. 5, ^x^=54,
Zxiyi-4 x y
7,
i=152.5-4X3.5X3.5 八所以 b=--54-4X3,5-=°-
4 x *所以a= y -b x =3. 5~0. 7X3. 5=1. 05. 所以y=0. 7x+L 05.
经验回归直线如图中所示.
(3)将x=10代入经验回归方程,得y = 0. 7X 10+1. 05=8. 05,所以预测加工10个零件需要8. 05小时.
19. (12分)某地区2013年至2019年农村居民家庭人均纯收入y (单位:千元)的数据如下 表:
年份
2013
2014
2015
2016
2017
2018
2019
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
1. 1
4.8
5.2
5.9
(1)求y关于t的经验回归方程;
(2)利川(D中的回归方程,分析2013年至2019年该地区农村居民家庭人均纯收入的变化 情况,并预测该地区2021年农村居民家庭人均纯收入.
附:经验回归直线的斜率和截距的最小二乘估计公式分别为b =Z tt- t y1— y
i-l八・_,a= y —b t .
Z ti-T 2 i = l解(1)由所给数据计算得
—1t =,(1+2+3+4+5 + 6+7)=4,
一1y =y(2. 9+3. 3+3. 6 + 4. 4+4. 8+5. 2+5. 9) =4. 3,
7z (ti-T)2=9+4+1+0+1+4+9=28, i = l
7 Z (ti— t ) (yi— y ) = (—3) X (—1. 4) + (—2) X (—1) + (—1) X (—0. 7) +0X0. 1 + i = l
1X0.5 + 2X0.9 + 3X1.6=14,
7__
Z tL t §、一 y-1=114
b= ;=28=0- 5,Z ti- t i-l
Zx»i = -20, i-l样本相关系数
-20-4X1.5X1r——,,,——1
yj 22-4X 1.5256-4X 12方法二 观察四个点,发现其在一条单调递减的直线上,故y与x的样本相关系数为-1.
反思感悟变量相关性的判断的两种方法(1)散点图法:直观形象.
(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,|rI = 1»且当r=l时,正相关;r= — l时,负相关.
跟踪训练1 (1)变量x和y满足关系y = -2x + l,变量y与z正相关,以下结论中正 确的是()x与y正相关,x与z负相关
A. x与y正相关,x与z正相关x与y负相关,x与z负相关
B. x与y负相关,x与z正相关答案C
解析 根据题意,变量x和y满足关系y=-2x+l,其比例系数为一2<0,所以x与y负 相关;又由变量y与z正相关,那么x与z负相关.应选C.
(2)如下图,给出了样本容量均为7的A, B两组成对样本数据的散点图,A组成对样本数据的样本相关系数为口,B组成对样本数据的样本相关系数为n,那么()
>1・ y •0 人组数 *°8组数 ”
A. ri=r2B. dC. ri>r2D.无法判定
答案C解析根据A, B两组成对样本数据的散点图知,A组成对样本数据几乎在一条直线上,且 成正相关,.••样本相关系数为n应最接近1, B组成对样本数据分散在一条直线附近,也 成正相关,,样本相关系数为m满足区口,即口>m 应选C.
二、一元线性回归模型及其应用.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际 问题做出预测和分析.
a= y —b t =4. 3—0. 5X4=2. 3,所求经验回归方程为y=0. 5t+ 2. 3.
(2)由(1)知,b=0. 5>0,故2013年至2019年该地区农村居民家庭人均纯收入逐年增加, 平均每年增加0. 5千元.
将2021年的年份代号t=9代入⑴中的经验回归方程,得y = 0. 5X9+2. 3=6. 8, 故预测该地区2021年农村居民家庭人均纯收入为6. 8千元.
20. (12分)“绿水青山就是金山银山”的生态文明开展理念已经深入人心,这将推动新能 源汽车产业的迅速开展,下表是近几年我国某地区新能源乘用车的年销售量与年份的统计 表:
年份
2015
2016
2017
2018
2019
销量(万台)
8
10
13
25
24
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的局部数据如下表所示:
车主
购车种类
合计
传统燃油车
新能源车
男性
6
24
女性
2
合计
30
(1)求新能源乘用车的销量y关于年份x的样本相关系数r,并判断y与x是否线性相关; (2)请将上述2X2列联表补充完整,并依据小概率值a =(). 1的独立性检验,是否可以推 断购车车主是否购置新能源乘用车与性别有关.
附:季而p25.
解(1)依题意,— 2 015+2 016+2 017+2 018+2 019 门八一
x ==2 017,— 8+10+13 + 25 + 24 y =e=16.
故Z(Xi-T) (yi-7)= (-2) X (—8) + (—1) X ( —6)+0X ( —3) + 1 X9 + 2X8=47, i = lZ (Xi- x ¥=4+1 + 1+4=10, 1=1
Z(y>- y )2=64 + 36+9+81+64 = 254,
|r|-0.94接近于1,故y与x线性相关.
(2)依题意,完善表格如下:
车主
购车种类
合计
传统燃油车
新能源车
男性
18
6
24
女性
2
4
6
合计
20
10
30
零假设H。:购车车主是否购置新能源乘用车与性别无关,那么
2 30X 18X4—2X6 z 15 ° 廿、°x = -20X 10X24X6-=7=3. 75>2. 706=x。/,
根据小概率值« =0.1的独立性检验,我们推断用不成立,故有90%的把握认为购车车主是否购置新能源乘用车与性别有关.
21. (12分)己知某校5名学生的数学成绩和物理成绩如下表:
学生的编号i
1
2
3
4
5
数学成绩Xi
80
75
70
65
60
物理成绩Yi
70
66
68
64
62
(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出 现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?
(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在 上述表格是正确的前提卜,用x表示数学成绩,用y表示物理成绩,求y关于x的经验回归 方程;(3)利用残差分析经验回归方程的拟合效果,假设残差和在(一0.1, 0.1)范围内,那么称经验回 归方程为“优拟方程”,问:该经验回归方程是否为“优拟方程”?
参考数据和公式:y = bx+a,其中ZxiyLn x • y i = l
a= y —b x ;
Zxiyi=23 190, gx;=24 750,残差和公式:Z (yi-yi). 1 = 1
解(1)记事件A为“恰有2名学生的物理成绩是自己的实际成绩”,
…、2d 1
那么P(A)=密=/⑵因为7=8。+75+7产65+6。=70 5
=66,
—70+66+68 + 64+62 ”gxiyi — 5 x - y i = l
a=66-0. 36X70=40. 8.
所以经验回归方程为y=0. 36x4-40. 8.
(3)X|=8O, yi=69. 6.
x2=75, y2=67. 8.
x3=70, y;j=66.
Xi=65, %=64. 2.
x5=60, y5=62. 4.
5•
Z (yi-yi) = (70-69. 6) + (66-67. 8) + (68-66) 4- (64-64. 2) + (62-62.4) =0. 4+ (-
1.8)+2-0. 2-0. 4=0.
因为 Ow (―0. 1, 0. 1),
所以该方程为“优拟方程”.
22. (12分)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的 土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求 的基本指标.为了解某型号某批次混凝土的抗压强度(单位:MPa)随龄期(单位:天)的开展 规律,质检部门在标准试验条件下记录了 10组混凝土试件在龄期x,(i = l, 2,3,…,10)分 别为2, 3, 4, 5, 7, 9, 12, 14, 17,21时抗压强度力的值,并对数据作了初步处理,得到下面的 散点图及一些统计量的值.
ln抗压强度.v
40•
35
3(),
25
200
I龄母
0 3 6 9 12 15 18 21
X
y
w
10
Z(XL
i = l
7)2
10
Z(WL i = l
~r
X (Xi— x ) (y: - i = l
7)
10_
2 (Wi— w ) (y( -
i = l
~7)
9.
4
29.7
2
366
5.5
439.2
55
—1 10 表中 w = ln Xi, w =—XWi-
⑴根据散点图判断尸a+bx与y=c+dln x哪一个适宜作为抗压强度y关于龄期x的回 归方程类型?选择其中的一个模型,并根据表中数据,建立y关于x的回归方程;
(2)工程中常把龄期为28天的混凝土试件的抗压强度fzs视作混凝土抗压强度标准值. 该型号混凝土设置的最低抗压强度标准值为40 MPa.
①试预测该批次混凝土是否达标?
②由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要意 义.经验说明,该型号混凝土第7天的抗压强度R与第28天的抗压强度f28具有线性相关 关系f28=1.2f?+7,试估计在早期质量控制中,龄期为7天的试件需到达的抗压强度.
参考数据:In 2MJ.69, In 7=1.95.
E Xi- X ys- y • i = l- ・ _
附:b=, a= y —b x .
Z x.-T 2 i-l
解(D由散点图可以判断,y = c + dln x适宜作为抗压强度y关于龄期x的回归方程类 型.
令w=ln x,先建立y关于w的经验回归方程.
10 X wl w y.— y
-1=155
由于 d==r4=10,io 3
V12
Z Wi- w i = l
c= y —d w =29. 7—10X2 = 9. 7,
所以y关于w的经验回归方程为y=9. 7+ lOw, 因此y关于x的回归方程为y=9. 7+101n x.
(2)①由(1)知,当龄期为28天,即x = 28时,抗压强度y的预测值y=9.7+101n 28=9.7
+ 10X(21n 2+ln 7)弋43.
因为43>40,所以预测该批次混凝土达标.
②令 f28=L2f:+7240,得 f7227. 5.
所以估计龄期为7天的混凝土试件需到达的抗压强度为27. 5 MPa.
《第八章 成对数据的统计分析》单元检测试卷(二)
一、单项选择题(每题只有一个选项为正确答案,每题5分,8题共40分)
1 .x与y之间的一组数据如下表:
X
3
4
5
6
y
30
40
60
50
假设y与x线性相关,根据上表求得y与x的线性回归方程,与二»丫 +》中的各为8,据此模
型预报冗=7时y的值为(A. 70
A. 70
B. 63
C. 65
D. 66
.以下关于回归分析的说法中错误的选项是()
A.回归直线一定过样本中心卜B.残差图中残差点比拟均匀地落在水平的带状区域中,说明选用的模型比拟合适
C.甲、乙两个模型的内分别约为0.98和0.80,那么模型乙的拟合效果更好D.两个模型中残差平方和越小的模型拟合的效果越好
3.某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数y与当天气温X的回归方程y = —2.352x+147.767.以下选项正确的选项是()
A. x与》线性正相关B. x与『线性负相关c. y随x增大而增大d. >随x减小而减小
4 .如图,根据的散点图,得到y关于X的线性回归方程为了二加+ 0.2,那么3二
( )
A. 1.5B. 1.8C. 2D. 1.6.两个变量工与的回归模型中,分别选择了四个不同的模型来拟合与x之间的关系,
它们的相关系数,・如下,其中拟合效果最好的模型是()
模型
1
2
3
4
r
0. 98
0. 80
0. 50
0. 25
A.模型1B.模型2C.模型3I).模型4. 2019年】()月18日至27日,第七届世界军人运动会在湖北武汉举办,中国代表团共
获得133金64银42铜,共239枚奖牌.为「调查各国参赛人员对主办方的满意程度,研究人员随机抽取了 500名参赛运发动进行调查,所得数据如下表所示,现有如下说法:①在参与调查的500名运发动中任取1人,抽到对主办方表示满意的男性运发动的概率为
J;②在犯错误的概率不超过幽的前提下可以认为“是否对主办方表示满意与运发动的性别有关”;③没有99. 9%的把握认为“是否对主办方表示满意与运发动的性别有关”.
男性运发动
女性运发动
对主办方表示满意
200
220
对主办方表示不满意
50
30
那么正确说法的个数为()A. 0B. 1C. 2D. 3
5 . 2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手 房交易却“逆市”而行.以下图是该地某小区2019年11月至2020年11月间,当月在售二手 房均价(单位:万元/平方米)的散点图.(图中月份代码1〜13分别对应2019年11月 ~2020年 11月)1.04
1.04
1.02
当月在售二手
-房均价)-
1.00
0.98 0.960.94
0 1 2 3 4 5 6 7 8 9 10 11 12 13 月份代码兀 根据散点图选择y =和y = c+c/lnx两个模型进行拟合,经过数据处理得到的两 个回归方程分别为y = 0.9369 + 0.02856和y = 0.9554 + 0.03061nx,并得到以下一些 统计量的值:
y = 0.9369+ 0.0285五
jy = 0.9554 + 0.0306 In x
R2
0.923
0.973
注:亍是样本数据中x的平均数,9是样本数据中)'的平均数,那么以下说法不一定成立的
是()a.当月在售二手房均价y与月份代码x呈正相关关系
6 .根据=0.9369 + 0.0285。可以预测2021年2月在售二手房均价约为1.0509万元/平方米
C.曲线 y = 0.9369 + 0.0285“ 与 y = 0.9554 + 0.0306In x 的图形经过点(x, y)D. y = 0.9554 + 0.03061nR回归曲线的拟合效果好于y = 0.9369 + 0.02854的拟合效
果8.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量
(单位:厘米),下左图为选取的15名志愿者身高与臂展的折线图,下右图为身高与臂展所对应的散点图,并求得其回归方程为y = l』6x—30.75,以下结论中正确的为()
O5O5O5A5O5
9887766554
1111111111
O5O5O5A5O5
9887766554
1111111111
A. 15名志愿者身高的极差大于臂展的极差B.身高相差10厘米的两人臂展都相差11.6 厘米
C.身高为190厘米的人臂展--定为189. 65厘米D. 15名志愿者身高和臂展成正相关关 系二、多项选择题(每题有多个选项为正确答案,每题5分,4题共20分)
9.关于变量x, y的n个样本点(匹,y),(W,%),…,(%,然)及其线性回归方程.$,= Ax + 2以下说法正确的有()
A.相关系数r的绝对值|r|越接近0,表示x, y的线性相关程度越强B.相关指数R2的值越接近1,表示线性回归方程拟合效果越好
C.残差平方和越大,表示线性回归方程拟合效果越好 1 111 »0.假设亍=一[七,了=一W>',那么点(兀,).一定在线性回归方程$,=/%+力上 〃 ,-=1〃 ,=1
io.两个相关变量刀,y的5组对应数据如下:
X
8.3
8.6
9.9
11. 1
12. 1
y
5.9
7.8
8. 1
8.4
9.8
根据上表,可得回归直线方程》=加+,,求得5 = ().78.据此估计,以下结论正确的选项是
( )A. x = \0B. y =9C. a = 0.2D.当x = 15时,
9 = 11.9511.以下有关样本线性相关系数r的说法,正确的选项是()
A.相关系数r可用来衡量x与y之间的线性相关程度且|r|越接近0,相关程度越小
B. |r|^l,且|r|越接近1,相关程度越大|r|Cl,且|r|越接近1,相关程度越小
12. 2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二 手房交易却“逆市”而行.以下图是该地某小区2019年12月至2020年12月间,当月在售 二手房均价(单位:万元/平方米)的散点图.(图中月份代码1〜13分别对应2019年12月 〜2020年12月)
A当月在手二手房13-均价 I,....
1.02-• • ・.
1.00-♦ •0.98 -• *
0.96-・
0.94 -]IIIII1II II I I
° 123456789 10 11 12 13月份代码x根据散点图选择y =。+人五和y =dinx两个模型进行拟合,经过数据处理得到的两 个回归方程分别为y = 0.9369 + 0.0285&和y = 0.9554 + 0.0306In /,并得到以下一些 统计量的值:
了 = 0.9369+0.02854
y = 0.9554+0.0306 In x
注:了是样本数据中工的平均数,》是样本数据中y的平均数,那么以下说法正确的选项是
R2
0.923
0.973
( )a.当月在售二手房均价y与月份代码x呈负相关关系
B.由),=0.9369+0.0285五预测2021年3月在售二手房均价约为1.0509万元/平方米C.曲线 y = 0.9369 + 0.02856 与 y = 0.9554+0.0306In x 都经过点 R,?)
D.模型y = 0.9554 + 0.03061nx回归曲线的拟合效果比模型),= 0.9369 + 0.02854的 好三、填空题(每5分,4题共20分,双空题第一空2分,第二空3分)
13 .某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为y = 0.6x+1.2.假设某城市职工人均工资
为5千元,估计该城市人均消费额占人均工资收入的百分比为.
14 .在吸烟与患肺癌这两个分类变量的独立性检验的计算中,以下说法正确的选项是.(填序号)
①假设长2的观测值为攵= 6.635 ,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有 关系,那么在100个吸烟的人中必有99人患有肺癌;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时, 我们说某人吸烟,那么他有99%的可能患有肺癌;
③假设从统计量中求出在犯错误的概率不超过0
展开阅读全文