资源描述
课时作业(五十七) 变量间的相关关系、统计案例
A 级
1.(2011·陕西卷)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
2.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
3.(2012·湖南卷)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
4.已知变量x,y之间具有线性相关关系,其回归方程为=-3+bx,若i=17,i=4,则b的值为( )
A.2 B.1
C.-2 D.-1
5.在一次对性别与说谎是否相关的调查中,得到如下数据:
说谎
不说谎
合计
男
6
7
13
女
8
9
17
合计
14
16
30
根据表中数据,得到如下结论中正确的一项是( )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此调查中没有充分的证据显示说谎与性别有关
6.下表是关于出生男婴与女婴调查的列联表:
晚上
白天
总计
男婴
45
A
B
女婴
E
35
C
总计
98
D
180
那么A=________,B=________,C=________,D=________,E=________.
7.已知一个线性回归方程为=1.5x+45(xi∈{1,7,5,13,19}),则=________.
8.(2012·三明模拟)下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应生产能耗y(吨)的几组对应数据:
x
3
4
5
6
y
2.5
t
4
4.5
根据上表提供的数据,求出y关于x的线性回归方程=0.7x+0.35,则表中t的值为________.
9.某中学2011年共91人参加高考,统计数据如下:
城镇考生
农村考生
录取
31
24
未录取
19
17
则考生的户口形式和高考录取的关系是________.(填无关、多大把握有关)
10.已知x、y之间的一组数据如下表:
x
1
3
6
7
8
y
1
2
3
4
5
对于表中数据,甲、乙两同学给出的拟合直线分别为y=x+1与y=x+,试利用最小二乘法判断哪条直线拟合程度更好?
11.在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.
优秀
合格
总计
男生
6
女生
18
总计
60
已知在该班随机抽取1人测评结果为优秀的概率为.
(1)请完成上面的列联表;
(2)能否在犯错误的概率不超过0.10的前提下认为性别与测评结果有关系?
B 级
1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
合计
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
2.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程=bx+a中b=-2预测当气温为-4 ℃时,用电量的度数约为________.
3.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,工作人员分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期
12月1日
12月2日
12月3日
12月4日
12月5日
温差x(℃)
10
11
13
12
8
发芽数y(颗)
23
25
30
26
16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=bx+a;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
详解答案
课时作业(五十七)
A 级
1.D 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误.C中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误.根据回归直线方程一定经过样本中心点可知D正确.所以选D.
2.D 丁同学所得相关系数0.85最大,残差平方和m最小,所以A、B两变量线性相关性更强.
3.D 由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回归直线过样本点的中心,选项B中的结论正确;根据回归直线斜率的意义易知选项C中的结论正确;由于回归分析得出的是估计值,故选项D中的结论不正确.
4.A 依题意知,==1.7,==0.4,而直线=-3+bx一定经过点(,),所以-3+b×1.7=0.4,解得b=2.
5.D 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.
6.解析: 由列联表可得E=98-45=53,D=180-98=82,A=D-35=47,B=45+A=92,C=E+35=88.
答案: 47 92 88 82 53
7.解析: 线性回归方程为=1.5x+45,经过点(,),由=9,知=58.5.
答案: 58.5
8.解析: ∵==4.5,==,
又点(,)在=0.7x+0.35上,
∴=0.7×4.5+0.35,解得t=3.
答案: 3
9.解析: 计算K2的观察值k=≈0.11.
由于0.11<2.706,故考生的户口形式和高考录取无关.
答案: 无关
10.解析: 用y=x+1作为拟合直线时,所得y值与y的实际值的差的平方和为
s1=2+(2-2)2+(3-3)2+2+2=;
用y=x+作为拟合直线时,所得y值与y的实际值的差的平方和为
s2=(1-1)2+(2-2)2+2+(4-4)2+2=.
∵s2<s1,故用直线y=x+拟合程度更好.
11.解析: (1)
优秀
合格
总计
男生
6
22
28
女生
14
18
32
总计
20
40
60
(2)提出统计假设:性别与测评结果没有关系,则K2=≈3.348>2.706.
P(K2>2.706)=0.10.
因此,在犯错误的概率不超过0.10的前提下认为“性别与测评结果有关系”.
B 级
1.C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=≈6.
6>3.841,因此有95%的把握认为“成绩与班级有关系”.
2.解析: =10,=40,回归方程过点(,),
∴40=-2×10+a.∴a=60.∴=-2x+60.
令x=-4,∴=(-2)×(-4)+60=68.
答案: 68
3.解析: (1)由12月2日至12月4日的数据,求得=12,=27.
由公式,求得b=,a=-b =-3.
所以y关于x的线性回归方程为=x-3.
(2)当x=10时,=×10-3=22,|22-23|<2;
同样,当x=8时,=×8-3=17,|17-16|<2.
所以,该研究所得到的线性回归方程是可靠的.
6 / 6
展开阅读全文