资源描述
(时间60分钟,满分80分)
一、选择题(共6个小题,每小题5分,满分30分)
1.(2010·江南十校)最小二乘法的原理是( )
A.使得yi-(a+bxi)]最小
B.使得yi-(a+bxi)2]最小
C.使得y-(a+bxi)2]最小
D.使得yi-(a+bxi)]2最小
解析:根据回归方程表示到各点距离的平方和最小的直线方程,即总体偏差最小,亦即yi-(a+bxi)]2最小.
答案:D
2.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程中的截距为( )
A.=y+x B.=+
C.=y-x D.=-
解析:由回归直线方程恒过(,)定点.
答案:D
3.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
解析:给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或有函数关系.
答案:C
4.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
冷漠
不冷漠
总计
多看电视
68
42
110
少看电视
20
38
58
总计
88
80
168
则大约有多大的把握认为多看电视与人变冷漠有关系( )
A.99% B.97.5%
C.95% D.90%
解析:可计算K2=11.377>6.635.
答案:A
5.(2010·南通模拟)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程=x+必过样本中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系
解析:C中应为R2越大拟合效果越好.
答案:C
6.(2010·中山四校)甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
解析:丁同学所得相关系数0.85最大,残差平方和m最小,所以A、B两变量线性相关性更强.
答案:D
二、填空题(共3个小题,每小题5分,满分15分)
7.据两个变量x,y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系(答“是”或“否”)________.
答案:否
8.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程=x+中的≈-2,预测当气温为-5℃时,热茶销售量为________杯.(已知回归系数=,=-)
解析:根据表格中的数据可求得=(18+13+10-1)=10,=(24+34+38+64)=40.
∴=-=40-(-2)×10=60,∴=-2x+60,当x=-5时,=-2×(-5)+60=70.
答案:70
9.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析:K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
答案:①
三、解答题(共3个小题,满分35分)
10.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程=bx+a,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?
(注:=,=-)
解:(1)散点图如图.
(2)由表中数据得:iyi=52.5,
=3.5,=3.5,=54,∴b=0.7,∴a=1.05,
∴=0.7x+1.05,
回归直线如图所示.
(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05,
∴预测加工10个零件需要8.05小时.
11.已知x、y之间的一组数据如下表:
x
1
3
6
7
8
y
1
2
3
4
5
(1)从x、y中各取一个数,求x+y≥10的概率;
(2)针对表中数据,甲、乙两同学给出的拟合直线分别为y=x+1与y=x+,试利用“最小二乘法”判断哪条直线拟合程度更好.
解:(1)从x、y中各取一个数组成数对(x,y),共有25对,其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对,故所求概率为
P=,所以使x+y≥10的概率为.
(2)用y=x+1作为拟合直线时,y的实际值与所得的y值的差的平方和为s1=(1-)2+(2-2)2+(3-3)2+(4-)2+(5-)2=.
用y=x+作为拟合直线时,y的实际值与所得的y值的差的平方和为s2=(1-1)2+(2-2)2+(3-)2+(4-4)2+(5-)2=.
因为s1>s2,故直线y=x+的拟合程度更好.
12.(2010·辽宁高考)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
12
63
86
182
92
61
4
乙厂:
分组
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
频数
29
71
85
159
76
62
18
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?
甲厂
乙厂
合计
优质品
非优质品
合计
附K2=,
P(K2≥k)
0.05 0.01
k
3.841 6.635
解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.
(2)
甲厂
乙厂
合计
优质品
360
320
680
非优质品
140
180
320
合计
500
500
1 000
K2=≈7.35>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
- 6 -
用心 爱心 专心
展开阅读全文