资源描述
专题 统计案例 课后练习
主讲老师:纪荣强 北京四中数学老师
题一: 为了推断高中三班级同学选修文科是否与性别有关,现随机抽取50名同学,得到如下2×2列联表:
理科
文科
合计
男
13
10
23
女
7
20
27
合计
20
30
50
依据表中数据,得到χ2=≈4.844,则认为选修文科与性别有关系出错的可能性约为________.
题二: 在争辩吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误概率不超过0.01的前提下认为这个结论是成立的,则下列说法中正确的是( )
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这人有99%的概率患有肺癌
C.在100个吸烟者中肯定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
题三: 在一次对性别与说谎是否相关的调查中,得到如下数据:
说谎
不说谎
合计
男
6
7
13
女
8
9
17
合计
14
16
30
依据表中数据,得到如下结论中正确的一项是( )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
题四: 通过随机询问110名性别不同的高校生是否爱好某项运动,得到如下的列联表:
男
女
合计
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
由χ2=算得,
χ2=≈7.8.
依据具体数据算出的χ2,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
题五: 已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的( )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
题六: 某考察团对全国10大城市的居民人均工资收入x(万元/年)与居民人均消费y(万元/年)进行统计调查,发觉y与x具有相关关系,且y对x的回归方程为=0.66x+1.562.若某城市居民人均消费为7.675(万元/年),估量该城市人均消费占人均工资收入的百分比约为________.
题七: 某爱好小组欲争辩昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差状况与因患感冒而就诊的人数,得到如下资料:
该爱好小组确定的争辩方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻两个月的概率;
(2)若选取的是1月与6月的两组数据,请依据2至5月份的数据,求出y关于x的线性回归方程=bx+a;
(3)若由线性回归方程得到的估量数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是抱负的,试问该小组所得线性回归方程是否抱负.
参考公式:
题八: 已知x,y的一组数据如下表:
x
1
3
6
7
8
y
1
2
3
4
5
(1)从x,y中各取一个数,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y=x+1与y=x+,试利用“最小平方法(也称最小二乘法)”推断哪条直线拟合程度更好.
题九: 已知x,y之间的数据如表所示,则回归直线过点________.
x
1
2
3
4
5
y
1.2
1.8
2.5
3.2
3.8
题十: 在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若全部样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
题十一: 有甲、乙两个班级进行数学考试,依据大于等于85分为优秀,85分以下为非优秀统计成果,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计
105
已知在全部105人中随机抽取1人,成果优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.依据列联表中的数据,若按95%的牢靠性要求,能认为“成果与班级有关系”
D.依据列联表中的数据,若按95%的牢靠性要求,不能认为“成果与班级有关系”
题十二: 某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.依据北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:
支持
不支持
总计
北京暴雨后
x
y
50
北京暴雨前
20
30
50
总计
A
B
100
已知工作人员从全部投票中任取一个,取到“不支持投入”的投票的概率为.
(1)求列联表中的数据x,y,A,B的值;
(2)绘制条形统计图,通过图形推断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?
(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关?
附:K2=
P(K2≤k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
题十三: 在争辩色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲.
(1)依据以上数据建立一个2×2列联表;
(2)若认为“性别与患色盲有关系”,求出错的概率.
题十四: 某班主任对全班50名同学进行了作业量多少的调查.数据如下表:
认为作业多
认为作业不多
总计
宠爱玩玩耍
18
9
不宠爱玩玩耍
8
15
总计
(1)请完善上表中所缺的有关数据;
(2)试通过计算说明能否认为宠爱玩玩耍与作业量的多少有关系?
附:χ2=.
题十五: 某同学对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)
(1)依据茎叶图,挂念这位同学说明其亲属30人的饮食习惯;
(2)依据以上数据完成下列2×2的列联表:
主食蔬菜
主食肉类
合计
50岁以下
50岁以上
合计
(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.
题十六: 通过随机询问某校110名高中同学在购买食物时是否看养分说明,得到如下的列联表:
男
女
总计
看养分说明
50
30
80
不看养分说明
10
20
30
总计
60
50
110
(1)从这50名女生中按是否看养分说明实行分层抽样的方法抽取一个容量为5的样本,则样本中看与不看养分说明的女生各有多少名?
(2)从(1)中的5名女生样本中随机选取两名作深度访谈,求选到看与不看养分说明的女生各一名的概率;
(3)依据以上列联表,问有多大把握认为“性别与在购买食物时是否看养分说明”有关?
参考公式:K2= ,其中n=a+b+c+d.
参考数据:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
k0
2.706
3.841
5.024
6.635
7.879
题十七: 某争辩机构对高三同学的记忆力x和推断力y进行统计分析,所得数据如下表:
x
6
8
10
12
y
2
3
5
6
则y对x的线性回归直线方程为( )
A.=2.3x-0.7 B.=2.3x+0.7
C.=0.7x-2.3 D.=0.7x+2.3
题十八: 某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)求回归直线方程;
(2)试猜测广告费支出为10万元时,销售额多大?
(3)在已有的五组数据中任意抽取两组,求至少有一组数据其猜测值与实际值之差的确定值不超过5的概率.参考数据:=145,=13 500,iyi=1 380
专题 统计案例
课后练习参考答案
题一: 5%
详解: 由于χ2=4.844>3.841,所以有95%的把握认为选修文科与性别有关系.
故认为选修文科与性别有关系出错的可能性约为5%.
题二: D.
详解:
统计的结果只是说明大事发生可能性的大小,具体到一个个体不肯定发生.
题三: D.
详解:
由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.
题四: C.
详解:
依据独立性检验的定义,由χ2≈7.8>6.635可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
题五: B.
详解: x0,y0为这10组数据的平均值,又由于线性回归方程=x+必过样本中心点(,),因此(,)肯定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点.
题六: 83%.
详解:由于当=7.675时,x=≈9.262,
则≈0.829≈83%.
题七: (1) . (2) =x-. (3)该小组所得线性回归方程是抱负的.
详解: (1)设抽到相邻两个月的数据为大事A.由于从6组数据中选取2组数据共有15种状况,每种状况都是等可能消灭的,其中抽到相邻两个月的数据的状况有5种,所以P(A)==.
(2)由数据求得=11,=24,
由公式求得b=,再由a=-b=-,
得y关于x的线性回归方程为=x-.
(3)当x=10时,=,|-22|<2;
同样,当x=6时,=,|-12|<2,
所以,该小组所得线性回归方程是抱负的.
题八: (1) . (2) y=x+的拟合程度更好.
详解:(1)从x,y中各取一个数组成数对(x,y),共有25对,其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P=.
(2)用y=x+1作为拟合直线时,所得y值与y的实际值的差的平方和为S1=2+(2-2)2+(3-3)2+2+2=.
用y=x+作为拟合直线时,所得y值与y的实际值的差的平方和为S2=(1-1)2+(2-2)2+2+(4-4)2+2=.
∵S2<S1,∴直线y=x+的拟合程度更好.
题九: (3,2.5).
详解:
=3,=2.5,
∴样本点中心为(3,2.5),回归直线过样本点中心.
题十: D.
详解:由于全部的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
题十一: C.
详解: 由题意知,成果优秀的同学数是30,成果非优秀的同学数是75,所以c=20,b=45,选项A、B错误.依据列联表中的数据,得到K2=≈6.109>3.841,因此有95%的把握认为“成果与班级有关系”.
题十二: (1) y=10,B=40,x=40,A=60.
(2)由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.
(3)至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.
详解:(1)设“从全部投票中抽取一个,取到不支持投入的投票”为大事A,
由已知得P(A)==,所以y=10,B=40,x=40,A=60.
(2)由(1)知北京暴雨后支持率为=,
不支持率为1-=,
北京暴雨前支持率为=,
不支持率为1-=.
条形统计图如图所示,由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.
(3)K2===≈16.78>10.828.
故至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.
题十三: (1)2×2列联表如下:
患色盲
不患色盲
总计
男
38
442
480
女
6
514
520
总计
44
956
1 000
(2) 0.1%.
详解:(1)2×2列联表如下:
患色盲
不患色盲
总计
男
38
442
480
女
6
514
520
总计
44
956
1 000
(2)假设H0:“性别与患色盲没有关系”,依据(1)中2×2列联表中数据,可求得K2=≈27.14,又P(K2≥10.828)=0.001,即H0成立的概率不超过0.001,故若认为“性别与患色盲有关系”,则出错的概率为0.1%.
题十四: (1)
认为作业多
认为作业不多
总计
宠爱玩玩耍
18
9
27
不宠爱玩玩耍
8
15
23
总计
26
24
50
(2)有95%把握认为宠爱玩玩耍与作业量的多少有关系.
详解:(1)
认为作业多
认为作业不多
总计
宠爱玩玩耍
18
9
27
不宠爱玩玩耍
8
15
23
总计
26
24
50
(2)将表中的数据代入公式
χ2=得到
χ2=≈5.059>3.841,
所以有95%把握认为宠爱玩玩耍与作业量的多少有关系.
题十五: (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.
(2)
主食蔬菜
主食肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
(3)有99%的把握认为亲属的饮食习惯与年龄有关.
详解: (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.
(2)
主食蔬菜
主食肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
(3)K2===10>6.635,有99%的把握认为亲属的饮食习惯与年龄有关.
题十六: (1)看养分说明的女生有3名,样本中不看养分说明的女生2名. (2) .
(3)有99%的把握认为“性别与在购买食物时是否看养分说明”有关.
详解:(1)依据分层抽样可得:样本中看养分说明的女生有×30=3名,样本中不看养分说明的女生有×20=2名.
(2)记样本中看养分说明的3名女生为a1,a2,a3,不看养分说明的2名女生为b1,b2,从这5名女生中随机选取2名,共有10个等可能的基本大事:a1,a2;a1,a3;a1,b1;a1,b2;a2,a3;a2,b1;a2,b2;a3,b1;a3,b2;b1,b2.
其中大事A“选到看与不看养分说明的女生各一名”包含了6个基本大事:a1,b1;a1,b2;a2,b1;a2,b2;a3,b1;a3,b2.
所以所求的概率为P(A)==.
(3)依据题中的列联表得K2==≈7.486.
由P(K2≥6.635)=0.010,P(K2≥7.879)=0.005可知,有99%的把握认为“性别与在购买食物时是否看养分说明”有关.
题十七: C.
详解:∵iyi=6×2+8×3+10×5+12×6=158,
==9,==4.
∴==0.7,
=4-0.7×9=-2.3.
故线性回归直线方程为=0.7x-2.3.
题十八: (1)回归直线方程为=6.5x+17.5. (2) 82.5万元. (3) .
详解:(1)===5,
===50,
又已知=145,iyi=1 380,
于是可得:===6.5,
=- =50-6.5×5=17.5,
因此,所求回归直线方程为=6.5x+17.5.
(2)依据上面求得的回归直线方程,当广告费支出为10万元时,=6.5×10+17.5=82.5(万元),
即这种产品的销售收入大约为82.5万元.
(3)
x
2
4
5
6
8
y
30
40
60
50
70
30.5
43.5
50
56.5
69.5
基本大事:(30,40),(30,60),(30,50),(30,70),(40,60),(40,50),(40,70),(60,50),(60,70),(50,70)共10个.
两组数据其猜测值与实际值之差的确定值都超过5有(60,50),
所以至少有一组数据其猜测值与实际值之差的确定值不超过5的概率为1-=.
展开阅读全文