资源描述
阶段回扣练10 统计与统计案例
(建议用时:45分钟)
一、选择题
1.(2021·石家庄调研)某校高三班级有男生500人,女生400人,为了解该班级同学的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是 ( )
A.简洁随机抽样法 B.抽签法
C.随机数表法 D.分层抽样法
解析 总体由差异明显的几部分组成、按比例抽样,为分层抽样.
答案 D
2.下列变量之间的关系是函数关系的是 ( )
A.已知二次函数y=ax2+bx+c,其中,a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食亩产量
解析 由函数关系和相关关系的定义可知,①中Δ=b2-4ac,由于a,c是已知常数,b为自变量,所以给定一个b的值,就有唯一确定的Δ与之对应,所以Δ与b之间是一种确定的关系,是函数关系.②③④中两个变量之间的关系都是随机的、不确定的,所以不是函数关系.
答案 A
3.已知x,y之间的数据如下表所示,则回归直线过点 ( )
x
1
2
3
4
5
y
1.2
1.8
2.5
3.2
3.8
A.(0,0) B.(2,1.8)
C.(3,2.5) D.(4,3.2)
解析 由回归直线恒过样本中心求解,
∵==3,
==2.5,
故回归直线过点(3,2.5).
答案 C
4.容量为20的样本数据,分组后的频数如下表:
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
则样本数据落在区间[10,40)的频率为 ( )
A.0.35 B.0.45
C.0.55 D.0.65
解析 数据落在区间[10,40)内的频数为9,样本容量为20,所求频率为=0.45.
答案 B
5.(2021·西安模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓状况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为
( )
A.101 B.808
C.1 212 D.2 012
解析 由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,
故有=,解得N=808.
答案 B
6.小波一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为 ( )
A.30% B.10%
C.3% D.不能确定
解析 由题图(2)可知小波一星期的食品开支共计300元,其中鸡蛋开支30元.又由题图(1)知,一周的食品开支占总开支的30%,则可知一周总开支为1 000元,所以鸡蛋开支占总开支的百分比为×100%=3%.
答案 C
7.如图是依据某城市年龄在20岁到45岁的居民上网状况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民消灭的频率为 ( )
A.0.04 B.0.06
C.0.2 D.0.3
解析 由频率分布直方图可知,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的上网人数的频率成递减的等差数列分布,所以年龄在[35,40)的网民消灭的频率为0.2.故选C.
答案 C
8.若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则 ( )
A.=5,s2<2 B.=5,s2>2
C.>5,s2<2 D.>5,s2>2
解析 由题意知,(x1+x2+…+x8)=5,
[(x1-)2+(x2-)2+…+(x8-)2]=2,
则=(x1+x2+…+x8+5)=5,
s2=[(x1-)2+(x2-)2+…+(x8-)2+0]=
<2.
答案 A
9.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的,且样本容量为160,则中间一组的频数为
( )
A.32 B.0.2
C.40 D.0.25
解析 由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1,∴x=0.2,故中间一组的频数为160×0.2=32,选A.
答案 A
10.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是 ( )
A.由样本数据得到的回归方程y=bx+y必过样本点的中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系
解析 R2的值越大,说明残差平方和越小,也就是模型的拟合效果越好,故选C.
答案 C
11.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程y=bx+a,则“(x0,y0)满足线性回归方程y=bx+a”是“x0=,y0=”的 ( )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
解析 x0,y0为这10组数据的平均值,依据公式计算线性回归方程y=bx+a的b以后,再依据a=-b(,为样本平均值)求得a.因此(,)肯定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点.
答案 B
12.(2022·江西卷)某人争辩中同学的性别与成果、视力、智商、阅读量这4个变量的关系,随机抽查52名中同学,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是 ( )
表1
成果
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成果 B.视力
C.智商 D.阅读量
解析 A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
∵<<<.
∴与性别有关联的可能性最大的变量是阅读量.
答案 D
二、填空题
13.(2021·南昌调研)某个班级有男生560人,女生420人,用分层抽样的方法从该班级全体同学中抽取一个容量为280的样本,则此样本中男生人数为________.
解析 设样本中男生人数为n,则有=,解得n=160.
答案 160
14.(2021·南京、盐城模拟)某地区训练主管部门为了对该地区模拟考试成果进行分析、随机抽取了150分到450分之间的1 000名同学的成果,并依据这1 000名同学的成果画出样本的频率分布直方图(如图),则成果在[300,350)内的同学人数共有________人.
解析 由频率分布直方图可得成果在[300,350)的频率是1-(0.001+0.001+0.004+0.005+0.003)×50=1-0.7=0.3,所以成果在[300,350)的同学人数是0.3×1 000=300.
答案 300
15. 某校开展“爱我海西、爱我家乡”摄影竞赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发觉有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应当是________.
解析 当x≥4时,
=≠91,∴x<4,
则=91,∴x=1.
答案 1
16.为了解某班同学宠爱打篮球是否与性别有关,对该班50名同学进行了问卷调查,得到了如下的2×2列联表:
宠爱打篮球
不宠爱打篮球
总计
男生
20
5
25
女生
10
15
25
总计
30
20
50
则有________的把握认为宠爱打篮球与性别有关(请用百分数表示).
解析 χ2=≈8.333>6.635,
所以有99%的把握认为宠爱打篮球与性别有关.
答案 99%
17.(2021·湖北卷改编)四名同学依据各自的样本数据争辩变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且y=2.347x-6.423;
②y与x负相关且y=-3.476x+5.648;
③y与x正相关且y=5.437x+8.493;
④y与x正相关且y=-4.326x-4.578.
其中肯定不正确的结论的序号是________.
解析 ①中,回归方程中x的系数为正,不是负相关;
④方程中的x的系数为负,不是正相关,
∴①④肯定不正确.
答案 ①④
展开阅读全文