资源描述
专题限时集训(六) 统计与统计案例
[专题通关练]
(建议用时:20分钟)
1.以下说法中正确的选项是( )
A.先把高三年级的2 000名学生编号:1到2 000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m,然后抽取编号为m+50,m+100,m+150,…的学生,这样的抽样方法是分层抽样法
B.线性回归直线=x+不一定过样本中心点(,)
C.假设两个随机变量的线性相关性越强,那么相关系数r的值越接近于1
D.假设一组数据1,a,3的平均数是2,那么该组数据的方差是
D [对于A,先把高三年级的2 000名学生编号:1到2 000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m,然后抽取编号为m+50,m+100,m+150,…的学生,这样的抽样方法是系统抽样,故A项错误;对于B,线性回归直线=x+一定过样本中心点(,),故B项错误;对于C,假设两个随机变量的线性相关性越强,那么相关系数r的绝对值越接近于1,故C项错误;对于D,假设一组数据1,a,3的平均数是2,那么a=2,那么该组数据的方差是×=,故D项正确,应选D.]
2.[重视题](2023·青岛一模)调查机构对某高科技行业进行调查统计,得到该行业从业者学历分布饼状图、从事该行业岗位分布条形图,如下图.
给出以下三种说法:①该高科技行业从业人员中学历为博士的占一半以上;②该高科技行业中从事技术岗位的人数超过总人数的30%;③该高科技行业中从事运营岗位的人员主要是本科生,其中正确的个数为( )
A.0个 B.1个
C.2个 D.3个
C [在①中,由该行业从业者学历分布饼状图得到:该高科技行业从业人员中学历为博士的占一半以上,故①正确;在②中,由从事该行业岗位分布条形图得到:该高科技行业中从事技术岗位的人数超过总人数的30%,故②正确;在③中,由该行业从业者学历分布饼状图、从事该行业岗位分布条形图,无法得到该高科技行业中从事运营岗位的人员主要是本科生,故③错误.应选C.]
3.(2023·郑州二模)将甲、乙两个篮球队5场比赛的得分数据整理成如下图的茎叶图,由图可知以下结论正确的选项是( )
A.甲队平均得分高于乙队的平均得分
B.甲队得分的中位数大于乙队得分的中位数
C.甲队得分的方差大于乙队得分的方差
D.甲乙两队得分的极差相等
C [对于A,甲的平均数为(29+28+26+31+31)=29,乙的平均数为(28+29+30+31+32)=30,故A错误.
对于B,甲队得分的中位数是29,乙队得分的中位数是30,故B错误;
对于C,甲成绩的方差为:s2=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=.
乙成绩的方差为:s2=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2.
可得甲队得分的方差大于乙队得分的方差,故C正确;
对于D,甲的极差是31-26=5,乙的极差是32-28=4,两者不相等,故D错误.应选C.]
4.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为=x+.xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163
C.166 D.170
C [∵xi=225,∴=xi=22.5.
∵yi=1 600,∴=yi=160.
又=4,∴=-=160-4×22.5=70.
∴线性回归方程为=4x+70.
将x=24代入上式,得=4×24+70=166.应选C.]
5.(2023·全国卷Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.假设46号学生被抽到,那么下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
C [根据题意,系统抽样是等距抽样,
所以抽样间隔为=10.
因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.应选C.]
6.(2023·聊城市一模)某工厂从生产的一批产品中随机抽出一局部,对这些产品的一项质量指标进行了检测,整理检测结果得到如下频率分布表:
质量指标分组
[10,30)
[30,50)
[50,70]
频率
0.1
0.6
0.3
据此可估计这批产品的此项质量指标的方差为________.
144 [由题意得这批产品的此项质量指标的平均数为20×0.1+40×0.6+60×0.3=44,
故方差为(20-44)2×0.1+(40-44)2×0.6+(60-44)2×0.3=144.]
[能力提升练]
(建议用时:15分钟)
7.某球迷为了解A,B两支篮球队的攻击能力,从某赛季常规赛中随机调查了20场与这两支篮球队有关的比赛.两队所得分数分别如下.
A篮球队:122 110 105 105 109 101 107 129
115 100 114 118 118 104 93 120
96 102 105 83
B篮球队:114 114 110 108 103 117 93 124
75 106 91 81 107 112 107 101 106
120 107 79
(1)根据两组数据完成两队所得分数的茎叶图,并通过茎叶图比拟两支篮球队所得分数的平均值及分散程度(不要求计算出具体值,得出结论即可);
(2)根据篮球队所得分数,将篮球队的攻击能力从低到高分为三个等级,如下表所示.
篮球队所得分数
低于100分
100分到119分(包含100分和119分)
不低于120分
攻击能力等级
较弱
较强
很强
记事件C:“A篮球队的攻击能力等级高于B篮球队的攻击能力等级〞.假设两支篮球队的攻击能力相互独立,根据所给数据,视事件发生的频率为相应事件发生的概率,求事件C发生的概率.
[解](1)两队所得分数的茎叶图如图.
通过茎叶图可以看出,A篮球队所得分数的平均值高于B篮球队所得分数的平均值;
A篮球队所得分数比拟集中,B篮球队所得分数比拟分散.
(2)记CA1表示事件:“A篮球队的攻击能力等级为较强〞.
CA2表示事件:“A篮球队的攻击能力等级为很强〞.
CB1表示事件:“B篮球队的攻击能力等级为较弱〞.
CB2表示事件:“B篮球队的攻击能力等级为较弱或较强〞.
那么CA1与CB1为相互独立事件,CA2与CB2为相互独立事件,CA1与CA2为互斥事件,C=(CA1CB1)∪(CA2CB2).
P(C)=P(CA1CB1)+P(CA2CB2)=P(CA1)P(CB1)+P(CA2)P(CB2).
由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,,,,
故P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=,P(C)=×+×=0.31.
8.[重视题]某市房管局为了了解该市市民2023年1月至2023年1月期间购置二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60≤m≤130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2023年1月至2023年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1至13分别对应2023年1月至2023年1月)
(1)试估计该市市民的平均购房面积;
(2)从该市2023年1月至2023年1月期间所有购置二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X,求X的分布列与数学期望;
(3)根据散点图选择=+和=+ln x两个模型进行拟合,经过数据处理得到两个回归方程,分别为=0.936 9+0.028 5和=0.955 4+0.030 6ln x,并得到一些统计量的值,如表所示:
=0.936 9
+0.028 5
=0.955 4+
0.030 6ln x
(yi-i)2
0.000 591
0.000 164
(yi-)2
0.006 050
请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2023年6月份的二手房购房均价(精确到0.001).
参考数据:ln 2≈0.69,ln 3≈1.10,ln 10≈2.30,ln 19≈2.94,≈1.41,≈1.73,≈3.16,≈4.36.
参考公式:R2=1-.
[解](1)=65×0.05+75×0.1+85×0.2+95×0.25+105×0.2+115×0.15+125×0.05=96.
(2)每一位市民购房面积不低于100平方米的概率为0.20+0.15+0.05=0.4,
∴X~B(3,0.4),
∴P(X=k)=C×0.4k×0.63-k,(k=0,1,2,3),
P(X=0)=0.63=0.216,
P(X=1)=C×0.4×0.62=0.432,
P(X=2)=C×0.42×0.6=0.288,
P(X=3)=0.43=0.064,
∴X的分布列为:
X
0
1
2
3
P
0.216
0.432
0.288
0.064
∴E(X)=3×0.4=1.2.
(3)设模型=0.936 9+0.028 5和=0.955 4+0.030 6ln x的相关指数分别为R,R,那么R=1-,R=1-,
∴R<R,
∴模型=0.955 4+0.030 6ln x的拟合效果更好,
2023年6月份对应的x=30,
∴=0.955 4+0.030 6ln 30=0.955 4+0.030 6(ln 3+ln 10)≈1.059万元/平方米.
内容
押题依据
独立性检验、离散型随机变量的期望、概率的计算
以图表的形式呈现数据,符合高考的命题模式,与期望、概率交汇命题表达了高考命题的特点
【押题】 高铁、网购、移动支付和共享单车被誉为中国的“新四大创造〞,彰显出中国式创新的强劲活力.某移动支付公司从我市移动支付用户中随机抽取100名进行调查,得到如下数据:
每周移动支付次数
1
2
3
4
5
6及其以上
男
10
8
7
3
2
15
女
5
4
6
4
6
30
合计
15
12
13
7
8
45
(1)把每周使用移动支付超过3次的用户称为“移动支付活泼用户〞,请完成以下2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下,认为是否为“移动支付活泼用户〞与性别有关?
非移动支付活泼用户
移动支付活泼用户
合计
男
女
合计
(2)把每周使用移动支付6次及6次以上的用户称为“移动支付达人〞,视频率为概率,在我市所有“移动支付达人〞中随机抽取4名用户.
①求抽取的4名用户中,既有男“移动支付达人〞,又有女“移动支付达人〞的概率;
②为了鼓励男性用户使用移动支付,对抽出的男“移动支付达人〞每人奖励300元,记奖励总金额为X,求X的分布列及数学期望.
附公式及表如下:K2=.
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
[解](1)由表格数据可得2×2列联表如下:
非移动支付活泼用户
移动支付活泼用户
合计
男
25
20
45
女
15
40
55
合计
40
60
100
将列联表中的数据代入公式计算得
K2=
==≈8.249>7.879.
所以在犯错误的概率不超过0.005的前提下,能认为是否为“移动支付活泼用户〞与性别有关.
(2)视频率为概率,在我市“移动支付达人〞中随机抽取1名用户,该用户为男“移动支付达人〞的概率为,女“移动支付达人〞的概率为.
①抽取的4名用户中,既有男“移动支付达人〞,又有女“移动支付达人〞的概率为P=1--=.
②记抽出的男“移动支付达人〞人数为Y,那么X=300Y.由题意得Y~B,P(Y=0)=C=;
P(Y=1)=C=;
P(Y=2)=C=;
P(Y=3)=C=;
P(Y=4)=C=.
所以Y的分布列为
Y
0
1
2
3
4
P
所以X的分布列为
X
0
300
600
900
1 200
P
由E(Y)=4×=,得X的数学期望E(X)=300E(Y)=400.
- 7 -
展开阅读全文