资源描述
2022版高考数学一轮复习 练案高考大题规范解答系列—概率与统计练习新人教版
2022版高考数学一轮复习 练案高考大题规范解答系列—概率与统计练习新人教版
年级:
姓名:
高考大题规范解答系列(六)——概率与统计
1.(2021·江西吉安期中)据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3 600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:
态度调查人群
应该取消
应该保留
无所谓
在校学生
2 100人
120人
y人
社会人士
600人
x人
z人
(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?
(2)(理)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.
(文)在持“应该保留”态度的人中,用分层抽样方法抽取6人,再从6人中随机抽2人,求抽到2人都是在校生的概率.
[解析] (1)因为抽到持“应该保留”态度的人的概率为0.05,
所以=0.05,所以x=60.
所以持“无所谓”态度的人数共有
3 600-2 100-120-600-60=720,
所以应在“无所谓”态度抽取720×=72人.
(2)由(1)知持“应该保留”态度的一共有180人, 所以在所抽取的6人中,在校学生为×6=4人,社会人士为×6=2人,
(理)则第一组在校学生人数ξ=1,2,3,
P(ξ=1)==,P(ξ=2)==,
P(ξ=3)==,
即ξ的分布列为:
ξ
1
2
3
P
∴E(ξ)=1×+2×+3×=2.
(文)记在校生4人为a、b、c、d,社会人士2人为A、B,则从6人中随机抽取2人,共有(a,b),(a,c),(a,d),(a,A),(a,B),(b,c),(b,d),(b,A),(b,B),(c,d),(c,A),(c,B),(d,A),(d,B),(A,B)15种,其中2人都是在校生的有6种,故所求概率P==.
2.(2021·江苏江阴调研)第23届冬季奥运会于2018年2月9日至2月25日在韩国平昌举行,期间正值我市学校放寒假,寒假结束后,某校工会对全校教职工在冬季奥运会期间每天收看比赛转播的时间作了一次调查,得到如下频数分布表:
收看时间
(单位:小时)
[0,1)
[1,2)
[2,3)
[3,4)
[4,5)
[5,6]
收看人数
14
30
16
28
20
12
(1)若将每天收看比赛转播时间不低于3小时的教职工定义为“体育达人”,否则定义为“非体育达人”,请根据频数分布表补全2×2列联表:
男
女
合计
体育达人
40
非体育达人
30
合计
并判断能否有90%的把握认为该校教职工是否为“体育达人”与“性别”有关;
(2)在全校“体育达人”中按性别分层抽样抽取6名,再从这6名“体育达人”中选取2名作冬奥会知识讲座,求抽取的这两人恰好是一男一女的概率.
附表及公式:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
K2=.
[解析] (1)由题意得下表:
男
女
合计
体育达人
40
20
60
非体育达人
30
30
60
合计
70
50
120
k2==>2.706.
所以有90%的把握认为该校教职工是“体育达人”与“性别”有关.
(2)由题意知抽取的6名“体育达人”中有4名男职工,2名女职工,
记“抽取的这两人恰好是一男一女”为事件A,
(理)P(A)==.
(文)P(A)==.
3.(理)(2021·百万联考联盟联考)生活垃圾分类工作是一项复杂的系统工程,必须坚持“政府推动、部门联运、全面发动、全民参与”原则.某小学班主任为了让本班学生能够分清干垃圾和湿垃圾,展开了“垃圾分类我最行”的有奖竞答活动.班主任将本班学生分为A,B两组,规定每组抢到答题权且答对一题得1分,未抢到答题权或抢到答题权且答错得0分,将每组得分分别逐次累加,当其中一组得分比另一组得分多3分或六道题目全部答完时,有奖竞答活动结束,得分多的一组的每一位学生都将获得奖品一份.设每组每一道题答对的概率均为,A组学生抢到答题权的概率为.
(1)若答完三题后,求A组得3分的概率;
(2)设活动结束时总共答了X道题,求X的分布列及其数学期望E(X).
(文)(2021·河南洛阳统测)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100)进行分组,已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据.则得到体育成绩的折线图如下:
(1)若体育成绩大于或等于70分的学生为“体育良好”已知该校高一年级有1 000名学生,试估计该校高一年级学生“体育良好”的人数;
(2)为分析学生平时的体育活动情况,现从体育成绩在[60,70)和[80,90)的样本学生中随机抽取3人,求所抽取的3名学生中,至少有1人为非“体育良好”的概率;
(3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[60,70),b∈[70,80),c∈[80,90),当三人的体育成绩方差S2最小时,写出a,b,c的一组值(不要求证明).
注:S2=,其中=(x1+x2+…+xn).
[解析] (理)(1)由题意可知每道题A组得1分的概率为×=,
故答完3题后,A组得3分的概率P=3=.
(2)由A组学生抢到答题权的概率为,
可知B组学生抢到答题权的概率为1-=,
则每道题的答题结果有以下三种:
①A组得1分,B组得0分,此时的概率为×=;
②A组得0分,B组得1分,此时的概率为×=;
③A组得0分,B组得0分,此时的概率为1--=.
由题意可知X的可能取值为3,4,5,6.
P(X=3)=2×3=,
P(X=4)=2×C2××=,
P(X=5)=
2×=,
P(X=6)=1---=,
则X的分布列为
X
3
4
5
6
P
故E(X)=3×+4×+5×+6×=.
(文)(1)体育成绩大于或等于70分的学生有30人,
∴估计该校高一年级学生“体育良好”的人数为:1 000×=750人.
(2)体育成绩在[60,70)有2名学生,在[80,90)中有3名,
设至少有1人为非“体育良好”为事件A,
样本中的2位成绩在[60,70)的学生和3位成绩在[80,90)的学生分别记为A1,A2,B1,B2,B3,
从中随机选取3个学生的所有结果为:(A1,A2,B1),(A1,A2,B2),(A1,A2,B3),(A1,B1,B2),(A1,B1,B3),(A1,B2,B3),(A2, B1,B2),(A2,B1,B3),(A2,B2,B3),(B1,B2,B3).
共有n=10个基本事件,事件A包含的基本事件有m=9个,P(A)==.
(3)当数据a,b,c的方差s2最小时,a=69,b=74,c=80.
(或者a=69,b=75,c=80.)
4.(理)(2020·重庆一中期中)某次数学测验共有12道选择题,每道题共有四个选项,且其中只有一个选项是正确的,评分标准规定:每选对1道题得5分,不选或选错得0分.在这次数学测验中,考生甲每道选择题都按照规则作答,并能确定其中有9道题能选对;其余3道题无法确定正确选项,在这3道题中,恰有2道能排除两个错误选项,另1题只能排除一个错误选项.若考生甲做这3道题时,每道题都从不能排除的选项中随机挑选一个选项作答,且各题作答互不影响.在本次测验中,考生甲选择题所得的分数记为X.
(1)求X=55的概率;
(2)求X的分布列和数学期望.
(文)(2021·吉林长春模拟)某小区超市采取有力措施保障居民正常生活的物资供应.为做好日常生活必需的甲类物资的供应,超市对社区居民户每天对甲类物资的购买量进行了调查,得到了以下频率分布直方图(如图).
(1)估计该小区居民对甲类物资购买量的中位数;
(2)现将小区居民按照购买量分为两组,即购买量在[1,3)(单位:kg)的居民为A组,购买量在[3,6](单位:kg)的居民为B组,采用分层抽样的方式从该小区中选出5户进行生活情况调查,再从这5户中随机选出3户,求选出的B组户数为2的概率.
[解析] (理)(1)能排除2个选项的试题记为A类试题;设选对一道A类试题为A,则P(A)=,
能排除1个选项的试题记为B类试题;设选对一道B类试题为B,则P(B)=,
该考生选择题得55分可以为:
①A对2道,B对0道,
则概率为C2×=;
②A对1道,B对1道,
则概率为C2×=;
则P(X=55)=+=.
(2)该考生所得分数X=45,50,55,60
P(X=45)=C2×=;
P(X=50)=C2×+C2×=;
P(X=60)=C2×=;
∴X的分布列为:
X
45
50
55
60
P
∴E(X)=45×+50×+55×+60×=.
(文)(1)由中位数两侧频率相等,而[1,3)的频率为0.1×1+0.3×1=0.4,[4,6)的频率为0.15×1+0.2×1=0.35,设中位数为x0,将[3,4)分为[3,x0)和[x0,4)即有:
0.25×(x0-3)+0.4=0.25×(4-x0)+0.35,解得x0=3.4;
(2)依据分层抽样,A组有2人为x,y,B组有3人为a,b,c,
从中任选3人,可能的情况为xya、xyb、xyc、xab、xbc、xac、yab、ybc、yac、abc共10种情况,其中B组户数有2户的有xab、xbc、xac,yab、ybc、yac共6种,因此选出的B组户数为2的概率为=.
5.(理)(2021·河北省石家庄市质检)某公司为了提高利润,从2012年至2018年每年对生产环节的改进进行投资,投资金额与年利润增长的数据如下表:
年份
2012
2013
2014
2015
2016
2017
2018
投资金额x(万元)
4.5
5.0
5.5
6.0
6.5
7.0
7.5
年利润增长y(万元)
6.0
7.0
7.4
8.1
8.9
9.6
11.1
(1)请用最小二乘法求出y关于x的回归直线方程;如果2019年该公司计划对生产环节的改进的投资金额为8万元,估计该公司在该年的年利润增长为多少?(结果保留两位小数)
(2)现从2012年~2018年这7年中抽出三年进行调查,记λ=年利润增长-投资金额,设这三年中λ≥2(万元)的年份数为ξ,求随机变量ξ的分布列与期望.
参考公式:
==,=- .
参考数据:iyi=359.6,=259.
(文)(2021·四川雅安诊断)己知某地区某种昆虫产卵数和温度有关,现收集了一只该品种昆虫的产卵数y(个)和温度x(℃)的7组观测数据,其散点图如图所示:
根据散点图,结合函数知识,可以发现产卵数y和温度x可用方程y=ebx+a来拟合,令z=ln y,结合样本数据可知z与温度x可用线性回归方程来拟合.根据收集到的数据,计算得到如下值:
(xi-)2
(zi-)2
(xi-)(zi-)
27
74
3.537
182
11.9
46.418
表中zi=ln yi,=i.
(1)求z和温度x的回归方程(回归系数结果精确到0.001);
(2)求产卵数y关于温度x的回归方程;若该地区一段时间内的气温在26 ℃~36 ℃之间(包括26 ℃与36 ℃),估计该品种一只昆虫的产卵数的范围.(参考数据:e3.282≈27,e3.792≈44,e5.832≈341,e6.087≈440, e6.342≈568.)
附:对于一组数据(ω1,v1),(w2,v2),…,(ωn,vn),其回归直线=+ω的斜率和截距的最小二乘估计分别为=.
[解析] (理)(1)=6,=8.3,7=348.6,
===≈1.571,
=- =8.3-1.571×6=-1.126≈-1.13,
那么回归直线方程为:=1.57x-1.13,
将x=8代入方程得=1.57×8-1.13=11.43,
即该公司在该年的年利润增长大约为11.43万元.
(2)由题意可知,
年份
2012
2013
2014
2015
2016
2017
2018
λ
1.5
2
1.9
2.1
2.4
2.6
3.6
ξ的可能取值为1,2,3,
P(ξ=1)==;
P(ξ=2)==;
P(ξ=3)==.
则ξ分布列为
ξ
1
2
3
P
E(ξ)=1×+2×+3×=.
(文)(1)因为z与温度x可以用线性回归方程来拟合,
设=+ x.
===0.255,
所以=z-x=3.537-0.255×27=-3.348,
故z关于x的线性回归方程为=0.255x-3.348.
(2)由(1)可得ln y=0.255x-3.348,
于是产卵数y关于温度x的回归方程为y=e0.255x-3.348,
当x=26时,y=e0.255×26-3.348=e3.282≈27;
当x=36时,y=e0.255×36-3.348=e5.832≈341;
因为函数y=e0.255x-3.348为增函数,
所以,气温在26 ℃~36 ℃之间时,一只该品种昆虫的产卵数的估计范围是[27,341]内的正整数.
6.(理)(2020·安徽安庆模拟)为了提高生产线的运行效率,工厂对生产线的设备进行了技术改造.为了对比技术改造后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单位:天)数据,并绘制了如下茎叶图:
(1)①设所采集的40个连续正常运行时间的中位数m,并将连续正常运行时间超过m和不超过m的次数填入下面的列联表:
超过m
不超过m
改造前
a
b
改造后
c
d
试写出a,b,c,d的值;
②根据①中的列联表,能否有99%的把握认为生产线技术改造前后的连续正常运行时间有差异?
附:K2=,n=a+b+c+d,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
(2)工厂的生产线的运行需要进行维护,工厂对生产线的生产维护费用包括正常维护费、保障维护费两种,对生产线设定维护周期为T天(即从开工运行到第kT天(k∈N*)进行维护.生产线在一个生产周期内设置几个维护周期,每个维护周期相互独立.在一个维护周期内,若生产线能连续运行,则不会产生保障维护费;若生产线不能连续运行,则产生保障维护费.经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次则保障维护费增加0.2万元.现制定生产线一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4.以生产线在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及期望值.
(文)(2021·安徽马鞍山质检)为了研究昼夜温差与引发感冒的情况,医务人员对某高中在同一时间段相同温差下的学生感冒情况进行抽样调研,所得数据统计如表1所示,并将男生感冒的人数与温差情况统计如表2所示,
表1
患感冒人数
不患感冒人数
合计
男生
30
70
100
女生
42
58
p
合计
m
n
200
表2
温差x
6
7
8
9
10
男生感冒的人数y
8
10
14
20
23
(1)写出m,n,p的值;
(2)判断是否有95%的把握认为在相同的温差下认为“性别”与“患感冒的情况”具有相关性;
(3)根据表2数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(若0.75≤|r|≤1,则认为y与x线性相关性很强;0.3≤|r|≤0.75,则认为y与x线性相关性一般;IrI≤0.25,则认为y与x线性相关性较弱).
附:参考公式:K2=,
n=a+b+c+d.
P(K2≥k0)
0.25
0.15
0.10
0.050
0.025
0.010
k0
1.323
2.072
2.706
3.841
5.024
6.635
r=,(xi-)2=10,(yi-)2=164,≈20.248 5.
[解析] (理)(1)①由茎叶图知m==30,
根据茎叶图可得:a=5,b=15,c=15,d=5.
②由于K2==10>6.635,所以有99%的把握认为连续正常运行时间有差异.
(2)生产周期内有4个维护周期,一个维护周期为30天,一个维护周期内,生产线需保障维护的概率为P=.
设一个生产周期内需保障维护的次数为ξ次,则正常维护费为0.5×4=2万元,
保障维护费为=0.1ξ2+0.1ξ万元.
故一个生产周期内需保障维护ξ次时的生产维护费为0.1ξ2+0.1ξ+2万元.
由于ξ~B,设一个生产周期内的生产维护费为X万元,则分布列为
X
2
2.2
2.6
3.2
4
P
则E(X)=2×+2.2×+2.6×+3.2×+4×===2.275万元.
故一个生产周期内生产维护费的期望值为2.275万元.
(文)(1)根据表中数据可得:
m=30+42=72,n=70+58=128,p=42+58=100.
(2)依题意,
K2==3.125<3.841
所以没有95%的把握认为在相同的温差下认为“性别”与“患感冒的情况”具有相关性.
(3)依题意,==8,
==15,
所以(xi-)(yi-)=40,则
r====0.987 7>0.75,
故说明y与x的线性相关性很强.
展开阅读全文