资源描述
2022版高考数学一轮复习 第十章 计数原理、概率、随机变量及其分布第九讲 正态分布学案新人教版
2022版高考数学一轮复习 第十章 计数原理、概率、随机变量及其分布第九讲 正态分布学案新人教版
年级:
姓名:
第九讲 正态分布(理)
知识梳理·双基自测
知识点一 正态曲线及其性质
(1)正态曲线:函数f(x)=e-,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数.我们称函数f(x)的图象为正态分布密度曲线,简称正态曲线,期望为μ、标准差为σ的正态分布通常记作__X~N(μ,σ2)__.
(2)正态曲线的性质:①曲线位于x轴__上方__,与x轴不相交;②曲线是单峰的,它关于直线__x=μ__对称;③曲线在__x=μ__处达到峰值;④曲线与x轴之间的面积为__1__;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿着x轴平移;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越__集中__;σ越大,曲线越“矮胖”,表示总体的分布越__分散__.
知识点二 正态分布
(1)正态分布的定义及表示.
若对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=__φμ,σ(x)dx__,则称X服从正态分布,记作X~N(μ,σ2).
(2)正态总体在三个特殊区间内取值的概率值:
①P(μ-σ<X≤μ+σ)=__0.682_6__;
②P(μ-2σ<X≤μ+2σ)=__0.954_4__;
③P(μ-3σ<X≤μ+3σ)=__0.997_4__.
对于正态分布N(μ,σ2),由x=μ是正态曲线的对称轴知
(1)P(X≥μ)=P(X≤μ)=0.5;
(2)对任意的a有P(X<μ-a)=P(X>μ+a);
(3)P(X<x0)=1-P(x≥x0);
(4)P(a<X<b)=P(X<b)-P(X≤a).
注:在X服从正态分布,即X~N(μ,σ2)时,要充分利用正态曲线的关于直线x=μ对称和曲线与x轴之间的面积为1.
题组一 走出误区
1.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( √ )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( √ )
(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( √ )
(4)若X~N(0,1),则P(x<-)<P(x≥).( × )
题组二 走进教材
2.(P75B组T2改编)设随机变量ξ服从正态分布N(4,3),若P(ξ<a-5)=P(ξ>a+1),则实数a等于( B )
A.7 B.6
C.5 D.4
[解析] 由题意知=4,∴a=6.
题组三 走向高考
3.(2015·山东)已知某批零件的长度误差ξ(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( B )
(附:正态分布N(μ,σ2)中,P(μ-σ<ξ<μ+σ)=0. 682 7,P(μ-2σ<ξ<μ+2σ)=0.954 5)
A.0.045 6 B.0.135 9
C.0. 271 8 D.0.317 4
[解析] 因为P(-3<ξ<3)=0. 682 7,P(-6<ξ<6)=0.954 5,所以P(3<ξ<6)=×(0.954 5-0.682 7)=0.135 9.故选B.
4.(2015·湖北,5分)设X~N(μ1,σ),Y~N(μ2,σ),这两个正态分布密度曲线如图所示,下列结论中正确的是( C )
A.P(Y≥μ2)≥P(Y≥μ1)
B.P(X≤σ2)≤P(X≤σ1)
C.对任意正数t,P(X≤t)≥P(Y≤t)
D.对任意正数t,P(X≥t)≥P(Y≥t)
[解析] 由正态分布密度曲线的性质可知,X~N(μ1,σ),Y~N(μ2,σ)的密度曲线分别关于直线x=μ1,x=μ2对称,因此结合题中所给图象可得,μ1<μ2,所以P(Y≥μ2)<P(Y≥μ1),故A错误.又X~N(μ1,σ)的密度曲线较Y~ N(μ2,σ)的密度曲线“瘦高”,所以σ1<σ2,所以P(X≤σ2)>P(X≤σ1),B错误.对任意正数t,P(X≤t)≥P(Y≤t),P(X≥t)≤P(Y≥t),C正确,D错误.
5.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=xi=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ<Z<μ+3σ)=0.997 4,0.997 416≈0.959 2,≈0.09.
[解析] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望为E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
考点突破·互动探究
考点一 正态分布的性质——自主练透
例1 (2021·河北唐山模拟)已知随机变量X服从正态分布N(0,1),随机变量Y服从正态分布N(1,1),且P(X>1)=0.158 7,则P(1<Y<2)=( B )
A.0.158 7 B.0.341 3
C.0.841 3 D.0.658 7
[解析] 由正态曲线的性质知,随机变量X、Y的正态曲线形状相同,(如图).
由题意P(Y>2)=P(X>1)=0.158 7,
∴P(1<Y<2)=0.5-0.158 7=0.341 3.故选B.
名师点拨
对X~N(μ,σ2)中的μ,σ的意义不清楚,特别是对μ的认识不清楚,就会在解题时无从下手,导致随便给出一个结果.这里μ是随机变量X的均值,σ是标准差,x=μ是正态分布密度曲线的对称轴.
〔变式训练2〕
设两个正态分布N(μ1,σ)(σ1>0)和N(μ2,σ)(σ2>0)的密度函数分别为φ1(x)和φ2(x),其图象如图所示,则下列结论正确的是( C )
①μ1<μ2 ②μ1>μ2 ③σ1<σ2 ④σ1>σ2
A.①② B.②③
C.①③ D.③④
[解析] f(x)=e中x=μ是对称轴,故μ1<μ2;σ越大,曲线越“矮胖”,σ越小曲线越“高瘦”,故σ1<σ2.故选C.
考点二 正态分布——多维探究
例1 角度1 正态曲线的对称性
(1)(2021·山东新高考质量测评联盟联考)在2019年高中学生信息技术测试中,经统计,某校高二学生的测试成绩X~N(86,σ2),若已知P(80<X≤86)=0.36,则从该校高二年级任选一名考生,他的测试成绩大于92分的概率为( D )
A.0.86 B.0.64
C.0.36 D.0.14
[解析] 由题意P(86<x≤92)=P(80<x≤86)=0.36,
∴P(X>92)=0.5-0.36=0.14,故选D.
角度2 确定正态曲线的对称轴
(2)(2021·福建模拟)已知随机变量X服从正态分布N(μ,σ2),若P(X<3)+P(X≤1)=1,则μ=__2__.
[解析] 因为X服从正态分布N(μ,σ2),所以P(X<3)+P(X≥3)=1,
所以P(X≤1)=P(X≥3),由正态曲线的对称性知对称轴为X=2,所以μ=2.
角度3 三个常用数据
(3)(2020·安阳二模)2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,已知某工厂生产口罩的质量指标ξ~N(15,0.002 5),单位为g,该厂每天生产的质量在(14.9 g,15.05 g)的口罩数量为818 600件,则可以估计该厂每天生产的质量在15.15 g以上的口罩数量为( D )
参考数据:若ξ~N(μ,σ2),则
P(μ-σ<ξ<μ+σ)=0.682 7,
P(μ-2σ<ξ<μ+2σ)=0.954 5,
P(μ-3σ<ξ<μ+3σ)= 0.997 3.
A.158 700 B.22 750
C.2 700 D.1 350
[解析] 由题意知,ξ~N(15,0.002 5),
即μ=15,σ2= 0.002 5,即σ=0.05;
所以P(14.9<ξ<15.05)=P(μ-2σ<ξ<μ+σ)==0.818 6,
所以该厂每天生产的口罩总量为
818 600÷0.818 6=1 000 000(件),
又P(ξ>15.15)=P(ξ>μ+3σ)=,
所以估计该厂每天生产的质量在15.15 g以上的口罩数量为1 000 000×=1 350(件).故选D.
[引申]本例(1)中若有1 000名学生参加测试,则测试成绩在80分以上的人数为__860__.
[解析] 1 000×P(X>80)=1 000×[1-(0.5-0.36)]=860.
名师点拨
关于正态总体在某个区间内取值的概率求法
(1)熟记P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值;
(2)充分利用正态曲线的对称性和曲线与x轴之间面积为1.①正态曲线关于直线x=μ对称,从而在关于x=μ对称的区间上概率相等;②P(X<a)=1-P(X≥a),P(X<μ-a)=P(X≥μ+a).
〔变式训练2〕
(1)(角度1)(2021·江苏苏州调研)已知随机变量ξ服从正态分布N(1,σ2),且P(ξ<4)=0.9,则P(-2<ξ<1)=( C )
A.0.2 B.0.3
C.0.4 D.0.6
(2)(角度2)(2021·江西模拟)已知随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=P(ξ>8)=0.15,则P(2≤ξ<5)=( B )
A.0.3 B.0.35
C.0.5 D.0.7
(3)(角度3)(2021·青岛模拟)已知某市居民在2019年用于手机支付的个人消费额ξ(单位:元)服从正态分布N(2 000,1002),则该市某居民手机支付的消费额在(1 900,2 200)内的概率为( C )
附:随机变量ξ服从正态分布N(μ,σ2),则
P(μ-σ<ξ<μ+σ)=0.682 6,
P(μ-2σ<ξ<μ+2σ)=0.954 4,
P(μ-3σ<ξ<μ+3σ)=0.997 4.
A.0.975 9 B.0.84
C.0.818 5 D.0.477 2
[解析] (1)由P(ξ<4)=0.9,得P(ξ≥4)=0.1.
又正态曲线关于x=1对称.
则P(ξ≤-2)=P(ξ≥4)=0.1,
所以P(-2<ξ<1)==0.4.故选C.
(2)根据题意,正态分布N(μ,σ2),
若P(ξ<2)=P(ξ>8)=0.15,则μ=5,
即这组数据对应的正态曲线的对称轴x=5,则P(ξ<5)=0.5,
又由P(ξ<2)=0.15,得
P(2≤ξ<5)=0.5-0.15=0.35.故选B.
(3)∵服从正态分布N(2 000,1002),
∴μ=2 000,σ=100,
则P(1 900<ξ<2 200)=P(μ-σ<ξ<μ+σ)+[P(μ-2σ<ξ<μ+2σ)-P(μ-σ<ξ<μ+σ)]=0.682 6+(0.954 4-0.682 6)=0.818 5.故选C.
考点三,正态分布的综合应用
例3 (1)(2021·贵州贵阳为明教育集团调研)如图,在正方形ABCD中的阴影部分的上下边界分别是曲线C1和C2,其中C1是正态分布N(0,0.52)的密度曲线,C1与C2关于x轴对称,若在正方形中随机取一点,则该点取自阴影部分的概率是( C )
参考数据:随机变量Z服从正态分布N(μ,σ2)的概率为:
P(μ-σ<Z≤μ+σ)=0.682 6,
P(μ-2σ<Z≤μ+2σ)=0.954 4,
P(μ-3σ<Z≤μ+3σ)=0.997 4
A.0.682 6 B.0.954 4
C.0.477 2 D.0.498 7
(2)(2021·河南六市模拟)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:
(ⅰ)根据频率分布直方图,估计50位农民的平均年收入(单位:千元);(同一组数据用该组数据区间的中点值表示);
(ⅱ)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布N(μ,σ2),其中μ近似为年平均收入,σ2近似为样本方差s2,经计算得s2=6.92,利用该正态分布,求:
①在扶贫攻坚工作中,若使该地区约有占总农民人数的84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?
②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1 000位农民.若每位农民的年收入互相独立,问:这1000位农民中的年收入不少于12.14千元的人数最有可能是多少?
附参考数据:≈2.63,若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0.6827,P(μ-2σ<X<μ+2σ)=0.9545,P(μ-3σ<X<μ+3σ)=0.9973.
[解析] (1)因为C1是正态分布N(0,0.52)的密度曲线,
且P(μ-2σ<Z≤μ+2σ)=0.954 4,
所以P(-1<Z≤1)=0.954 4,
则阴影部分的面积S=0.954 4×2=1.908 8,
所以若在正方形中随机取一点,则该点取自阴影部分的概率是=0.477 2.故选C.
(2)(ⅰ)=12×0.04+14×0.12+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=17.40千元.
故估计50位农民的年平均收入为17.40千元.
(ⅱ)由题意知X~N(17.40,6.92),
①P(X>μ-σ)=+≈0.841 4,
所以μ-σ=17.40-2.63=14.77时,满足题意,
即最低年收入大约为14.77千元.
②由P(x≥12.14)=P(x≥μ-2σ)=0.5+≈0.977 3,
每个农民的年收入不少于12.14千元的事件的概率为0.977 3,
记1 000个农民的年收入不少于12.14千元的人数为ξ
则ξ~B(1 000,p),其中p=0.977 3
于是恰好有k个农民的年收入不少于12.14千元的事件概率为
P(ξ=k)=Cpk(1-p)1 000-k,
从而由=>1,得k<1 001p
而1 001p=978.277 3,所以,
当0≤k≤978时,P(ξ=k-1)<P(ξ=k);
当979≤k≤1 000时,P(ξ=k-1)>P(ξ=k),
由此可知,在所走访的1 000位农民中,年收入不少于12.14千元的人数最有可能是978人.
名师点拨
解决正态分布问题的三个关键点
若随机变量ξ~N(μ,σ2),则
(1)对称轴x=μ;
(2)标准差σ;
(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率
〔变式训练3〕
(2021·广西柳州铁路一中、玉林一中联考)从某公司生产线生产的某种产品中抽取1 000件,测量这些产品的一项质量指标,由检测结果得如图所示的频率分布直方图:
(1)求这1 000件产品质量指标的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(175.6<Z<224.4);
②已知每件该产品的生产成本为10元,每件合格品(质量指标值Z∈(175.6,224.4))的定价为16元;若为次品(质量指标值Z∉(175.6,224.4)),除了全额退款外且每件次品还须赔付客户48元,若该公司卖出100件这种产品,记Y表示这些产品的利润,求E(Y).
附:≈12.2,若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)≈0.68,P(μ-2σ<Z<μ+2σ)≈0.95.
[解析] (1)由题意得
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200
s2=(170-200)2×0.02+(180-200)2×0.09+(190-200)2×0.22+(200-200)2×0.33+(210-200)2×0.24+(220-200)2×0.08+(230-200)2×0.02=150.
即样本平均数为200,样本方差为150.
(2)①由(1)可知,μ=200,σ=≈12.2,
∴Z~N(200,12.22),∴P(175.6<Z<224.4)
=P(μ-2σ<Z<μ+2σ)≈0.95
②设X表示100件产品的正品数,
题意得X~B(100,0.95),∴E(X)=95,
∴E(Y)=16E(X)-48×5-100×10=280.
名师讲坛·素养提升
利用均值与方差求解决策性问题
例4 (2021·湖南益阳调研)已知6名某疾病病毒密切接触者中有1名感染病毒,其余5名未感染,需要通过化验血液来确定感染者.血液化验结果呈阳性的即为感染者,呈阴性即为未感染者.
(1)若从这6名密切接触者中随机抽取2名,求抽到感染者的概率;
(2)血液化验确定感染者的方法有:方法一是逐一化验;方法二是平均分组混合化验,先将血液样本平均分成若干组,对组内血液混合化验,若化验结果呈阴性,则该组血液不含病毒,若化验结果呈阳性,则对该组的备份血液逐一化验;直至确定感染者.
(ⅰ)采取逐一化验,求所需化验次数ξ的分布列及数学期望;
(ⅱ)采取平均分成三组混合化验(每组血液份数相同),求该分组方法所需化验次数的数学期望.
你认为选择哪种化验方案更合理?请说明理由.
[解析] (1)抽到感染者的概率P===.
(2)(ⅰ)按逐一化验法,ξ的可能取值为1,2,3,4,5,
P(ξ=1)==,P(ξ=2)==,
P(ξ=3)==,P(ξ=4)==,
P(ξ=5)==,
所以ξ的分布列为
ξ
1
2
3
4
5
P
数学期望E(ξ)=1×+2×+3×+4×+5×=.
(ⅱ)平均分成三组即按(2,2,2)分组,
记所需化验次数为η,则η=2,3,
P(η=2)=,P(η=3)=×+×=
所以η的分布列为
η
2
3
P
数学期望E(η)=2×+3×=.
因为E(ξ)>E(η),所以按平均分组法较合理.
名师点拨
随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
〔变式训练4〕
(2021·湖南郴州质检)某蔬菜种植基地有一批蔬菜需要两天内采摘完毕,天气预报显示这两天每天是否有雨相互独立,无雨的概率都为0.8.现有两种方案可以选择:
方案一:基地人员自己采摘,不额外聘请工人,需要两天完成,两天都无雨收益为2万元,只有一天有雨收益为1万元,两天都有雨收益为0.75万元.
方案二:基地额外聘请工人,只要一天就可以完成采摘,当天无雨收益为2万元,有雨收益为1万元.额外聘请工人的成本为a万元.
(1)若不额外聘请工人,写出基地收益X的分布列及基地的预期收益;
(2)该基地是否应该外聘工人?请说明理由.
[解析] (1)基地收益X的可能值为2,1,0.75,
则P(X=2)=0.8×0.8=0.64,P(X=1)=0.8×0.2+0.2×0.8=0.32,
P(X=0.75)=(1-0.8)×(1-0.8)=0.04,
故X的分布列为
X
2
1
0.75
P
0.64
0.32
0.04
则E(X)=2×0.64+1×0.32+0.75×0.04=1.63.
(2)设基地额外聘请工人时的收益为Y万元,
则其预期收益E(Y)=2×0.8+1×0.2-a=1.8 -a
E(Y)-E(X)=0.17-a
综上可得,当额外聘请工人的成本高于0.17万元时,E(X)>E(Y),不外聘工人,
当成本低于0.17万元时E(X)<E(Y),外聘工人,
当成本恰为0.17万元时,E(X)=E(Y),是否外聘工人均可以.
高考大题规范解答系列(六)——概率与统计
考点一 离散型随机变量的分布列与期望(理)
例1 (2021·山西联考)已知甲盒中有三个白球和三个红球,乙盒中仅装有三个白球,球除颜色外完全相同.现从甲盒中任取三个球放入乙盒中.
(1)求乙盒中红球个数X的分布列与期望;
(2)求从乙盒中任取一球是红球的概率.
【标准答案】——规范答题 步步得分
(1)由题意知X的可能取值为0,1,2,3.
P(X=0)==,P(X=1)==, 2分
P(X=2)==,P(X=3)==, 4分
所以X的分布列为
X
0
1
2
3
P
5分
所以E(X)=0×+1×+2×+3×=. 6分
(2)当乙盒中红球个数为0时,P1=0, 7分
当乙盒中红球个数为1时,P2=×=, 8分
当乙盒中红球个数为2,P3=×=, 9分
当乙盒中红球个数为3时,P4=×=, 10分
所以从乙盒中任取一球是红球的概率为P1+P2+P3+P4=. 12分
【评分细则】
(1)第一问中,正确算出P(X=0),P(X=1),P(X=2),P(X=3)各得1分,列出分布列得1分,求出期望得1分.
(2)第二问中,分类讨论,每种情况各占1分.
(3)其他方法按步骤酌情给分.
例2 (2019·课标Ⅰ,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈,则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈,则乙药得1分,甲药得-1分;若都治愈或都未治愈,则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
①证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
②求p4,并根据p4的值解释这种试验方案的合理性.
【标准答案】——规范答题 步步得分
(1)X的所有可能取值为-1,0,1.
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)·(1-β),
P(X=1)=α(1-β).
所以X的分布列为
X
-1
0
1
P
(1-α)β
αβ+(1-α)(1-β)
α(1-β)
4分
(2)①由(1)得a=0.4,b=0.5,c=0.1. 5分
因此pi=0.4Pi-1+0.5pi+0.1pi+1,
故0.1(pi+1-pi)=0.4(pi-pi-1),
即pi+1-pi=4(pi-pi-1). 6分
又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1的等比数列. 7分
②由①可得
p8=p8-p7+p7-p6+…+p1-p0+p0
=(p8-p7)+(p7-p6)+…+(p1-p0)=p1.
由于p8=1,故p1=,
所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)
=p1=. 10分
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003 9, 11分
此时得出错误结论的概率非常小,说明这种试验方案合理. 12分
【评分细则】
①每个式子1分,表格1分;给出X的可能取值给1分;
②得出a、b、c的值(有正确的)得1分;
③得到Pi+1-Pi=4(Pi-Pi-1)得1分;
④给出结论得1分;
⑤得出P8,P4,P1的表达式各得1分;
⑥说明P4非常小得1分;
⑦说明实验方案合理得1分.
【名师点评】
1.核心素养:本题主要考查相互独立事件的概率、随机变量的期望、方差的应用、二项分布、决策问题等,考查数据处理能力、运算求解能力,考查或然与必然思想,考查的核心素养的逻辑推理、数学建模、数学运算、数据分析.
2.解题技巧:破解此类题的关键:一是认真读题,读懂题意;二是会利用导数求最值;三是会利用公式求服从特殊分布的离散型随机变量的期望值;四是会利用期望值,解决决策型问题.
〔变式训练1〕
(2021·湖南五市十校教研教改共同体联考)某学校为了了解学生对新冠病毒的传播和预防知识的掌握情况,学校决定组织一次有关新冠病毒预防知识竞答.竞答分为必答题(共5题)和选答题(共2题)两部分.每位同学答题相互独立,且每道题答对与否互不影响.已知甲同学答对每道必答题的概率为,答对每道选答题的概率为.
(1)求甲恰好答对4道必答题的概率;
(2)在选答阶段,若选择回答且答对奖励5分,答错扣2分,选择放弃回答得0分.已知甲同学对于选答的两道题,选择回答和放弃回答的概率均为,试求甲同学在选答题阶段,得分X的分布列.
[解析] (1)甲恰好答对4道必答题的概率为
P=C4×=.
(2)依题意,每道题选择回答并答对的概率为×=,
选择回答且答错的概率为×=,
选择放弃回答的概率为.
甲得分的可能性为-4分,-2分,0分,3分,5分和10分.
所以P(X=-4)=,
P(X=-2)=C××=,
P(X=0)=×=,
P(X=3)=C×××=,
P(X=5)=C××=,
P(X=10)=××2=.
所以X的分布列为
X
-4
-2
0
3
5
10
P
考点一 随机抽样、频率分布直方图及其应用(文)
例1 (2021·河南质量测评)“不忘初心、牢记使命”主题教育活动正在全国开展,某区政府为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n名,获得了他们一周参加主题教育活动的时间(单位:时)的频率分布直方图,如图所示,已知参加主题教育活动的时间在(12,16]内的人数为92.
(1)估计这些党员干部一周参与主题教育活动的时间的平均值;
(2)用频率估计概率,如果计划对全区一周参与主题教育活动的时间在(16,24]内的党员干部给予奖励,且参与时间在(16,20],(20,24]内的分别获二等奖和一等奖,通过分层抽样方法从这些获奖人中随机抽取5人,再从这5人中任意选取3人,求3人均获二等奖的概率.
【分析】 (1)先利用频率分布“直方图中各小矩形面积为1”求出a的值,再利用各小矩形中点横坐标与该矩形面积积的和求平均值;(2)利用分层抽样的性质先求出在(16,20],(20,24]内分别抽取的人数,再用列举法求概率.
【标准答案】——规范答题 步步得分
(1)由已知可得
a=1÷4-(0.025 0+0.047 5+0.050 0+0.012 5)=0.115 0,2分
所以这些党员干部一周参加主题教育活动的时间的平均值为(6×0.025+10×0.047 5+14×0.115+18×0.05+22×0.012 5)×4=13.644分
(2)因为0.115 0×4×n=92,
所以n==200.6分
故参与主题教育活动的时间在(16,20]的人数为
0.050 0×4×200=40,
参与主题教育活动的时间在(20,24]的人数为
0.012 5×4×200=10.8分
则利用分层抽样抽取的人数:在(16,20]内为4人,9分
设为a,b,c,d;在(20,24]内为1人,设为A,
从这5人中选取3人的事件空间为:{(a,b,c),(a,b,d),(a,b,A),(a,c,d),(a,c,A),(a,d,A),(b,c,d),(b,c,A),(b,d,A),(c,d,A)},共10种情况,10分
其中全是二等奖的有4种情况.11分
故P==.12分
【评分细则】
①列对算式计算错误得1分,全对得2分;
②列对算式计算错误得1分,全对得2分;
③计算错误不得分;
④求对(20,24],(16,20]上人数各得1分;
⑤求对(20,24]或(16,20]内抽取人数得1分;
⑥列举出事件空间得1分,数对数目得1分;求对概率得1分.
【名师点评】
本题主要考查随机抽样、频率分布直方图及概率,考查学生数据处理能力、运算能力.
〔变式训练1〕
(2020·四川成都诊断)2019年12月,《生活垃圾分类标志》新标准分布并正式实施.为进一步普及生活垃圾分类知识,了解居民生活垃圾分类情况,某社区开展了一次关于垃圾分类的问卷调查活动,并对随机抽取的1 000人的年龄进行了统计,得到如下的各年龄段频数分布表和各年龄段人数频率分布直方图:
组数
分组
频数
第一组
[25,30)
200
第二组
[30,35)
300
第三组
[35,40)
m
第四组
[40,45)
150
第五组
[45,50)
n
第六组
[50,55]
50
合计
1 000
(1)请补全各年龄段人数频率分布直方图,并求出各年龄段频数分布表中m,n的值;
(2)现从年龄在[30,40)段中采用分层抽样的方法选取5名代表参加垃圾分类的知识交流活动,应社区要求,从被选中的这5名代表中任意选2名作交流发言,求选取的2名发言者中恰有1名年龄在[35,40)段中的概率.
[解析] (1)∵第三组的频率为1-(0.04+0.06+0.03+0.02+0.01)×5=0.2,
∴第三组直方图的高为=0.04.
补全频率分布直方图如下图:
由频率分布直方图,知m=0.02×1 000=200,
n=0.02×(50-45)×1 000=100.
(2)由(1)知年龄在[30,35)段中的人数与年龄在[35,40)段中的人数的比值为=,所以采用分层抽样法抽取5名,年龄在[30,35)段中的有3名,年龄在[35,40)段中的有2名.
不妨设年龄在[30,35)段中的3名为A1,A2,A3,年龄在[35,40)段中的2名为B1,B2由于从5名代表中任选2名作交流发言的所有可能情况有:{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10种,
其中选取的2名发言者中恰有1名年龄在[35,40)段的情况有:{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B2},{A3,B2},共6种.
故所求概率为P==.
考点二 线性回归分析
例3 (2018·全国2)下图是某地区2000年至2016年环境基础设施投资y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①;=-30.4+13.5t,根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【分析】 (1)模型①中取t=19,模型②中取t=9,求出对应的函数值即可;(2)利用所给折线图中数据的增长趋势,加以分析即可.
【标准答案】——规范答题 步步得分
(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=-30.4+13.5×19=226.1(亿元). 3分
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元). 6分
(2)利用模型②得到的预测值更可靠. 8分
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始
展开阅读全文