资源描述
§14.6 离散型随机变量及其分布列、均值与方差
(对应答案分册第54~56页)
1.随机变量的有关概念
(1)随机变量:随着试验结果的变化而变化的变量,常用字母X,Y,ξ,η,…表示.
(2)离散型随机变量:所有取值可以一一列出的随机变量.
2.离散型随机变量的分布列及其性质
(1)概念:一般地,若离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,则下表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
称为离散型随机变量X的概率分布列,简称为X的分布列,有时为了表达简单,也用等式P(X=xi)=pi,i=1,2,…,n表示X的分布列.
(2)离散型随机变量的分布列的性质
①pi≥0(i=1,2,…,n);
②∑ i=1npi=1.
3.两点分布
(1)若随机变量X服从两点分布,则其分布列为
X
0
1
P
1-p
p
其中p=P(X=1)称为成功概率.
(2)超几何分布
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=CMkCN-Mn-kCNn,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.
X
0
1
…
m
P
CM0CN-Mn-0CNn
CM1CN-Mn-1CNn
…
CMmCN-Mn-mCNn
若随机变量X的分布列具有上表的形式,则称随机变量X服从超几何分布.
4.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)D(X)=∑ i=1 n(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根D(X)为随机变量X的标准差.
5.均值与方差的性质
(1)E(aX+b)=aE(X)+b;
(2)D(aX+b)=a2D(X)(a,b为常数).
(1)随机变量的线性关系
若X是随机变量,Y=aX+b,a,b是常数,则Y也是随机变量.
(2)分布列性质的两个作用
①利用分布列中各事件概率之和为1可求参数的值.
②随机变量ξ所取的值分别对应的事件是两两互斥的,利用这一点可以求相关事件的概率.
【概念辨析】
1.判断下列结论是否正确.(对的打“√”,错的打“×”)
(1)在离散型随机变量的概率分布列中,各个概率之和可以小于1.( )
(2)随机变量的均值是常数,样本的平均值是随机变量.( )
(3)若随机变量X的分布列由下表给出,
X
2
5
P
0.3
0.7
则它服从两点分布.( )
(4)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量平均程度越小.( )
【对接教材】
2.天气预报,在元旦假期甲地降雨概率是0.2,乙地降雨概率是0.3.假设在这段时间内两地是否降雨相互之间没有影响,则这两地中恰有一个地方降雨的概率为 .
3.已知X的分布列为
X
-1
0
1
P
12
13
16
设Y=2X+3,则E(Y)= .
【易错自纠】
4.已知两个随机变量X,Y满足X+2Y=4,且X~N(1,22),则E(Y)= ,D(Y)= .
5.已知随机变量ξi满足P(ξi=1)=pi,P(ξi=0)=1-pi,i=1,2.若0<p1<p2<12,则( ).
A.E(ξ1)<E(ξ2),D(ξ1)<D(ξ2)
B.E(ξ1)<E(ξ2),D(ξ1)>D(ξ2)
C.E(ξ1)>E(ξ2),D(ξ1)<D(ξ2)
D.E(ξ1)>E(ξ2),D(ξ1)>D(ξ2)
离散型随机变量的分布列的性质 【题组过关】
1.(2022·北京入学定位考试)设随机变量ξ的分布列如下:
ξ
1
2
3
4
5
6
P
a1
a2
a3
a4
a5
a6
其中a1,a2,…,a6构成等差数列,则a1·a6的( ).
A.最大值为19 B.最大值为136
C.最小值为19 D.最小值为136
2.(2022·山东月考)若离散型随机变量X的概率分布规律为P(X=n)=an(n+1)(n=1,2,3,4),其中a是常数,则P12<X<52的值为 .
3.设随机变量X的分布列为
X
1
2
3
4
P
13
m
14
16
则P(|X-3|=1)=( ).
A.712 B.512 C.14 D.16
点拨 离散型随机变量分布列的性质的应用:(1)利用分布列中各概率之和为1可求参数的值,此时要注意检验,以保证每个概率值均为非负值.(2)若X为随机变量,则2X+1仍然为随机变量,求其分布列时可先求出相应的随机变量的值,再根据对应的概率写出分布列.
分布列及其均值方差 【考向变换】
考向1 离散型随机变量分布列、均值与方差的计算
(2022·河南信阳质检)随着互联网金融的发展,很多平台都推出了自己的虚拟信用支付,比较常用的有蚂蚁花呗、京东白条.花呗与信用卡有一个共同点就是可以透支消费,对于很多90后来说,他们更习惯提前消费.某研究机构随机抽取了1000名90后,对他们的信用支付方式进行了调查,得到如下统计表:
信用支付
方式
银行信
用卡
蚂蚁
花呗
京东
白条
其他
人数
300
a
150
50
每个人都仅使用一种信用支付方式,各人支付方式相互独立,以频率估计概率.
(1)估计90后使用蚂蚁花呗的概率;
(2)在所抽取的1000人中用分层抽样的方法在使用银行信用卡和蚂蚁花呗的人中随机抽取8人,再在这8人中随机抽取4人,记X为这4人中使用蚂蚁花呗的人数,求X的分布列及数学期望和方差.
点拨 求离散型随机变量的均值与方差的关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
【追踪训练1】(2022·安徽四校联考)五一劳动节放假,某商场进行一次大型抽奖活动.在一个抽奖盒中放有红、橙、黄、绿、蓝、紫的小球各2个,分别对应1分、2分、3分、4分、5分、6分.从袋中任取3个小球,按3个小球中最大得分的8倍计分,计分在20分到35分之间即为中奖.每个小球被取出的可能性都相等,用ξ表示取出的3个小球中最大得分,求:
(1)取出的3个小球颜色互不相同的概率;
(2)随机变量ξ的分布列和数学期望;
(3)某人抽奖一次,中奖的概率.
考向2 两个随机变量的均值、方差大小比较
(2022·浙江杭州模拟)已知甲盒中有2个红球,1个蓝球,乙盒中有1个红球,2个篮球,从甲、乙两个盒中各取1球放入原来为空的丙盒中,现从甲盒中取1个球,记红球的个数为ξ1,从乙盒中取1个球,记红球的个数为ξ2,从丙盒中取1个球,记红球的个数为ξ3,则下列说法正确的是( ).
A.E(ξ1)>E(ξ3)>E(ξ2),
D(ξ1)=D(ξ2)>D(ξ3)
B.E(ξ1)<E(ξ3)<E(ξ2),
D(ξ1)=D(ξ2)>D(ξ3)
C.E(ξ1)>E(ξ3)>E(ξ2),
D(ξ1)=D(ξ2)<D(ξ3)
D.E(ξ1)<E(ξ3)<E(ξ2),
D(ξ1)=D(ξ2)<D(ξ3)
点拨 比较期望、方差的大小,首先要弄清随机变量取某值时对应的随机事件的含义并确定合理的概率计算方法,列出分布列,一般作差比较大小.
【追踪训练2】(2022·河北衡水模拟)已知x1,x2,x3∈R,x1<x2<x3,设y1=x1+x22,y2=x2+x32,y3=x3+x12,z1=y1+y22,z2=y2+y32,z3=y3+y12.若随机变量X,Y,Z满足P(X=xi)=P(Y=yi)=P(Z=zi)=13(i=1,2,3),则( ).
A.D(X)<D(Y)<D(Z)
B.D(X)>D(Y)>D(Z)
C.D(X)<D(Z)<D(Y)
D.D(X)>D(Z)>D(Y)
考向3 实际问题中的均值、方差的求解
(2022·山东泰安第一次质检)某投资公司在2020年年初准备将1000万元投资到“低碳”项目上,现有两个项目可供选择:
项目一:新能源汽车,据市场调研,投资到该项目上,到年底可能获利40%,也可能亏损10%,且这两种情况发生的概率分别为35和25.
项目二:通信设备,据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为35,13和115.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.
点拨 均值与方差的实际应用:(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用D(X)来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
【追踪训练3】(2022·湖北武汉模拟)某保险公司对一个拥有20000人的企业推出一款意外险产品,每年每位职工只要交少量保费,发生意外后可一次性获得若干赔偿金,保险公司把企业的所有岗位共分为A,B,C三类工种,从事这三类工种的人数分别为12000,6000,2000,由历史数据统计出三类工种的赔付频率如下表(并以此估计赔付概率):
工种类别
A
B
C
赔付频率
1105
2105
1104
已知A,B,C三类工种的职工每人每年保费分别为25元、25元、40元,出险后的赔偿金额分别为100万元、100万元、50万元,保险公司在开展此项业务过程中的固定支出为每年10万元.
(1)求保险公司在该业务所获利润的期望值.
(2)现有如下两个方案可供企业选择:
方案1:企业不与保险公司合作,职工不交保险,出意外企业自行拿出与保险公司提供的等额赔偿金赔偿付给意外职工,企业开展这项工作的固定支出为每年12万元;
方案2:企业与保险公司合作,企业负责职工保费的70%,职工个人负责保费的30%,出险后赔偿金由保险公司赔付,企业无额外专项开支.
请根据企业成本差异给出选择合适方案的建议.
超几何分布 【典例迁移】
(2022·山东潍坊摸底考试)在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用.现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.
(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;
(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列.
点拨 (1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.
(2)超几何分布的特征是:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体个数X的概率分布.
(3)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.
【追踪训练4】(2022·福建四校联考)每年暑期都会有大量中学生参加名校游学,夏令营等活动,某中学学生社团将其今年的社会实践主题定为“中学生暑期游学支出分析”,并在该市各个中学随机抽取了共3000名中学生进行问卷调查,根据问卷调查发现共1000名中学生参与了各类游学、夏令营等活动,从中统计得到中学生暑期游学支出(单位:百元)频率分布直方图如图所示.
(1)求实数a的值.
(2)在[45,50),[50,55),[55,60)三组中利用分层抽样的方法抽取10人,并从抽取的10人中随机选出3人,对其消费情况进行进一步分析.
①求每组恰好各被选出1人的概率;
②设ξ为选出的3人中[45,50)这一组的人数,求随机变量ξ的分布列.
求分布列的方法
求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在求解时,要注意应用计数原理、古典概型等知识.
(2022·安阳模拟)某公司为了准确把握市场,做好产品计划,特对某产品做了市场调查:先销售该产品50天,统计发现每天的销售量x分布在[50,100)内,且销售量x的分布频率f(x)=n10-0.5,10n≤x<10(n+1),n为偶数,n20-a,10n≤x<10(n+1),n为奇数.
(1)求a的值并估计销售量的平均数.
(2)若销售量大于或等于70,则称该日畅销,其余为滞销.在畅销日中用分层抽样的方法随机抽取8天,再从这8天中随机抽取3天进行统计,设这3天来自X个组,求随机变量X的分布列及数学期望(将频率视为概率).
求离散型随机变量X的分布列的步骤:(1)理解X的意义,写出X可能取的全部值;(2)求X取每个值的概率;(3)写出X的分布列.
【突破训练1】长春市的“名师云课”活动自开展以来获得广大家长和学生的高度赞誉,在推出的第二季名师云课中,数学学科共计推出36节云课,为了更好地将课程内容呈现给学生,现对某一时段云课的点击量进行了统计:
点击量
[0,1000]
(1000,3000]
(3000,+∞)
节数
6
18
12
(1)现从36节云课中采用分层抽样的方法选出6节,求选出的点击量超过3000的节数;
(2)为了更好地搭建云课平台,现将云课进行剪辑,若点击量在区间[0,1000]内,则需要花费40分钟进行剪辑,若点击量在区间(1000,3000]内,则需要花费20分钟进行剪辑,点击量超过3000,则不需要剪辑,现从(1)中选出的6节课中随机取出2节课进行剪辑,求剪辑时间X的分布列.
均值、方差求最值问题的求解策略
已知均值(方差)求最值问题的一般思路:①构造函数求最值;②构造基本不等式求最值.
(2022·浙江长兴模拟)已知随机变量ξ的分布列如下,则D(ξ)的取值范围是( ).
ξ
2
0
-2
P
14
12-a
14+b
A.0,34 B.[0,3]
C.34,32 D.34,3
这类问题的关键是求出离散型随机变量的方差的表达式,转化为函数问题,利用函数的性质求最值.
【突破训练2】(2022·山东聊城模拟)随机变量ξ的分布列为
ξ
0
1
2
P
a
b2
b2
其中ab≠0,下列说法不正确的是( ).
A.a+b=1
B.E(ξ)=3b2
C.D(ξ)随b的增大而减小
D.D(ξ)有最大值
链接《精练案》分册P101
展开阅读全文