1、临夏志成中学985班统计概率讲义 统计学与概率论的区别与联系 区别:统计学反应已经发生的事实的结果,概率论研究未来发生的随机事件的可能性 联系:概率论以统计学的研究为基础 统计学 普查 收集数据 简单随机抽样 抽样调查 分层抽样 系统抽样 统 茎叶图 整理数据 频率分布直方图 计 集中分析 样本分析
2、 学 分析数据 离散分析 总体估计 线性回归 应用数据 独立性检验 一、收集数据 1.普查:需要耗费大量的人力、物力、财力,一般在总体很少时采用 2.抽样调查:从调查的总体中抽取一部分个体组成一个样本进行研究 其中样本中含有的个体数称为该样本的样本容量 ①简单随机抽样 适用条件:总体数较少,且没有明显的结构差异 常用方法:随机数表法,抽签法,抓阄法 例:用随机数表从300个调查对象中抽出10个个体
3、个体进行研究 随机数表如下:582146697521520365412862541231023203321003320015845975 102584769254106350215846202158214446258429702158036489320125412547021 则抽取出的10个个体的编号为 ②分层抽样 适用条件:总体数较多,且有明显的结构差异 本质:样本中各层次的比例与总体中各层次的比例相同 例:志成中学从小学600,初中300,高中100抽取20人进行校长
4、访谈,则分别抽取的人数为 ③系统抽样 适用条件:总体数很多,无明显结构差异 操作步骤: 第一步:编号,将总体中所有的个体从1开始编号,一直到N(N为最后一个人编号) 第二步:确定组数,样本容量n即为组数 第三步:确定间隔T(此步较为重要):[即T为N除以n的商的整数部分,不管小数部分多大,只取整数] 第四步:分组,从编号1开始,每T个个体构成一组,共n组,多余的人省略 第五步:在第一组中抽取:采取随机抽样的方法抽取到编号为的个体 第六步:抽取样本:在剩
5、下的n-1组中每组只抽取一个个体,遵循以下原则: 编号分别为: 例:从320个学生中采用系统抽样的方法抽取10个学生参加篮球赛,请你 写出一组满足条件的学生编号: 例2:志成中学840人参加野外宿营,其中编号为1-360的360人在I区宿 营,依次下来280人在A区,其余人在B区,先采用系统抽样的方法抽取 28位同学作为区安全员,若在第一组中抽到的编号为12,则三区的区安全 员人数分别为 最后需要特别强调的是,不管采用哪一种抽样方法
6、每个个体被抽到的概率始终是相等的。 二、整理数据 采用抽样方法收集的数据比较杂乱,需要进行整理,是数据有序,目前比较常用的两种方法:茎叶图,频率分布直方图 1.茎叶图 适用条件:样本容量较少 优势:①保留了原始数据;②便于比较两个样本 操作:选择合适的数作为茎,茎确定后,将对应的数写到前面或后面作为叶 例:(2015年全国卷2)某公司为了解用户对其产品的满意度,从,两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 9
7、5 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79 (Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可); (Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个等级: 满意度评分 低于70分 70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 记事件C:“A地区用户的满意度等级
8、高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率. 2.频率分布直方图 适用条件:样本容量较大 不足:丢失了原有数据,只能保留数据的大致范围 操作步骤: 第一步:求极差:收集得到的数据中的最大值-最小值=极差L 第二步:确定组距d,根据收集的数据选择合适的数据,以各组中含有 的个体数差异不要过大为原则 第三步:确定组数n:[与系统抽样不同的是,系统抽样只取 商的整数,而在频率分布直方图这儿,不管商的小数部分有多小, 我们都要给整数部分+1,为什么呢?例:极差L:2
9、0.4,组距d:5 则组数n=5()] 第四步:列频率分布表(如下) 分组 频数累计 频数 频率 合计 样本容量 1 说明①所谓频数累计,在整理数据时,对于某个数据,该数据属于哪一 组,则改组的频数增加1 ②频数/样本容量;频数=样本容量*频率 样本容量=频数/频率 ③频数之和为样本容量,频率之和为1 第五步:根据频率分布表做出频率分布直方图 频率/组距
10、 分组 说明:①标准的频率分布直方图纵坐标应该为 频率/组距,但需注意高 考题目中给出的直方图中纵坐标可能为 频率 或者 频数,一定注意 观察纵坐标表示。 ②对于标准的频率分布直方图,每一段直方的面积表示该组的频率 ③频率之和为1 ④注意 频率分布表 与 频率分布直方图 的区别于联系 (2014年广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下: 根据上述数据得到样本的频率分布表如下: (1)确定样本频率分布表中和的值; (2)
11、根据上述频率分布表,画出样本频率分布直方图; (3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,50]的概率。 例2:某班同学利用国庆节进行社会实践,对岁的人群随机抽取人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图: (Ⅰ)补全频率分布直方图并求、、的值; (Ⅱ)从岁年龄段的“低碳族”中采用分层抽样法抽取人参加户外低碳体验活动,其中选取人作为领队,记选取的名领队中年龄在岁的人数为,求的分布列和期望。 例3(20
12、13年全国2)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润. (1)将T表示为X的函数; (2)根据直方图估计利润T不少于57 000元的概率; (3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落 入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量
13、X∈[100,110),则 取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的数学期望 例4:(2016年全国卷1)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图: 以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记表示2台机器三年内共需更换的易损
14、零件数,表示购买2台机器的同时购买的易损零件数. (I)求的分布列; (II)若要求,确定的最小值; (III)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个? 三、分析数据 对数据进行整理后,我们对样本的数据进行分析,并用对样本数据的分析估计总体的趋势 1.集中分析 集中分析反映样本数据的集中程度,主要有以下指标 ①众数:样本数据中最多的数 I、对于茎叶图或者保留了原始数据的样本,众数即为最多的数 II、对于频率分布直方图,众数为频率最大(直方最高)组的组中点值 ②中位数:样本数据最中间的数 I、对于茎叶
15、图或者保留了原始数据的样本,首先将数据按照从小到 大或者从大到小的顺序进行排列,当数据共有奇数个时,最中间的那个 数为该组数据的中位数;当数据共有偶数个时,最中间两个数之和的一 半为该组数据的中位数 II、对于频率分布直方图,中位数为使得该数两边的频率分别为的 0.005 0.010 0.020 0.030 0.035 0.015 0.025 那个数,具体操作见例: 临夏志成中学高中生的体重频率分步 直方图如左图所示,则该校学生体重的中 位数为
16、 40 50 60 70 80 90 体重(kg) 分析:中位数是中间的数,在频率分
17、布直方图中,中位数两端的频率相等, 均为,第一组的频率为 第二组的频率为 前两组频率和为 第三组的频率为 前三组频率和为 也就是说,中位数应该在第三组之中,且频率应该为 即第三组中所占的面积为,令底长为,则,即 所以中位数为 ③平均数 I、对于茎叶图或者保留了原始数据的样本,平均数为算数平均数,即 II、对于频率分布直方图,平均数为加权平均数,为各组数的组中点值 与该组的频率(即直方的面积)乘积之和,即 例:以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的
18、中位数为,乙组数据的平均数为,则的值分别为 2.离散分析:分析数据的离散程度或者波动程度,主要指标有: ①极差:极差即样本的最大值与最小值之差 ②方差:方差是反映离散程度最佳指标,方差大,离散程度相对大一些,或 者说数据相对不太稳定,波动性较大 I、对于茎叶图或者保留了原始数据的样本,方差为: 变式: 例:(2013年全国卷1)现有个数,其平均数是,且这个数的平方和是, 那么这个数组的方差是( ) A. B.4
19、 C.9 D.16 II、对于频率分布直方图,方差的计算方式较为复杂,但和I几乎一样, 先按照前面讲的公式计算平均数,在按照下列公式计算方差: (为各组的组中间值) 为各组对应的频率 ③标准差:不管哪一种情况,标准差为方差的算术平方根:标准差 例(2014年全国1卷)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图: 求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表); 同时还需要强调的是,希望各位同学会对茎叶图做出相应
20、的 分析,具体的可以详见课本必修3第70页,一般从离散和集中 两个角度进行。 例:甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ) 甲的成绩的平均数小于乙的成绩的平均数 甲的成绩的中位数等于乙的成绩的中位数 甲的成绩的方差小于乙的成绩的方差 甲的成绩的极差小于乙的成绩的极差 四、运用数据: 1.线性回归(注意非线性回归的线性转换) ①线性回归分析两个变量间的线性关系:一个为自变量,另一个为因变量 ②线性关系的衡量:(散点图从图像角度,相关系数从代数角度分别进行衡量) 1)散点图
21、以自变量的值为横坐标,对应的因变量的值为纵坐标, 在平面直角坐标系标出所有对应的点形成的图像 I.当所有点分布在从左下到右上的区域时,因变量与自变量正相关 即:因变量随着自变量的增大图像趋势上增大 II.当所有点分布在从左上到右下的区域时,因变量与自变量负相关 即:因变量随着自变量的增大图像趋势上减小 例:对变量x, y 有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散点图2. 由这两个散点图可以判断( ) (A)变量
22、x 与y 正相关,u 与v 正相关 (B)变量x 与y 正相关,u 与v 负相关 (C)变量x 与y 负相关,u 与v 正相关 (D)变量x 与y 负相关,u 与v 负相关 例2:变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5); 变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).表 示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则 ( ) A. B. C.
23、D. 2)相关系数 相关系数从代数角度衡量因变量与自变量的相关关系,做如下说明: a.相关系数 b.,完全正相关,即:因变量随着自变量的增大一定增大 ,正相关,即:因变量随着自变量的增大趋势上增大 越大,正相关性越强 c. ,完全负相关,即:因变量随着自变量的增大一定减小 ,负相关,即:因变量随着自变量的增大趋势上减小 越小,负相关性越强
24、 d. ,自变量与因变量无线性相关性 注意:“越大,相关性越强”这种说法是错误的。为什么呢? 例:已知收集到的数据在散点图中所有的点都在直线上,则两个变量的相 关系数 ③线性回归直线 a.线性回归直线较为准确的给出了因变量与自变量的线性代数关系 b.回归直线使得散点图中的点比较均匀地分布在回归直线两侧,但不意味着直线两端的点个数一定相同 c.线性回归直线的参数的估计值的计算采用最小二乘法,所谓最小二乘法是使得实际值与估计值的差的平方和最小的一种方法,在该种方法下,求得的参数使得回归直线是最佳的一条 d.,
25、 e.线性回归直线一定经过样本中心点 f.回归直线的斜率与相关系数r符号相同,但是与r数值没有关系,同时表示自变量每变化一个单位,因变量变化个单位 g. 通过回归直线计算出的因变量值是一个预报值,在实际值的上下 例:已知变量与正相关,且由观测数据算得样本的平均数,,则由 观测的数据得线性回归方程可能为( ) 例2:根据如下样本数据 x 3 4 5 6 7 8 y 4.0 2.5 0.5 得到的回归方程为,则( ) A. B. C.
26、 D. 例3:设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71, 则下列结论中不正确的是( ) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重比为58.79kg ④回归直线的拟合精度衡量: 所谓拟合精度就是估计值与实际值的接近程度,拟合精度越高,通过回归直线所得的估计值与实际值越接近 需要说明的是
27、对于一组数据,我们通过最小二乘法得到的回归直线已经是拟合度最高的一条直线,因此拟合精度高低比较一般在不同的两组或多组数据间进行 拟合精度的衡量方法主要有两种: 残差图从图像角度进行衡量,相关指数从代数角度进行衡量 1)残差图 第一步:计算残差() 第二步:做平面直角坐标系:对样本个体进行编号,做平面直角坐标系, 横坐标为编号,纵坐标为残差 第三步:标出各个个体的残差(残差可能为正也可能为负) (具体步骤可以查看选修2-3第84页) 当残差图残差点分布的水平带状区域宽度越窄,拟合精度越高 2)相关指数 当相关指数越大(越接近1但小于1)
28、拟合精度越高 注意:相关系数衡量的是两个变量之间线性相关性强弱 相关指数衡量的回归直线估计值与实际值的拟合程度 例:(2014年新课标2)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (Ⅰ)求y关于t的线性回归方程; (Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯
29、收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为: , 例2:(2016年全国卷3)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明 (II)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。 ,,, 对于非线性相关,通过替换转换成为线性相关问题,记得最后将替换的还原 例:(2015年全国卷1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千
30、元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值. 年销售量/t 年宣传费(千元) 46.6 56.3 6.8 289.8 1.6 1469 108.8 表中,, = (Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程; (Ⅲ)以知这种产品的年利率z与x、y的关系为z
31、=0.2y-x.根据(Ⅱ)的结果回答下列问题: (1)年宣传费x=49时,年销售量及年利润的预报值是多少? (2)年宣传费x为何值时,年利率的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…….. (un vn),其回归线v=u的斜率和截距的最小二乘估计分别为: 2、独立性检验 ①收集数据,填写二联表 ②假设无关,计算统计量 对此做出如下说明:(以例子展开) a.假设事件A与事件B无关,根据概率论中的独立事件即 ③将计算的统计量与标准的无关数
32、值概率分布表比较,得出结论 例:通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由算得,. 0.050 0.010 0.001 3.841 6.635 10.828 附表: 参照附表,得到的正确结论是 A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D
33、.有99%以上的把握认为“爱好该项运动与性别无关” 例2:为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下: (Ⅰ)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (Ⅱ)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (Ⅲ)根据(Ⅱ)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.[来源:Z*xx*k.] 概率论 1.相关概念: 随机事件:可能发生也可能不能不发
34、生的事件 ①事件 必然事件:一定发生 确定事件 不可能事件:一定不发生 ②因为随机事件有多种可能,我们需用相关的实验用发现所有的可能,我们把每一种可能称为一个基本事件 ③随机事件可能包含实验发现的多个基本事件 ④概率:1.衡量随机事件发生的可能性的大小 2.对于一个确定的随机事件,概率是其本质属性,不会随外界条件的改 变而改变 3.为了测量概率,我们用大量实验群的频率来发现概率,实验群的频率 总是围绕着概率上下波动 ⑤1.几何概型:常见的有长度、面积(特别爱和微积分结合考察)、体积三种形
35、式 例1:设y=f(x)为区间[0,1]上的连续函数,且恒有0≤f(x) ≤1,可以用随机模拟方法近似计算积分,先产生两组(每组N个)区间[0,1]上的均匀随机数,…,和,…,,由此得到N个点(,)(i=1,2,…,N),在数出其中满足≤((i=1,2,…,N))的点数,那么由随机模拟方法可得积分的近似值为 . 例2:设不等式组表示的平面区域为,在区域内随机取一个点,则此点到坐标原点的距离大于2的概率是( ) A. B. C. D. 2.古典概型:1.每一个基本事件等可能出现,(N
36、为对应实验发现的所有基本事件数,为随机事件A包含的基本事件数) 2.为了计算古典概型,现代数学一般用排列组合知识计算、N 3.对于排列组合知识,需要着重掌握: i、元素不同,元素与位置相等的全排列 注意特殊元素、特殊位置、捆绑法、插空法、排除法等方法 ii、元素不同,元素与位置不相等的全排列问题 iii、元素相同,元素与位置不相等的全排列问题(隔板法) 同时希望大家对错序排列有点印象
37、 例(2010年浙江卷):有4位同学在同一天的上、下午参加“身高与体重”、“立定跳远”、“肺活量”、“握力”、“台阶”五个项目的测试,每位同学上、下午各测试一个项目,且不重复。若上午不测“握力”项目,下午不测“台阶”项目,其余项目上下午都各测试一人,则不同的安排方式共有 种(用数字作答)。 4.跟排列组合相对应,二项式定理是一个高考必考考点 1)二项展开式 注意:标准的二项展开式是按照括号里后一项进行升幂展开的 因而有第k+1项: 2)基本概念 项:展开式中的()称为展开式的项 二项式系数:称为第k+1项的二项式系数 二项式系数之和:对于,其二项式
38、系数之和为(在二项展开式中令即可证明,赋值法也是我们后面求系数之和的主要方法) 偶数项二项式系数之和=偶数项二项式系数之和=(在二项展开式中先令,再令,两式相加减即可) 系数:对于含有变量x的二项展开式我们把每一项的常数部分称为 该项的系数 例如:的第四项为 二项式系数 系数 项 系数之和:令即可求得系数之和 偶数项系数之和和奇数项系数之和:令和得到两个式子,加减 两式即可得到奇数项和偶数项系数之和。 二项式系数最
39、大值:当n为奇数时,总共有偶数项,中间两项(第项)的二项式系数最大 当n为偶数时,共有奇数项,中间项(第项)的二项式系数最大 系数最大值:需要将第k-1,k,k+1项的系数表示出来,求解不等式 例:(2015年天津卷)在 的展开式中, 的系数为 例2:(2015年湖北卷)已知的展开式中第4项与第8项的二项式系数相等,则奇数项的二项式系数和为( ) A. B. C. D. 例3(2011年新课标卷)的展开式中各项系数的和为2,则该展开式中常数项为( ) (A)-
40、40 (B)-20 (C)20 (D)40 ②(2011年重庆卷)的展开式中的系数相等,则n= (A)6 (B)7 (C)8 (D)9 ③,则= 1、(2012年安徽卷)6位同学在毕业聚会活动中进行纪念品的交换,任意两位同学之间最多交换一次,进行交换的两位同学互赠一份纪念品,已知6位同学之间共进行了13次交换,则收到份纪念品的同学人数为( ) 或 或 或 或 2.高三368班5个人排成一排,马
41、秀兰、罗文英不能相邻,且马秀兰必须与马启林相邻,则共有 种排法(用数字表示) 3. 设集合,那么集合A中满足条件“”的元素个数为( ) A.60 B90 C.120 D.130 4.(2014年福建卷)用代表红球,代表蓝球,代表黑球,由加法原理及乘法原理,从1个红球和1个篮球中取出若干个球的所有取法可由的展开式表示出来,如:“1”表示一个球都不取、“”表示取出一个红球,面“”用表示把红球和篮球都取出来.以此类推,下列各式中,其展开式可用来表示从5个无区别的红球、5个有区别的黑球中取出若干个球,且所有的篮球都取出或都不取出的所有取法的是 A
42、 B. C. D. ⑥条件概率:在事件A确定发生的条件下事件B发生的概率 条件概率看似很难,其实比较简单,现有两种计算方法 1.在A发生的基础上直接计算事件B的概率 2.利用(AB代表事件A、B同时发生) 例1:从3本物理书,2本数学书,4本语文书抽出三本,求在先抽出一本物理书的同时再抽出一本数学书的概率为 例2:某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( ) A. 0.8
43、 B. 0.75 C. 0.6 D. 0.45 例2:(2016年全国2) 某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下: 上年度出险次数 0 1 2 3 4 5 保费 0.85a a 1.25a 1.5a 1.75a 2a 设该险种一续保人一年内出险次数与相应概率如下: 一年内出险次数 0 1 2 3 4 5 概率 0.30 0.15 0.20 0.20 0.10 0. 05 (I)求一续保人本年度的保费高于基本保费的概率;
44、 (II)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (III)求续保人本年度的平均保费与基本保费的比值. ⑦随机变量与分布列、数学期望 随机变量:找出一个随机事件所对应的实验所有的可能,用数值表示这些可能 (随机事件可能包含了一个或几个随机变量的取值) 分布列:列出随机变量的所有可能取值与对应概率的表格 所有概率取值一定为1 数学期望:是随机变量的所有取值的加权平均值() 数学期望是对随机变量的一种预测平均值,不同于统计学的平均数, 统计学中的平均数是一
45、系列确定的、已经发生的数据的平均值 例:某游戏的得分为,随机变量表示小白玩该游戏的得分. 若,则小白得分的概率至少为 . 若变量X、Y存在线性关系,即,则 常见的随机变量分布: 二项分布:1.在一系列发生的独立重复试验中,每一次试验中事件A发生的概率相同,以n次试验中事件A发生的次数作为随机变量 2.记作随机变量(可以看作随机变量的分布列,不需要额外再写分布列的表格形式) 3., 例1:(2015年广东卷)已知随机变量服从二项分布,若,,则 . ②(2009年全国新课
46、标卷)某种种子每粒发芽的概率都为0.9,现播种了1000粒,对于没有发芽的种子,每粒需再补种2粒,补种的种子数记为X,则X的数学期望为( ) (A)100 (B)200 (C)300 (D)400 例2:投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( ) (A)0.648 (B)0.432 (C)0.36 (D)0.312 例3:①(2012年天津卷)现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可
47、供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (Ⅰ)求这4个人中恰有2人去参加甲游戏的概率; (Ⅱ)求这4个人中去参加甲游戏的分布列与期望; (Ⅲ)用,分别表示这4个人中去参加甲、乙游戏的人数,记,求随机变量的分布列与数学期望. ②(2012年四川卷)某居民小区有两个相互独立的安全防范系统(简称系统)和,系统和在任意时刻发生故障的概率分别为和。 (Ⅰ)若在任意时刻至少有一个系统不发生故障的概率为,求的值; (Ⅱ)设系统在3次相互独立的
48、检测中不发生故障的次数为随机变量,求的概率分布列及数学期望。 ③根据以往统计资料,某地车主购买甲种保险的概率为0.5,购买乙种保险但不购买甲种保险的概率为0.3.设各车主购买保险相互独立. (Ⅰ)求该地1位车主至少购买甲、乙两种保险中的1种的概率; (Ⅱ)表示该地的100位车主中,甲、乙两种保险都不购买的车主数,求的期望. 跟二项分布的变式题型考察的比较多: 例1:一款击鼓小游戏的规则如下:每盘游戏都需要击鼓三次,每次击鼓要么出现一次音乐, 要么不出现音乐;每盘游戏击鼓三次后,出现一次音乐获得10分,出现两次音乐获
49、得20 分,出现三次音乐获得100分,没有出现音乐则扣除200分(即获得分)。设每次击 鼓出现音乐的概率为,且各次击鼓出现音乐相互独立。 (1)设每盘游戏获得的分数为,求的分布列; (2)玩三盘游戏,至少有一盘出现音乐的概率是多少? (3)玩过这款游戏的许多人都发现,若干盘游戏后,与最初的分数相比,分数没有增加反而减少了。请运用概率统计的相关知识分析分数减少的原因。 例2:乒乓球比赛规则规定:一局比赛,双方比分在10平前,一方连续发球2次后,对方再连续发球2次,依次轮换。每次发球,胜方得1分,负方得0分。设在甲、乙的比
50、赛中,每次发球,发球方得1分的概率为0.6,各次发球的胜负结果相互独立。甲、乙的一局比赛中,甲先发球。 (Ⅰ)求开始第4次发球时,甲、乙的比分为1比2的概率; (Ⅱ)表示开始第4次发球时乙的得分,求的期望。 例3:(2014年湖南)某企业有甲、乙两个研发小组,他们研发新产品成功的概率分别为.现安排甲组研发新产品,乙组研发新产品.设甲、乙两组的研发相互独立. (1)求至少有一种新产品研发成功的概率; (2)若新产品研发成功,预计企业可获利润120万元;若新产品研发成功,预计企业可获利润100万元.求该企业可获利润的分布列和数学期望
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818