资源描述
2024/4/22周一1概率论与数理统计2概率论与数理统计是研究随机现象数量规律的一门学科。3概率统计概率统计概率统计概率统计是高等院校理工类的重要课程之一。是高等院校理工类的重要课程之一。是高等院校理工类的重要课程之一。是高等院校理工类的重要课程之一。在考研数学中的比重大约占在考研数学中的比重大约占在考研数学中的比重大约占在考研数学中的比重大约占22%22%左右。左右。左右。左右。n n概率论与数理统计是数学的一个有特色且又十分活跃的分支,一方面,它有别开生面的研究课题,有自己独特的概念和方法,内容丰富,结果深刻;另一方面,它与其他学科又有紧密的联系,是近代数学的重要组成部分。由于它近年来突飞猛进的发展与应用的广泛性,目前已发展成为一门独立的一级学科。4概率论学科历史概率论学科历史 n n概率,指一种不确定的情况出现可能性的大小概率,指一种不确定的情况出现可能性的大小 .起源于中起源于中世纪以来的欧洲流行的用骰子赌博世纪以来的欧洲流行的用骰子赌博.n n分赌本问题分赌本问题 :甲、乙二人赌博,各出赌注甲、乙二人赌博,各出赌注3030元,共元,共6060元,元,每局甲、乙胜的机会均等,都是每局甲、乙胜的机会均等,都是1/21/2。约定:谁先胜满。约定:谁先胜满3 3局局则他赢得全部赌注则他赢得全部赌注6060元,现已赌完元,现已赌完3 3局,甲局,甲2 2胜胜1 1负,而因负,而因故中断赌情,问这故中断赌情,问这6060元赌注该如何分给元赌注该如何分给2 2人,才算公平人,才算公平?n n帕斯卡和费尔马建立了概率论的一个基本概念帕斯卡和费尔马建立了概率论的一个基本概念数学期数学期望,惠更斯望,惠更斯16571657年将自己的研究成果写成了专著年将自己的研究成果写成了专著论掷骰论掷骰子游戏中的计算子游戏中的计算.n n在他们之后,对概率论这一学科做出贡献的是瑞士数学家在他们之后,对概率论这一学科做出贡献的是瑞士数学家族族贝努利家族的几位成员贝努利家族的几位成员.雅可布雅可布 贝努利在前人研究贝努利在前人研究的基础上,证明了被称为的基础上,证明了被称为“大数定律大数定律”的一个定理,这是的一个定理,这是研究等可能性事件的古典概率论中的极其重要的结果。研究等可能性事件的古典概率论中的极其重要的结果。5n n随着随着1818、1919世纪科学的发展,人们注意到某些生物、物理世纪科学的发展,人们注意到某些生物、物理和社会现象与机会游戏相似,从而由机会游戏起源的概率和社会现象与机会游戏相似,从而由机会游戏起源的概率论被应用到这些领域中,同时也大大推动了概率论本身的论被应用到这些领域中,同时也大大推动了概率论本身的发展。发展。n n法国数学家拉普拉斯将古典概率论向近代概率论进行推进,法国数学家拉普拉斯将古典概率论向近代概率论进行推进,他首先明确给出了概率的古典定义,并在概率论中引入了他首先明确给出了概率的古典定义,并在概率论中引入了更有力的数学分析工具,将概率论推向一个新的发展阶段。更有力的数学分析工具,将概率论推向一个新的发展阶段。他还证明了他还证明了“煤莫弗煤莫弗拉普拉斯定理拉普拉斯定理”.拉普拉斯于拉普拉斯于18121812年出版了他的著作年出版了他的著作分析的概率理论分析的概率理论,这是一部继,这是一部继往开来的作品。这时候人们最想知道的就是概率论是否会往开来的作品。这时候人们最想知道的就是概率论是否会有更大的应用价值?是否能有更大的发展成为严谨的学科有更大的应用价值?是否能有更大的发展成为严谨的学科n n概率论在概率论在2020世纪再度迅速地发展起来,则是由于科学技术世纪再度迅速地发展起来,则是由于科学技术发展的迫切需要而产生的。发展的迫切需要而产生的。19061906年,俄国数学家马尔科夫年,俄国数学家马尔科夫提出了所谓提出了所谓“马尔科夫链马尔科夫链”的数学模型。的数学模型。19341934年,前苏联年,前苏联数学家辛钦又提出一种在时间中均匀进行着的平稳过程理数学家辛钦又提出一种在时间中均匀进行着的平稳过程理论。论。6n n2020世纪初完成的勒贝格测度与积分理论及随后发展的抽象世纪初完成的勒贝格测度与积分理论及随后发展的抽象测度和积分理论,为概率公理体系的建立奠定了基础。在测度和积分理论,为概率公理体系的建立奠定了基础。在这种背景下柯尔莫哥洛夫这种背景下柯尔莫哥洛夫19331933年在他的年在他的概率论基础概率论基础一一书中首次给出了概率的测度论式定义和一套严密的公理体书中首次给出了概率的测度论式定义和一套严密的公理体系。他的公理化方法成为现代概率论的基础,使概率论成系。他的公理化方法成为现代概率论的基础,使概率论成为严谨的数学分支。为严谨的数学分支。7数理统计学科历史数理统计学科历史n n统计学起源于收集数据的活动,现今各国都设有统计学起源于收集数据的活动,现今各国都设有统计局或相当的机构。当然,单是收集、记录数统计局或相当的机构。当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。例如根据人口普查测其在未来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。根据以往一般时间某项或的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构间的走向等,做这些事情的理论与方法,才能构成一门学问成一门学问数理统计学的内容。数理统计学的内容。8n n一种受到某些著名学者支持的观点认为,英国学者葛朗特一种受到某些著名学者支持的观点认为,英国学者葛朗特在在16621662年发表的著作年发表的著作关于死亡公报的自然和政治观察关于死亡公报的自然和政治观察,标志着这门学科的诞生。标志着这门学科的诞生。n n数理统计学的另一个重要源头来自天文和测地学中的误差数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。人们希望通过多次量测获取更多的数据,以便分析问题。人们希望通过多次量测获取更多的数据,以便得到对量测对象的精度更高的估计值。量测误差有随机性,得到对量测对象的精度更高的估计值。量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的现今概率论中著名的“拉普拉斯分布拉普拉斯分布”,即是他在这研究,即是他在这研究中的一个产物。这方面最著名且影响深远的研究成果有二:中的一个产物。这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德一是法国数学家兼天文家勒让德1919世纪初(世纪初(18051805)与德与德国大学者高斯发明的国大学者高斯发明的“最小二乘法最小二乘法”,另外一个重要成果,另外一个重要成果是高斯是高斯18091809年在研究行星绕日运动时提出用正态分布刻画年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。正态分布也常称为高斯分布。测量误差的分布。正态分布也常称为高斯分布。9n n正态分布在数理统计学中占有极重要的地位,现正态分布在数理统计学中占有极重要的地位,现今仍在常用的许多统计方法,就是建立在今仍在常用的许多统计方法,就是建立在“所研所研究的量具有或近似地具有正态分布究的量具有或近似地具有正态分布”这个假定的这个假定的基础上,而经验和理论(概率论中所谓基础上,而经验和理论(概率论中所谓“中心极中心极限定理限定理”)都表明这个假定的现实性,现实世界)都表明这个假定的现实性,现实世界许多现象看来是杂乱无章的,如不同的人有不同许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。大批生产的产品,其质量指标各的身高、体重。大批生产的产品,其质量指标各有差异有差异 。看来毫无规则,但它们在总体上服从正。看来毫无规则,但它们在总体上服从正态分布。这一点,显示在纷乱中有一种秩序存在,态分布。这一点,显示在纷乱中有一种秩序存在,提出正态分布的高斯,一生在多个领域里面有不提出正态分布的高斯,一生在多个领域里面有不少重大的贡献,但在德国少重大的贡献,但在德国1010马克的有高斯图像的马克的有高斯图像的钞票上,单只画出了正态曲线,以此可以看出人钞票上,单只画出了正态曲线,以此可以看出人们对他这一贡献评价之高。们对他这一贡献评价之高。10n n2020世纪以前数理统计学发展的一个重要成果,世纪以前数理统计学发展的一个重要成果,是是1919世纪后期由英国遗传学家兼统计学家高尔顿世纪后期由英国遗传学家兼统计学家高尔顿发起,并经现代统计学的奠基人之一发起,并经现代统计学的奠基人之一K K 皮尔逊和皮尔逊和其他一些英国学者所发展的统计相关与回归理论。其他一些英国学者所发展的统计相关与回归理论。所谓统计相关,是指一种非决定性的关系如人的所谓统计相关,是指一种非决定性的关系如人的身高身高X X与体重与体重Y Y,存在一种大致的关系,表现在,存在一种大致的关系,表现在X X大(小)时,大(小)时,Y Y也倾向于大(小),但非决定性的:也倾向于大(小),但非决定性的:由由X X并不能决定并不能决定Y Y。现实生活中和各种科技领域中,。现实生活中和各种科技领域中,这种例子很多,如受教育年限与收入的关系,经这种例子很多,如受教育年限与收入的关系,经济发展水平与人口增长速度的关系等,都是属于济发展水平与人口增长速度的关系等,都是属于这种性质,统计相关的理论把这种关系的程度加这种性质,统计相关的理论把这种关系的程度加以量化,而统计回归则是把有统计相关的变量,以量化,而统计回归则是把有统计相关的变量,如上文的身高如上文的身高X X和体重和体重Y Y的关系的形式作近似的估的关系的形式作近似的估计,称为回归方程,现实世界中的现象往往涉及计,称为回归方程,现实世界中的现象往往涉及众多变量,它们之间有错综复杂的关系,且许多众多变量,它们之间有错综复杂的关系,且许多属于非决定性质,相关回归理论的发明,提供了属于非决定性质,相关回归理论的发明,提供了一种通过实际观察去对这种关系进行定量研究的一种通过实际观察去对这种关系进行定量研究的工具,有着重大的认识和实用意义。工具,有着重大的认识和实用意义。11n n这门学科的理论框架在这门学科的理论框架在2020世纪上半叶得以完成,狭义一世纪上半叶得以完成,狭义一点说可界定在点说可界定在1921193819211938年,起主要作用的是几位大师年,起主要作用的是几位大师级的人物,特别是英国的费歇尔级的人物,特别是英国的费歇尔KK皮尔逊,发展统计皮尔逊,发展统计假设检验理论的奈曼与假设检验理论的奈曼与EE皮尔逊和提出统计决策函数理皮尔逊和提出统计决策函数理论的瓦尔德等。我国已故著名统计学家许宝(论的瓦尔德等。我国已故著名统计学家许宝(1910191019701970)在这项工作中也卓有建树。)在这项工作中也卓有建树。n n自二战结束迄今,数理统计学有了迅猛的发展,主要有以自二战结束迄今,数理统计学有了迅猛的发展,主要有以下三方面的原因:一是数理统计学理论框架的建立以及概下三方面的原因:一是数理统计学理论框架的建立以及概率论和数学工具的进展,为统计理论的发展打开了门径和率论和数学工具的进展,为统计理论的发展打开了门径和提供了手段,许多理论和方法得到了完善与深入,并不断提供了手段,许多理论和方法得到了完善与深入,并不断提出新的研究课题;二是实用上的需要,不断提出了复杂提出新的研究课题;二是实用上的需要,不断提出了复杂的问题与模型,吸引了学者们的研究兴趣;三是电子计算的问题与模型,吸引了学者们的研究兴趣;三是电子计算机的发明与普及应用,一方面提供了必要的计算工具机的发明与普及应用,一方面提供了必要的计算工具统计方法的实施往往涉及大量数据的处理与运算,用人力统计方法的实施往往涉及大量数据的处理与运算,用人力无法在合理的时间内完成,所以在早年,一些统计方法人无法在合理的时间内完成,所以在早年,一些统计方法人们虽然知道,但很少付诸实用,就因为是人力所难及。计们虽然知道,但很少付诸实用,就因为是人力所难及。计算机的出现解决了这个问题。同时,计算机对促进统计理算机的出现解决了这个问题。同时,计算机对促进统计理论研究也有助益,统计模拟是其表现之一论研究也有助益,统计模拟是其表现之一 。12概率论与数理统计的应用概率论与数理统计的应用n n概率论与以它作为基础的数理统计学科一起,在概率论与以它作为基础的数理统计学科一起,在自然科学,社会科学,工程技术,军事科学及工自然科学,社会科学,工程技术,军事科学及工农业生产等诸多领域中都起着不可或缺的作用。农业生产等诸多领域中都起着不可或缺的作用。n n直观地说,卫星上天,导弹巡航,飞机制造,宇直观地说,卫星上天,导弹巡航,飞机制造,宇宙飞船遨游太空等都有概率论的一份功劳;及时宙飞船遨游太空等都有概率论的一份功劳;及时准确的天气预报,海洋探险,考古研究等更离不准确的天气预报,海洋探险,考古研究等更离不开概率论与数理统计;电子技术发展,影视文化开概率论与数理统计;电子技术发展,影视文化的进步,人口普查及教育等同概率论与数理统计的进步,人口普查及教育等同概率论与数理统计也是密不可分的。也是密不可分的。n n根据概率论中用投针试验估计根据概率论中用投针试验估计 值的思想产生的蒙值的思想产生的蒙特卡罗方法,是一种建立在概率论与数理统计基特卡罗方法,是一种建立在概率论与数理统计基础上的计算方法。借助于电子计算机这一工具,础上的计算方法。借助于电子计算机这一工具,使这种方法在核物理、表面物理、电子学、生物使这种方法在核物理、表面物理、电子学、生物学、高分子化学等学科的研究中起着重要的作用。学、高分子化学等学科的研究中起着重要的作用。13怎样学怎样学“概率论与数理统计概率论与数理统计”n n学习过程中要抓住对概念的引入和背景的理解.要紧扣它的实际背景,理解统计方法的直观含义.n n对于引入概念的内涵和相互间的联系和差异要仔细推敲.n n在解题过程中不要为解题而解题,而应理解题目所涉及的概念及解题的目的.而要把精力放在理解不同题型涉及的概念及解题的思路上去.14 概 率 论15关键词:样本空间 随机事件频率和概率条件概率事件的独立性第一章概率论的基本概念161 随机试验确定性现象:结果确定不确定性现象:结果不确定确定性现象不确定性现象确定不确定不确定自然界与社会生活中的两类现象例:向上抛出的物体会掉落到地上 明天天气状况 买了彩票会中奖17概率统计中研究的对象:随机现象的数量规律 对随机现象的观察、记录、试验统称为随机试验。随机试验。它具有以下特性:1.可以在相同条件下重复进行2.事先知道可能出现的结果3.进行试验前并不知道哪个试验结果会发生 例:抛一枚硬币,观察试验结果;对某路公交车某停靠站登记下车人数;对某批电子产品测试其输入电压;对听课人数进行一次登记;182 样本空间随机事件(一一)样本空间样本空间 定义:随机试验E的所有结果构成的集合称为E的 样本空间样本空间,记为S=e,称S中的元素e为基本事件基本事件或样本点样本点S=0,1,2,;S=正面,反面;S=(x,y)|T0yxT1;S=x|axb 记录一城市一日中发生交通事故次数 例:一枚硬币抛一次记录某地一昼夜最高温度x,最低温度y 记录一批产品的寿命x19(二)随机事件随机事件 一般我们称S的子集A为E的随机事件随机事件A,当且仅当A所包含的一个样本点发生称事件A发生。S0,1,2,;记 A至少有10人候车10,11,12,S,A为随机事件,A可能发生,也可能不发生。例:观察89路公交车浙大站候车人数,如果将S亦视作事件,则每次试验S总是发生,故又称S为必然事件必然事件。为方便起见,记为不可能事件不可能事件,不包含任何样本点。20(三)事件的关系及运算事件的关系及运算v事件的关系(包含、相等)例:记A=明天天晴,B=明天无雨记A=至少有10人候车,B=至少有5人候车一枚硬币抛两次,A=第一次是正面,B=至少有一次正面 SAB21v 事件的运算SBASABSBA A与B的和事件,记为 A与B的积事件,记为当AB=AB=时,称事件A A与B B不相容的,或互斥的。22“和”、“交”关系式SABS 例:设A A=甲来听课,B B=乙来听课 ,则:甲、乙至少有一人来甲、乙都来甲、乙都不来甲、乙至少有一人不来233 频率与概率(一)频率 定义:记 其中 A发生的次数(频数);n总试验次 数。称 为A在这n次试验中发生的频率频率。例:中国国家足球队,“冲击亚洲”共进行了n次,其中成功了一次,则在这n次试验中“冲击亚洲”这事件发生的频率为某人一共听了17次“概率统计”课,其中有15次迟到,记A=听课迟到,则#频率 反映了事件A发生的频繁程度。试验序号n=5n =50n=500nHfn(H)nHfn(H)nHfn(H)1234567891023151242330.40.60.21.00.20.40.80.40.60.6222521252421182427310.440.500.420.500.480.420.360.480.540.622512492562532512462442582622470.5020.4980.5120.5060.5020.4920.4880.5160.5240.494表表 1 1 例:抛硬币出现的正面的频率25实验者nnHfn(H)德摩根204810610.5181蒲 丰404020480.5069K皮尔逊1200060190.5016K皮尔逊24000120120.5005表表 2 226*频率的性质:且 随n的增大渐趋稳定,记稳定值为p27(二)概率 定义1:的稳定值p定义为A的概率,记为P(A)=p 定义2:将概率视为测度,且满足:称P(A)为事件A的概率概率。28性质:294 等可能概型(古典概型)定义:若试验E满足:1.S中样本点有限(有限性)2.出现每一样本点的概率相等(等可能性)称这种试验为等可能概型等可能概型(或古典概型或古典概型)。30例1:一袋中有8个球,编号为18,其中13 号为红球,48号为黄球,设摸到每一 球的可能性相等,从中随机摸一球,记A=摸到红球,求P(A)解:S=1,2,8 A=1,2,3 31例2:从上例的袋中不放回的摸两球,记A=恰是一红一黄,求P(A)解:(注:当Lm或L0,i=1,2,n;则称:为全概率公式全概率公式B1B2BnSA证明:证明:定理:接上定理条件,称此式为BayesBayes公式。公式。44*全概率公式可由以下框图表示:设 P(Bj)=pj,P(A|Bj)=qj,j=1,2,n易知:SP1P2Pn.B2B1Bn.q2q1qnA45例:一单位有甲、乙两人,已知甲近期出差的概率为80%,若甲出差,则乙出差的概率为20%;若甲不出差,则乙出差的概率为90%。(1)求近期乙出差的概率;(2)若已知乙近期出差在外,求甲出差的概率。Bayes公式全概率公式解:设A=甲出差,B=乙出差46 例:根据以往的临床记录,某种诊断癌症的试验具有5%的假阳性及5%的假阴性:若设A=试验反应是阳性,C=被诊断患有癌症 则有:已知某一群体P(C)=0.005,问这种方法能否用于普查?若P(C)较大,不妨设P(C)=0.8推出P(C|A)=0.987说明这种试验方法可在医院用解:考察P(C|A)的值若用于普查,100个阳性病人中被诊断患有癌症的大约有8.7个,所以不宜用于普查。476 独立性 例:有10件产品,其中8件为正品,2件为次品。从中取2 次,每次取1件,设Ai=第i次取到正品,i=1,2不放回抽样时,放回抽样时,即放回抽样时,A1的发生对A2的发生概率不影响 同样,A2的发生对A1的发生概率不影响定义:设A,B为两随机事件,若P(B|A)=P(B),即P(AB)=P(A)*P(B)即P(A|B)=P(A)时,称A,B相互独立相互独立。48 注意:49 例:甲、乙两人同时向一目标射击,甲击中 率为0.8,乙击中率为0.7,求目标被击中的概率。解:设 A=甲击中,B=乙击中C=目标被击中 甲、乙同时射击,其结果互不影响,A,B相互独立50 例:有4个独立元件构成的系统(如图),设每个元 件能正常运行的概率为p,求系统正常运行的 概率。1432注意:这里系统的概念与电路 中的系统概念不同51 52总结:53复习思考题复习思考题 1 11.“事件A不发生,则A=”,对吗?试举例证明之。2.“两事件A和B为互不相容,即AB=,则A和B互逆”,对吗?反之成立吗?试举例说明之。4.甲、乙两人同时猜一谜,设A=甲猜中,B=乙猜中,则AB=甲、乙两人至少有1人猜中。若P(A)=0.7,P(B)=0.8,则“P(AB)=0.7+0.8=1.5”对吗?5.满足什么条件的试验问题称为古典概型问题?547.如何理解样本点是两两互不相容的?8.设A和B为两随机事件,试举例说明P(AB)=P(B|A)表示不同的意义。10.什么条件下称两事件A和B相互独立?什么条件下称n个事件A1,A2,An相互独立?11.设A和B为两事件,且P(A)0,P(B)0,问A和B相互独立、A和B互不相容能否同时成立?试举例说明之。12.设A和B为两事件,且P(A)=a,P(B)=b,问:(1)当A和B独立时,P(AB)为何值?(2)当A和B互不相容时,P(AB)为何值?5513.当满足什么条件时称事件组A1,A2,An为样为本空间 的一个划分?14.设A,B,C为三随机事件,当AB,且P(A)0,P(B)0时,P(C|A)+P(C|B)有意义吗?试举例说明。15.设A,B,C为三随机事件,且P(C)0,问P(AB|C)=P(A|C)+P(B|C)P(AB|C)是否成立?若成立,与概率的加法公式比较之。56第二章随机变量及其分布关键词:随机变量 概率分布函数 离散型随机变量 连续型随机变量 随机变量的函数571 随机变量*常见的两类试验结果:示数的降雨量;候车人数;发生交通事故的次数示性的明天天气(晴,多云);化验结果(阳性,阴性)esx离散型的连续型的X=f(e)为S上的单值函数,X为实数*中心问题:将试验结果数量化*定义:随试验结果而变的量X为随机变量*常见的两类随机变量582 离散型随机变量及其分布 定义:取值可数的随机变量为离散量离散量离散量的概率分布(分布律)样本空间S X=x1,X=x2,X=xn,由于样本点两两不相容1、写出可能取值即写出了样本点2、写出相应的概率即写出了每一个样本点出现的概率#概率分布59 例:某人骑自行车从学校到火车站,一路上要经 过3个独立的交通灯,设各灯工作独立,且设 各灯为红灯的概率为p,0p1,以X表示首次 停车时所通过的交通灯数,求X的概率分布律。pX0123pp(1-p)(1-p)2p(1-p)3 解:设Ai=第i个灯为红灯,则P(Ai)=p,i=1,2,3 且A1,A2,A3相互独立。60 例:从生产线上随机抽产品进行检测,设产品 的次品率为p,0p1,若查到一只次品就 得停机检修,设停机时已检测到X只产品,试写出X的概率分布律。解:设Ai=第i次抽到正品,i=1,2,则A1,A2,相互独立。亦称X为服从参数p的几何分布。几何分布。61三个主要的离散型随机变量 01(p)分布二项分布Xpq01p样本空间中只有两个样本点即每次试验结果即每次试验结果互不影响互不影响在相同条件下在相同条件下重复进行重复进行(p+q=1)*n重贝努利试验:设试验E只有两个可能的结果:p(A)=p,0p1,将E独立地重复进行n次,则称这一串重复重复重复重复 的独立独立独立独立试验为n重贝努利试验贝努利试验。62例:1.独立重复地抛n次硬币,每次只有两个可能的结果:正面,反面,如果是不放回抽样呢?2.将一颗骰子抛n次,设A=得到1点,则每次试验 只有两个结果:3.从52张牌中有放回地取n次,设A=取到红牌,则 每次只有两个结果:63设A在n重贝努利试验中发生X次,则并称X服从参数为p的二项分布二项分布,记推导:设Ai i=第i次A发生,先设n=364例:设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是0.01,且一台设备的故障能有一个人处理。考虑两种配备维修工人的方法,其一是由4个人维护,每人负责20台;其二是由3个人共同维护80台。试比较这两种方法在设备发生故障时不能及时维修的概率的大小。6566 例:某人骑了自行车从学校到火车站,一路上 要经过3个独立的交通灯,设各灯工作独 立,且设各灯为红灯的概率为p,0p1,以Y表示一路上遇到红灯的次数。(1)求Y的概率分布律;(2)求恰好遇到2次红灯的概率。解:这是三重贝努利试验 67 例:某人独立射击n次,设每次命中率为p,0p0为常数,则称X服从参数为的指数分布指数分布。记为 X具有如下的无记忆性:79 80 正态分布定义:设X的概率密度为其中 为常数,称X服从参数为 的正态分布(Gauss分布),记为可以验算:81称为位置参数(决定对称轴位置)为尺度参数(决定曲线分散性)82X的取值呈中间多,两头少,对称的特性。当固定时,越大,曲线的峰越低,落在附近的概率越小,取值就越分散,是反映X的取值分散性的一个指标。在自然现象和社会现象中,大量随机变量服从或近似服从正态分布。8384 例:查书后附表85 例:一批钢材(线材)长度(1)若=100,=2,求这批钢材长度小于97.8cm的概率;(2)若=100,要使这批钢材的长度至少有90%落在区间(97,103)内,问至多取何值?86 例:设某地区男子身高(1)从该地区随机找一男子测身高,求他的身高大于175cm的概率;(2)若从中随机找5个男子测身高,问至少有一人身高大于175cm的概率是多少?恰有一人身高大于175cm的概率为多少?875 随机变量的函数分布问题:已知随机变量X的概率分布,且已知Y=g(X),求Y的概率分布。Xpi i0.2-1010.50.3例如,若要测量一个圆的面积,总是测量其半径,半径的测量值可看作随机变量X,若 则Y服从什么分布?例:已知X具有概率分布 且设Y=X2,求Y的概率分布。解:Y的所有可能取值为0,1即找出(Y=0)的等价事件(X=0);(Y=1)的等价事件(X=1)或(X=-1)88例:设随机变量X具有概率密度 求Y=X2的概率密度。解:分别记X,Y的分布函数为Y在区间(0,16)上均匀分布。89一般,若已知X的概率分布,Y=g(X),求Y的 概率分布的过程为:关键是找出等价事件。90例:设 Y=2X,Z=X2,求Y,Z的概率分布。X-110pZ01pY-220p解:Y的可能取值为-2,0,2 Z的可能取值为0,1(Y=-2)的等价事件为(X=-1)(Z=1)的等价事件为(X=1)(X=-1)故得:91例:92xh(y),yy0y=g(x)y9394例:解:例:解:95 96复习思考题复习思考题 2 21.什么量被称为随机变量?它与样本空间的关系如何?2.满足什么条件的试验称为“n重贝努里试验”?3.事件A在一次试验中发生的概率为p,0p1);(3)在Y=3的条件下,X的分布律。解:(1)X,Y的联合分布律为126127 定义:条件分布函数128 定义:条件概率密度129也就是,由事实上,130条件概率密度的直观意义:131 例4:设二维随机变量(X,Y)在区域 内均匀分布,求条件概率密度二维均匀分布的条件 分布仍为均匀分布 解:根据题意,(X,Y)的概率密度为:Y的边缘概率密度为:于是给定y(-1y1),X的条件概率密度为:1321334 相互独立的随机变量 134例1:1例2中X和Y是否相互独立?即(X,Y)具有概率密度请问:连续型随机变量X,Y相互独立,其密度函数有何特征?计算得,X和Y的边缘概率密度分别为:135XY01P(X=j)12P(Y=i)XY01P(X=j)12P(Y=i)136 137 138139140 一般一般n n维随机变量的一些概念和结果维随机变量的一些概念和结果 141 142 边缘分布边缘分布 如:143 相互独立相互独立 144 定理1:定理2:145 5 两个随机变量的函数的分布146 147 148 149例3:设X和Y是相互独立的标准正态随机变量,求 的概率密度。解:由卷积公式:一般:设一般:设X,YX,Y相互独立,相互独立,150 例4:X,Y相互独立,同时服从0,1上的均匀分布,求 的概率密度。xx=zz120 x=z-1 1 解:根据卷积公式:易知仅当参考图得:151 例5:设X,Y相互独立、服从相同的指数分布,概率密度为:求 的概率密度。解:根据卷积公式:152一般的,可以证明一般的,可以证明:若X,Y相互独立,且分别服从参数为X,Y的概率密度分别为证明:这是例3的推广,由卷积公式由此可知:153 154 推广推广到n个相互独立的随机变量的情况设X1,X2,Xn是n个相互独立的随机变量,它们的分布函数分别为:则:155156 例7:设系统L由两个相互独立的子系统L1,L2联结而成,联结的方式分别为:(1)串联;(2)并联;(3)备用(当系统L1损坏时,系统L2开始工作)。如图,设L1,L2的寿命分别为X,Y,已知它们的概率密度分别为:试分别就以上三种联结方式写出L的寿命Z的概率密度。XYL1L2XYL2L1XYL2L1157A.A.串联的情况串联的情况 由于当L1,L2中由一个损坏时,系统L就停止工作,所以L的寿命为Z=min(X,Y)Z=min(X,Y);而X,Y的分布函数分别为:故Z的分布函数为:于是Z的概率密度为:即Z仍服从指数分布L1L2158B.B.并联的情况并联的情况 由于当且仅当L1,L2都损坏时,系统L才停止工作,所以这时L的寿命为Z=max(X,Y),Z的分布函数为:于是Z的概率密度为:L1L2159C.C.备用的情况备用的情况 由于这时当系统L1损坏时,系统L2才开始工作,因此整个系统L的寿命Z是L1,L2寿命之和,即Z=X+Y;因此:L1L2160复习思考题复习思考题 3 31.设(X,Y)为二维向量,则Px1Xx2,y1Yy2=F(x2,y2)-F(x1,y1),对吗?2.设(X,Y)为二维连续量,则PX+Y=1=0,对吗?3.(X,Y)为二维连续型向量,f(x,y)为(X,Y)的联合概率密度,fX(x)和fY(y)分别为关于X和Y的边缘概率密度,若有一点(x0,y0)使f(x0,y0)fX(x0)fY(y0)则X和Y不独立,对吗?161关键词:数学期望方差协方差相关系数第四章随机变量的数字特征162问题的提出:问题的提出:在一些实际问题中,我们需要了解随机变量在一些实际问题中,我们需要了解随机变量的分布函数外,更关心的是随机变量的某些特征。的分布函数外,更关心的是随机变量的某些特征。例:例:在评定某地区粮食产量的水平时,最关心的在评定某地区粮食产量的水平时,最关心的是平均产量;是平均产量;在检查一批棉花的质量时,既需要注意纤维的在检查一批棉花的质量时,既需要注意纤维的平均长度,又需要注意纤维长度与平均长度的平均长度,又需要注意纤维长度与平均长度的偏离程度;偏离程度;考察杭州市区居民的家庭收入情况,我们既知考察杭州市区居民的家庭收入情况,我们既知家庭的年平均收入,又要研究贫富之间的差异家庭的年平均收入,又要研究贫富之间的差异程度。程度。163定义:定义:定义:定义:数学期望简称期望,又称均值。数学期望简称期望,又称均值。1 1 数学期望数学期望164 例例1 1:165 例例2 2:有:有2 2个相互独立工作的电子装置,它们的寿命个相互独立工作的电子装置,它们的寿命服从同一指数分布,其概率密度为:服从同一指数分布,其概率密度为:若将这若将这2 2个电子装置串联联接个电子装置串联联接组成整机,求整机寿命组成整机,求整机寿命N(N(以小时计以小时计)的数学期望。的数学期望。解:解:是指数分布的密度函数问题:将2个电子装置并联联接组成整机,整机寿命的期望又是多少?只要求出一般指数分布的期望(即E(X1),就可得到E(N).166 例例3 3:设一台机器一天内发生故障的概率为:设一台机器一天内发生故障的概率为0.20.2,机器发生,机器发生 故障时全天停工。若一周故障时全天停工。若一周5 5个工作日里无故障,可获个工作日里无故障,可获 利利1010万元;发生一次故障获利万元;发生一次故障获利5 5万元;发生万元;发生2 2次故障次故障 获利获利0 0元,发生元,发生3 3次或以上故障亏损次或以上故障亏损2 2万元,求一周内万元,求一周内 期望利润是多少?期望利润是多少?解:设X表示一周5天内机器发生故障天数,设Y表示一周内所获利润,则Y -2 0 5 10P0.057 0.205 0.410 0.328167 例例4 4:168例例5 5:169 170 171 例例6 6:172 例例7 7:设随机变量:设随机变量(X,Y)(X,Y)的概率密度为:的概率密度为:X=1173 174数学期望的特性:数学期望的特性:这一性质可以推广到任意有限个随机变量线性组合的情况175证明:明:下面仅对连续型随机变量给予证明:176 例例9 9:一民航送客车载有:一民航送客车载有2020位旅客自机场出发,旅客有位旅客自机场出发,旅客有1010 个车站可以下车,如到达一个车站没有旅客下车就个车站可以下车,如到达一个车站没有旅客下车就 不停车,以不停车,以X X表示停车的次数,求表示停车的次数,求 (设每位旅客在各个车站下车是等可能的,并设各旅设每位旅客在各个车站下车是等可能的,并设各旅 客是否下车相互独立客是否下车相互独立)本题是将X分解成数个随机变量之和随机变量之和,然后利用随机变量和的数学期望等于随机变量数学期望之和来求数学期望,这种处理方法具有一定的普遍意义。解:引入随机变量:177 例例1010:1782 2 方差方差设有一批灯泡寿命为:一半约设有一批灯泡寿命为:一半约950小时,另一半约小时,另一半约1050小时小时平均寿命为平均寿命为10001000小时;小时;另一批灯泡寿命为:另一批灯泡寿命为:一半约一半约1300小时,另一半约小时,另一半约700小时小时平均寿命为平均寿命为10001000小时;小时;问题:哪批灯泡的质量更好?问题:哪批灯泡的质量更好?单从平均寿命这一指标无法判断,进一步考察灯泡寿命X与均值1000小时的偏离程度。方差方差正是体现这种意义的数学特征。正是体现这种意义的数学特征。179定义:定义:180对于对于离散型随机变量随机变量X X,对于连续型连续型随机变量X,此外,利用数学期望的性质,可得方差的计算公式:181 例例1 1:设随机变量:设随机变量X X具有数学期望具有数学期望182 例例2 2:设随机变量:设随机变量X X具有具有0-10-1分布,其分布律为:分布,其分布律为:解:解:183 例例3 3:解:解:184 例例4 4:解:X的概率密度为:185 例例5 5:设随机变量:设随机变量X X服从指数分布,其概率密度为:服从指数分布,其概率密度为:即对指数分布而言,方差是均值的平方,而均值恰为参数即对指数分布而言,方差是均值的平方,而均值恰为参数186方差的性质:方差的性质:187证明证明:188 例例6 6:Xkpk011-pp 例例7 7:解:解
展开阅读全文