收藏 分销(赏)

-probability-统计学双语.ppt

上传人:天**** 文档编号:2086641 上传时间:2024-05-15 格式:PPT 页数:62 大小:1.20MB 下载积分:14 金币
下载 相关 举报
-probability-统计学双语.ppt_第1页
第1页 / 共62页
-probability-统计学双语.ppt_第2页
第2页 / 共62页


点击查看更多>>
资源描述
Chapter threeChapter threeProbability and Its Distributions1.Main points:Section 1:概率及概率分布的有关概念:概率及概率分布的有关概念和性质和性质Section 2:离散型随机变量的概率分布,:离散型随机变量的概率分布,二项分布概率函数、绘图及计算二项分布概率函数、绘图及计算Section 3:连续型随机变量的概率分布,:连续型随机变量的概率分布,正态分布概率密度函数、绘图及计算正态分布概率密度函数、绘图及计算2.Section 1:General Introduction of Probability and Its Distribution有关概念概率及概率分布离散型及连续型随机变量期望值及方差性质计算3.几个基本概念几个基本概念随机现象:即事物发展的结果事先不能确定的现象,又称偶然现象或不确定性现象。随机试验:为掌握随机现象的统计规律性,对随机现象进行试验或观察,观察的过程叫试验。随机事件:随机试验的每一次可能结果,简称事件。若一个随机事件不可能再分,就称基本事件。概率:衡量随机事件发生可能性大小的数值不可能事件不可能事件必然事件必然事件4.计算概率的法则计算概率的法则古典法古典法:在古典概率型中某一事件:在古典概率型中某一事件A发生的概率,是该发生的概率,是该事件所包含的基本事件个数事件所包含的基本事件个数m与样本空间中基本事件与样本空间中基本事件总数总数n的比值。记作的比值。记作p(A)=m/n试验法试验法:在相同情况下重复进行:在相同情况下重复进行n次试验,事件次试验,事件A发生发生m次(次(m=n),随着试验次数,随着试验次数n的增大,事件的增大,事件A发生的发生的频率频率m/n围绕某一常数围绕某一常数p上下波动的幅度越来越小,且上下波动的幅度越来越小,且逐步趋于稳定,则称逐步趋于稳定,则称p为事件为事件A的概率。记作的概率。记作p(A)=p m/n主观法主观法:人们根据自己的经验和所掌握的有关信息,:人们根据自己的经验和所掌握的有关信息,对事件发生的可能性大小给以主观的估计,称为主观对事件发生的可能性大小给以主观的估计,称为主观概率。概率。详看详看21世纪教材世纪教材chapter4,p58-595.Interpretations of ProbabilityThe Relative Frequency Interpretation of ProbabilityIn situations that we can imagine repeating many times,we define the probability of a specific outcome as the proportion of times it would occur over the long run-called the relative frequency of that particular outcome.6.Assigning ProbabilitiesnA probability is a value between 0 and 1 and is written either as a fraction or as a decimal fraction.nA probability simply is a number between 0 and 1 that is assigned to a possible outcome of a random circumstance.nFor the complete set of distinct possible outcomes of a random circumstance,the total of the assigned probabilities must equal 1.7.Probability distributions概率分布概率分布Random variables x:is a numerical description of the outcome of an experiment。It can be classified as being either discrete or continuous depending on its character。A continuous random variable can take any value in an interval or collection of intervals.A discrete random variable can take one of a countable list of distinct values.8.概率分布:将随机变量及其相应的概率描述出来,概率分布:将随机变量及其相应的概率描述出来,即为概率分布,可用函数式、表格或图形表示。即为概率分布,可用函数式、表格或图形表示。据它可以掌握随机变量的变动规律。据它可以掌握随机变量的变动规律。写出一随机变量的概率分布必须知道写出一随机变量的概率分布必须知道x的所有可能取值的所有可能取值计算出每一种可能结果的概率计算出每一种可能结果的概率p参见教材参见教材P179-182Probability distributions概率分布概率分布 9.Expectations for Random VariablesThe expected value of a random variable is the mean value of the variable X in the sample space,or population,of possible outcomes.If X is a random variable with possible values x1,x2,x3,.,occurring with probabilities p1,p2,p3,.,then the expected value of X is calculated asDiscrete random variablesContinuous random variables10.Example for the expected value某公司考虑在一个设计中的郊区林荫道上投标。这个某公司考虑在一个设计中的郊区林荫道上投标。这个公司有两种基本被选方案。对每一个方案都进行了分公司有两种基本被选方案。对每一个方案都进行了分析,估计了净利润及其实现的主观概率。析,估计了净利润及其实现的主观概率。方案方案A:包括食品批发和土特产品店、一个公园、:包括食品批发和土特产品店、一个公园、一个室外就餐中心的投资。其净利润分别是一个室外就餐中心的投资。其净利润分别是150000元、元、200000元、元、300000元,其概率分别元,其概率分别为为0.4、0.2、0.4;方案方案B:投资于药店和康复中心,其净利润分别是:投资于药店和康复中心,其净利润分别是120000元、元、225000元,成功的机会各为元,成功的机会各为50%。假定净利润数字考虑了每个项目所需要的资本投资,假定净利润数字考虑了每个项目所需要的资本投资,从预期经济收益的观点看,哪个方案是可取的?从预期经济收益的观点看,哪个方案是可取的?11.Result of the example E(A)=150000*0.4+200000*0.2+300000*0.4=220000(元元)E(B)=120000*0.5+225000 *0.5=172500(元元)计算结果表明计算结果表明:选择方案选择方案A将获得较高的期望将获得较高的期望净利润净利润12.某保险公司向一位某保险公司向一位45岁的男子提岁的男子提供数额为供数额为1000元、期限一年的保险元、期限一年的保险单,保险费为每年单,保险费为每年12元,假如这个元,假如这个年龄组的死亡数是每年龄组的死亡数是每1000人中为一人中为一人,这个保险公司在这类保险单上人,这个保险公司在这类保险单上的收益是多少?的收益是多少?Self-test for the expected value13.Properties of expected value当随机变量当随机变量X、Y相互独立时相互独立时14.variance and standard deviation(方差和标差方差和标差):反映随机变量的分散程度反映随机变量的分散程度If X is a random variable with possible values x1,x2,x3,.,occurring with probabilities p1,p2,p3,.,and expected value E(X)=m,then The standard deviation of a random variable is essentially the average distance the random variable falls from its mean over the long run.Discrete random variables15.EXAMPLE:X:the number of heads occurring as tossing a coin 1.Show the probability distribution of XX 0 1P(x)0.5 0.52.E(X)=0*0.5+1*0.5=0.53.V(X)=16.当随机变量当随机变量X、Y相互独立时相互独立时Properties of variance17.常用的典型随机变量的概率分布常用的典型随机变量的概率分布常用的离散型随机变量的典型概率分布常用的离散型随机变量的典型概率分布 binomial distribution二项分布二项分布 hypergeometric distribution超几何分布超几何分布 poisson distribution普哇松分布普哇松分布常用的连续型随机变量的典型概率分布常用的连续型随机变量的典型概率分布 normal probability distribution正态分布正态分布 Standard normal probability distribution18.Section 2:Binomial Distribution二项试验以及其特点二项试验以及其特点二项变量二项变量二项分布的概率函数二项分布的概率函数二项分布的应用二项分布的应用二项分布的分布形态二项分布的分布形态 19.binomial experiment(二项试验二项试验)1.There are n“trials”where n is determined in advance and is not a random value.2.Two possible outcomes on each trial,called“success”and“failure”and denoted S and F.3.Outcomes are independent from one trial to the next.4.Probability of a“success”,denoted by p,remains same from one trial to the next.Probability of“failure”is 1 p.20.binomial variables(二项变量二项变量)A binomial random variable is defined as X=number of successes in the n trials of a binomial experiment.21.probability distribution of binomial distribution 二项分布的概率分布二项分布的概率分布X 服从二项分布服从二项分布,成功经验的概率为成功经验的概率为则记为则记为 X b(n )大写的大写的X表示随机变量表示随机变量小写的小写的x表示随机变量的具体取值表示随机变量的具体取值22.Example 1:设想在一个盒子里有设想在一个盒子里有10个小球,其中个小球,其中6个是红球,个是红球,4个是白球。现在把随机抽取一个球视为一次试个是白球。现在把随机抽取一个球视为一次试验,试验后把球放回盒子里。如果连续进行了三验,试验后把球放回盒子里。如果连续进行了三次试验,求三次试验中出现红球次数的概率。次试验,求三次试验中出现红球次数的概率。解:这里满足二项分布的条件解:这里满足二项分布的条件n=3,=0.6b(0;3,0.6)=C(0.6)0(0.4)3=0.064b(1;3,0.6)=C(0.6)1(0.4)2=0.288b(2;3,0.6)=C(0.6)2(0.4)1=0.432b(3;3,0.6)=C(0.6)3(0.4)0=0.21623.n=3,=0.6的二项分布图:00.250.50 1 2 3 x0.0640.2880.4320.21624.Using Tables of Binomial Probabilities 参见教材P194-195Example 2:一计算机公司生产某种一计算机公司生产某种256K动态动态RAM集成电集成电路块供微机使用,这种集成块有路块供微机使用,这种集成块有15%是不合格是不合格品,现在随机抽选品,现在随机抽选10块进行检查,查表计算块进行检查,查表计算下列不同情况下的概率。下列不同情况下的概率。1)不合格品数在)不合格品数在3个以内的概率;个以内的概率;2)不合格品数恰为)不合格品数恰为3个的概率;个的概率;3)不合格品数超过)不合格品数超过4个的概率;个的概率;4)不合格品数从)不合格品数从3个到个到5个的概率。个的概率。25.Expected Value and Standard Deviation for a Binomial Random VariableExpected Value E(X)=n E(X/n)=Variance V(X)=n (1-)V(X/n)=V(X)/n2=(1-)/nExample:textbook:P196 Martin Clothing Store26.Example 3 Extraterrestrial Life?50%of large population would say“yes”if asked,“Do you believe there is extraterrestrial life?”Sample of n=100 is taken.X=number in the sample who say“yes”is approximately a binomial random variable.In repeated samples of n=100,on average 50 people would say“yes”.The amount by which that number would differ from sample to sample is about 5.Exercise:P197:2727.二项分布的分布形态二项分布的分布形态n值越小,偏斜度越大28.正态正态 左偏左偏 右偏的图示右偏的图示 XXXPPP正态正态左偏左偏右偏右偏29.0.0735;0.0043;2.7;1.37Self Test:参照二项分布表中参数参照二项分布表中参数n=9,p=0.3的数的数据:据:1)作出概率分布图,观察其是左偏还是)作出概率分布图,观察其是左偏还是右偏;右偏;2)用公式计算)用公式计算P(x=5)和和P(x 7);3)求此二项分布的期望值和标准差。)求此二项分布的期望值和标准差。30.Discrete probability distribution with EXCEL(Martin Clothing Store)31.Section 3:normal distributionand standard normal distribution 连续型随机变量及其概率分布连续型随机变量及其概率分布normal distribution正态分布正态分布standard normal distribution标准正态分布标准正态分布 特点特点应用应用用正态分布逼近离散型概率分布用正态分布逼近离散型概率分布32.Continuous Random Variables连续型变量往往是测量的结果,理论上讲是不连续型变量往往是测量的结果,理论上讲是不可点数的,可以取两个规定界限之间的任何数可点数的,可以取两个规定界限之间的任何数值。例如,身高、体重、产品的使用寿命等。值。例如,身高、体重、产品的使用寿命等。连续型随机变量取一个值的概率为连续型随机变量取一个值的概率为0。即:。即:P(a x b)=P(axb)=P(a xb)=P(ax b)Continuous random variable:the outcome can be any value in an interval or collection of intervals.33.频数多边形与密度函数密度函数可以看作是当组距逐渐缩小时(密度函数可以看作是当组距逐渐缩小时(0)频数多边形的极限形式,记作频数多边形的极限形式,记作f(x)。xP(x)xf(x)(a)组距(b)连续型随机变量的密连续型随机变量的密度函数度函数f(x)密度函数34.由于我们用矩形面积表示概率,所以连续型随机变量x在区间(a,b)的概率近似等于矩形面积之和。即:当 时,即可得到 为:1.f(x)02.Probability density function for a continuous random variable X is a curve such that the area under the curve over an interval equals the probability that X is in that interval.P(a X b)=area under density curve over the interval between the values a and b.35.在连续型随机概率分布中,有一种非常重要的概率在连续型随机概率分布中,有一种非常重要的概率分布称为正态分布(分布称为正态分布(normal distribution).理论上,理论上,满足正态分布的随机变量的取值范围可以从负无穷满足正态分布的随机变量的取值范围可以从负无穷大到正无穷大。其概率密度函数为:大到正无穷大。其概率密度函数为:公式中的公式中的x为正态随机变量,为正态随机变量,=3.1416,e=2.71828和和为正态分布的两个参数,用为正态分布的两个参数,用N(,)表示平均数为表示平均数为、标准差为、标准差为的正态分布。的正态分布。Normal Random Variables36.Normal Random VariablesIf a population of measurements follows a normal curve,and if X is the measurement for a randomly selected individual from that population,then X is said to be a normal random variable X is also said to have a normal distribution Any normal random variable can be completely characterized by its mean,m,and standard deviation,s.37.连续型随机变量的典型概率连续型随机变量的典型概率分布分布-正态分布正态分布normal distribution正态分布在统计学中的地位正态分布在统计学中的地位正态分布的特点正态分布的特点正态分布的概率密度函数正态分布的概率密度函数标准正态分布标准正态分布standard normal distribution标准正态分布表标准正态分布表正态分布的的应用正态分布的的应用38.正态分布在统计学中的地位正态分布在统计学中的地位是统计和抽样的理论基础是统计和抽样的理论基础客观世界中许多随机现象都服从或客观世界中许多随机现象都服从或近似服从正态分布近似服从正态分布.正态分布具有很好的数学特征正态分布具有很好的数学特征.尽管经济管理活动中的有些变量是尽管经济管理活动中的有些变量是偏斜的偏斜的,但这丝毫不影响正态分布在但这丝毫不影响正态分布在抽样应用中的地位抽样应用中的地位.39.Characteristics of the normal probability distribution正态随机变量正态随机变量X 的取值域为整个的取值域为整个X轴轴,X轴为正态曲线轴为正态曲线的渐近线的渐近线.正态曲线与正态曲线与X轴围成的面积为轴围成的面积为1.正态分布是对称分布,其对称轴位置为期望值正态分布是对称分布,其对称轴位置为期望值(mean,median和和mode三者合一)其概率密度曲线三者合一)其概率密度曲线为钟型为钟型.且偏态系数等于且偏态系数等于0及峰度系数为及峰度系数为3。正态曲线的形状由随机变量的标准差决定正态曲线的形状由随机变量的标准差决定.标准差越标准差越大大,正态曲线矮胖正态曲线矮胖;标准差越小标准差越小,正态曲线高瘦正态曲线高瘦.Reference to p219-22040.正态分布图形的特点正态分布图形的特点41.一般正态分布的概率密度函数一般正态分布的概率密度函数xX服从正态分布服从正态分布记为记为:N (,)E(X)=V(X)=242.正态分布下方的面积集中在中心部分而向两边逐渐减少。正态分布下方的面积集中在中心部分而向两边逐渐减少。任何正态曲线下,在任何正态曲线下,在左右一个标准差范围内(左右一个标准差范围内()包)包含总体单位总数的含总体单位总数的68.3%,即随机变量取值在这个范围,即随机变量取值在这个范围内的概率内的概率P(-x+)为为68.3%,在,在2范围内约为范围内约为95.0%,在,在3范围内约为范围内约为99.7%。f(x)x-+-2+20.34150.13600.13606质量管理43.标准正态分布的概率密度函数标准正态分布的概率密度函数0ZzZ为标准为标准正态变量正态变量Z N(0,1)E(Z)=0V(Z)=144.45.-3 -2 -1 0 1 2 30.68260.95440.9972P229methods8-1346.Example 1 College Womens Heights Data suggest the distribution of heights of college women modeled by a normal curve with mean m=65 inches and standard deviation s=2.7 inches.Note:Tick marks given at the mean and at 1,2,3 standard deviations above and below the mean.Empirical Rule values are exact characteristics of a normal curve model47.Example 2 某企业生产日光灯某企业生产日光灯,日光灯的使用寿命服日光灯的使用寿命服 从正态分布从正态分布,其均值为其均值为1000小时小时,标准差标准差 为为200小时小时,试求使用寿命在下列范围内试求使用寿命在下列范围内 的概率的概率.1.使用寿命在使用寿命在800-1200小时之间小时之间;2.使用寿命在使用寿命在600-1400小时之间小时之间;3.使用寿命在使用寿命在400-1600小时之间小时之间;4.使用寿命小于使用寿命小于920小时小时;48.Result of example 249.书中标准正态分布附表数字为书中标准正态分布附表数字为0到右边到右边Z的面积。的面积。P223-22650.Exercise:某旅行社在春季每天接待的海外旅游者的人数某旅行社在春季每天接待的海外旅游者的人数x服从服从正态分布,平均数正态分布,平均数=1000人,标准差人,标准差=200人,求人,求下列概率。下列概率。1)每天接待人数在)每天接待人数在850人至人至1000人之间的概率。人之间的概率。2)每天接待人数在)每天接待人数在800人至人至1100人之间的概率。人之间的概率。3)每天接待人数在)每天接待人数在1200人至人至1300人之间的概率。人之间的概率。4)每天接待人数超过)每天接待人数超过1330人的概率人的概率。51.正态曲线所示概率850 1000 -0.75 0 1000 1200 1300800 1000 1100-1 0 0.5 0 1 1.5 1000 1330 0 1.6552.Approximating Binomial Distribution ProbabilitiesIf X is a binomial random variable based on n trials with success probability p,and n is large,then the random variable X is also approximately normal,with mean and standard deviation given as:Conditions:Both np and n(1 p)are at least 10.53.Example3 Number of H in 30 Flips X=number of heads in n=30 flips of fair coinBinomial distribution with n=30 and p=.5.Distribution is bell-shaped and can be approximated by a normal curve.54.实际应用中,只要实际应用中,只要n 和和n(1-)都大于等于都大于等于5时,就可以利用正态分布近似求二项分布的时,就可以利用正态分布近似求二项分布的概率。令概率。令=n ,=则服从则服从二项分布的随机变量二项分布的随机变量x,近似服从正态分布。,近似服从正态分布。N(,)Example4:某洗衣长估计其在某洗衣长估计其在 1998年生产销售年生产销售的某种型号洗衣机中已有的某种型号洗衣机中已有90%的电视主机轴需的电视主机轴需要更换。他们在下设的一些维修服务台随机抽要更换。他们在下设的一些维修服务台随机抽取了取了400个维修记录,求:个维修记录,求:1)更换主轴数为)更换主轴数为350个的概率;个的概率;2)更换主轴数不超过)更换主轴数不超过350个的概率。个的概率。55.解:本例属于二项分布问题,解:本例属于二项分布问题,=0.9,n=400,所以更换电所以更换电视主轴数为视主轴数为350个的概率为:个的概率为:P(x=350)=C *(0.9)350*(0.1)50=0.0165用二项分布计算非用二项分布计算非常麻烦,下面考虑用正态分布近似求这个概率值。常麻烦,下面考虑用正态分布近似求这个概率值。n =400*0.9=360,n(1-)=400*0.1=40均大于均大于5,所以可,所以可以用正态分布来近似计算。以用正态分布来近似计算。=n =360,=6,即变量,即变量x近似服从近似服从N(360,6)。)。P(x=350/n,)P(349.5x350.5/,)=P(349.5x360)-P(350.5 x360)=0.017同样可求不超过同样可求不超过350的概率。的概率。P(x 350/n,)P(x 350.5/,)=0.5-P(350.5 x360)=0.057156.6 质量管理的有关资料质量管理的有关资料达到的质量等级 每百万次机会中的次品率合格率1690,00030.92308,00069.2366,80093.346,21099.4532099.9863.499.999757.70年代,大部分生产性企业的质量达到1-280-90年代,达到390年代中期达到4-5当前,达到6在服务行业的质量标准比生产部门低,能实现99%的合格率以相当不错了,但他与 6 的标准相差较大。6 质量管理的有关资料质量管理的有关资料58.6 6 质量管理的有关资料质量管理的有关资料7(美国统计数据)4 (99.4%)6 (99.9997%)每周5000次外科手术失误每周1.7次外科手术失误每年200,000例错误药方每年68例错误药方邮件递送系统每小时丢失20,000份邮件邮件递送系统每小时丢失7份邮件每天两次主要机场着陆误点每5年主要机场着陆误点一次59.质量管理的有关资料质量管理的有关资料当今,美国公司的平均水平医院开药方的准确率为2.6饭店帐单的准确率不足3公司计算工资单的准确率约3机场行李卸载与提取的准确率接近3.2航空安全的质量标准平均为960.6 质量管理的有关资料质量管理的有关资料(中国数据:2000年)99%99.9997%每小时有9534个邮件投递错误或丢失每小时有3个邮件投递错误每小时有27276次长途电话没有正常完成每小时有9次长途电话没有正常完成首都国际机场平均每天5次不合格的着陆首都国际机场平均每周1次不合格的着陆银行的电子结算系统每小时有12,854个交易错误银行的电子结算系统每小时有6个交易错误61.此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服