资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,概率论与数理统计,谨以此献给我所有可爱的,才华横溢的学生!,关彦辉,G_yanhui,是的,正是这样!,我们将开始神奇之旅,感动上帝!,在第二次世界大战中,美国曾经宣布:一名优秀数学家的作用超过,10,个师的兵力。这句话有一个非同寻常的来历。,1943,年以前,在大西洋上英美运输船队常常受到德国潜艇的袭击,当时,英美两国限于实力,无力增派更多的护航舰。一时间,德军的,“,潜艇战,”,搞得盟军焦头烂额。,为此,有位美国海军将领专门去请教了一位数学家,数学家们运用概率论分析后认为:舰队与敌潜艇相遇是一个随机事件,从数学角度来看这一问题,它具有一定的规律性。一定数量的船(为,100,艘)编队规模越小,编次就越多(为每次,20,艘,就要有,5,个编次)。编次越多,与敌人相遇的概率就越大。,美国海军接受了数学家的建议,命令舰队在指定海域集合,再集体通过危险海域,然后各自驶向预定港口。结果奇迹出现了:盟军舰队遭袭被击沉的概率由原来的,25,降为,1,,大大减少了损失,保证了物资的及时供应,1,名数学家,10,个师,回顾 引入,概率论的历史,概率(,Probability,),亦称为赌博法,机遇论,猜测艺术等,它的思想可追溯自公元前,220,年以前的中国的一些文献,.,不过真正的历史却只有三百来年而已,.,如今,但凡要进行信息处理,决策制定,实验设计等等,只要涉及数据,必用概率统计的模型和方法,.,例如,在经济,管理,工程,技术,物理,化学,生物,环境,天文,地理,卫生,教育,语言,国防等领域有非常重要的应用,.,这一天,法国一位贵族、职业赌徒梅累(,De Mere,),向法国,数学家、,物理学家帕斯卡(,Pascal,),提出了一个十分有趣的,“,分赌注,”,问题,问题是这样的,一次梅累和赌友掷硬币,各押赌注,32,个金币双方约定,先胜三局者为胜,取得全部,64,个金币,.,赌博进行了一段时间,梅累已经赢了两局,赌友已经赢了一局这时候梅累接到通知,要他马上陪同国王接见外宾,赌博只好中断了请问:两个人应该怎样分这,64,个金币才算合理呢,?,概率论的生日:,1654,年,7,月,29,日,赌友说,他要再碰上两次正面,或梅累要再碰上一次正面就算赢,所以他主张赌金应按,2,:,1,来分。即自己分,64,个金币的 ,梅累分,64,个金的 。,梅累争辩说,不对,即使下一次赌友掷出了正面,他还可以得到 ,即,32,个金币;再加上下一次他还有一半希望得到,16,个金币,所以他应该分得,64,个金币的 ,赌友只能分得,64,个金币的 。两人到底谁说得对呢,?,古典概率时期,工具:排列组合,主要工作:,Pascal,Fermat,Huygens,Bernoulli James,De Moivre Abraham,Bernoulli Daniel,等等,.,论赌博中的计算,,,1657,,,(,De Ratiociniis in Ludo Aleae,),猜测的艺术,1713,Ars Conjectandi,详尽论述排列组合理论,提出了概率论在民间,道德,经济上的应用,.,论赌博法,1711,机遇说,1722,,,Laplace,以前关于概率论的最大贡献,.,赌博法新论,1730,关于猜测的新问题的分析研究,1759,,,将概率论推广于人寿保险,健康统计上,.,分析概率时期,工具:微积分等现代数学,主要工作:,De Moivre Abraham,Laplace,The Doctrine of Chances,1733,由二项式公式推出正态分布曲线,概率分析理论,1812,Th,orie Analytique des Probabilits,标志进入分析概率时期的伟大著作,.,等等,.,Kolmogorov(1903 1987),概率论的基本概念,1933,给出了概率论的公理化定义,标志概率论进入现代数学范畴,.,一、随机现象,1.1,随机事件,第一章随机事件与概率,概率论研究的对象是什么?,现象,确定现象,随机现象,概率论研究什么问题?,RPWT,它的原意是指刮风、下雨、阴天、晴天 这些天气状况很难 预料,后来它被引 申为:世界上很多 事情具有偶然性,人们不能事先判定这些事情是否会发生。,降水概率,90%,“,天有不测风云,”,人们果真对这类偶然事件完全无法把握、束手无策吗?,随着对事件发生的可能性的深入研究,人们发现许多偶然事件的发生也具有规律可循的。概率这个重要的数字概念,正是在研究这些规律中产生的。人们用它描叙事件发生的可能性的大小。例如,天气预报说明天的降水概率为,90%,,就意味着明天有很大可能下雨(雪)。,降水概率,90%,试分析,:,“,从一堆牌中任意抽一张抽到红牌,”,这一事件的发生情况,?,可能发生,也可能不发生,必然发生,必然不会发生,木柴燃烧,产生热量,明天,地球还会转动,问题情境,在,0,0,C,下,这些雪融化,实心铁块丢入水中,铁块浮起,煮熟的鸭子,跑了,水从高处流向低处,太阳从西边升起,在一定条件下,,事先就,能断定发生或不发生,某种结果,这种现象就是,确定性现象,.,“,函数在间断点处不存在导数,”,等,.,确定性现象的特征,条件完全决定结果,.,研究的数学工具:代数,微积分,微分方程等等,.,转盘转动后,指针指向黄色区域,在一定条件下,,某种现象,可能发生也可能不发生,,事先,不能断定,出现哪种结果,这种现象就是,随机现象,.,这两人各买,1,张彩票,她们中奖了,实例,1,“,在相同条件下掷一枚均匀的硬币,观,察正反两面出现的情况”,.,结果有可能,出现正面,也可能,出现反面,.,结果有可能为,:,“1”,“2”,“3”,“4”,“5”,或“,6”.,实例,3,“,抛掷一枚骰子,观察出现的点数”,.,实例,2,“,在相同条件下生产同一种零件,观察它们的尺寸,”,.,结果,:,“,它们的尺寸总会有一点差异,”,.,实例,4,“,从一批含有正品和次品的产品中任意抽取一个产品”,.,其结果可能为,:,正品,、,次品,实例,5,“,过马路交叉口时,可能遇上各种颜色的交通,指挥灯”,.,实例,6,“,一只灯泡的寿命”可长可短,.,个别随机现象:原则上不能在相同条件下重,复出现(例,6,),.,随机现象的特征,条件不能完全决定结果,.,随机现象的分类,大量性随机现象:在相同条件下可以重复出现,(例,1-5,),.,某些物理学家,说不定认为对投掷铜板,由给定投掷的速度、角度、地面的弹性、铜板的形状及重量等条件,可算出铜板落地后,会那一面朝上,因此这不是随机。至于六合彩的开奖,只要起始条件都能测出,则会开出那一号球,也能算出,因此这也不是随机。但你大约也知道所谓蝴蝶效应,(,butterfly effect,),。测量极可能有误差,而有时一些微小的改变,影响却可能很大。因此我们宁可相信这些都是随机现象。,某些神学家,可能认为一切其实都是按照神的旨意在进行,只是我们不知而已。说不定真是如此。但若无从了解神的旨意,对于未来,也只好视为随机。,随着科技进步,人们逐渐弄明白很多现象的来龙去脉。例如,我们知道女性一旦怀孕,婴儿性别便已确定。但对一大腹便便的妇女,好事者由于不知,仍可猜测其生男生女之机率。考试前夕,学生们虽认真准备,但还是绞尽脑汁猜题,各有其认为考出机率很大的题目。老师获知后,觉得好笑。实则试题早已印妥,而学生不知考题,且未体会老师的暗示及明示,所以仍可以大猜一通。另外,诸如门外有人敲门,你好奇是男是女?老师要你猜拿在背后的水果,是橘子或苹果?同学盖住落地的铜板,要你猜正面或反面朝上?这类明明已确定的事,本身其实并不随机,只是对你而言,却有如,“,子非鱼,”,,当然可猜鱼快乐的机率。,2,随机现象从表面上看,似乎杂乱无章,没有规律,.,但实践证明,如果同类的随机现象大量,重复出现,它的总体就呈现出一定的规律性,.,1,随机现象,揭示了条件和结果之间的,非确定性,联系,其数量关系无法用函数加以描述,.,这种规律性随着我们观察的次数的增多而愈加明显,.,这种由大量同类随机现象所呈现出来的集体规律性叫做,统计规律性,.,概率论和数理统计就是研究这种统计规律性的数学学科,.,二、随机现象的,统计规律性,机遇在爱情与工作上扮演着极其重要的角色。,我们在人生中其实不是按明确路线前进的汽车司机,而更像是弹珠游戏里到处碰运气的珠子。,必然性使人们愿意事先好好准备。,随机性使人们对未来,充满着盼望与戒慎恐惧。,光有必然性,亳无变异,对未来缺乏盼望,人们将少了努力的动机。,光有随机性,只靠运气,将令人失去积极认真的企图心。,以开放的心态面对生活中的岔道口,能看到别人错过的机会。,即使事与愿违,也能很快摆脱失望,走向下一个幸运之地。,他们更加快乐,更容易达成心愿。,三分天注定,五分靠打拼,两分靠运气。,由于变异无可避免的存在,要了解变异,,,设法减少变异。,虽世事多变,,但万物有常,存在,随机法则,。,看似没有规律,其实被,大数法则,规范。,随机现象是通过随机试验来研究的,.,问题,什么是随机试验,?,随机试验,现在,就让我们一起,步入这充满随机性的世界,开始第一步的探索和研究,.,1.,可以在相同的条件下重复地进行,;,2.,每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果,;,3.,每次测试的结果事前不可预言,.,定义,:,在概率论中,把具有以下三个特征的试验称为,随机试验,.,随机试验简称为,试验,,记为,E,.,特点:,可重复性,,,可观察性,,,随机性,.,实例,“,抛掷一枚硬币,观察字面,花面出现的情况,”,.,分析,:,(1),试验可以在相同的条件下重复地进行,;,(2),试验的所有可能结果,:,字面、花面,;,(3),进行一次试验之前不能确定哪一个结果会出现,.,故为随机试验,.,1.,“,抛掷一枚骰子,观察出现的点数,”,.,2.,“,从一批产品中,依次任选三件,记录出现正品与次品的件数,”,.,同理可知下列试验都为随机试验,3.,记录某公共汽车站某日上午某时刻的等车人数,.,4.,考察某地区,10,月份的平均气温,.,5.,从一批灯泡中任取一只,测试其寿命,.,三、样本空间,样本点,:随机试验结果的出现是不确定的,但所有可能结果是明确的,.,随机试验的每一个可能结果称为一个样本点,记为,样本空间,:样本点的全体,记为,如果试验是将一枚硬币抛掷两次,则样本空间由如下四个样本点组成:,S,=(,H,H,),(,H,T,),(,T,H,),(,T,T,),第,1,次,第,2,次,H,H,T,H,H,T,T,T,(,H,T,),:,(,T,H,):,(,T,T,),:,(,H,H,):,其中,样本空间在如下意义上提供了一个理想试验的模型:,在每次试验中,必有,一个样本点出现,且仅有,一个样本点出现,.,例,1,写出下列随机试验的样本空间,.,1),观,将一枚硬币连抛,N,次,观察正面出现的次数,.,2),抛掷一枚骰子,观察出现的点数,.,从一批产品中,依次任选三件,记录,出现正品与次品的情况,.,4),记录某公共汽车站某日,上午某时刻的等车人数,.,5),考察某地区,12,月份的平均气温,.,6),从一批灯泡中任取一只,测试其寿命,.,2,同一试验,若试验目的不同,则对应的,样本空 间也不同,.,如:,对于同一试验,:“,将一枚硬币抛掷三次,”,.,若观察正面,H,(,Heads,),、反面,T(Tails),出现的情况,则样本空间为,若观察出现正面的次数,则样本空间为,注,1,试验不同,对应的样本空间也不同,.,3,建立样本空间,事实上就是建立随机现象,的数学模型,.,因此,一个样本空间可以概括许多,内容大不相同的实际问题,.,如:,只包含两个样本点的样本空间,它既可以作为抛掷硬币出现,正面,或出现,反面,的,模型,也可以作为产品检验中,合格,与,不合格,的模,型,又能用于排队现象中,有人排队,与,无人排队,的,模型等,.,所以在具体问题的研究,中,描述随机现象的第一步,就是建立样本空间,.,四、随机事件(,Event,),事件,:随机试验中某些结果所构成的集合,这些结果具有某一可观察的特征,.,随机事件,:在试验中,可能发生,亦可能不发生的事件,.,必然事件,:必然发生的事件,记为,不可能事件,:一定不会发生的事件,记为,基本事件,:恰含一个样本点的事件,.,Remark,一般可将必然事件,不可能事件视为随机事件的极端情形,并统一简称为事件,.,2.,事件,A,与,B,相等,:记作,A=B,,表示,A,B,并且,B A.,A,B,六、,事件,间的关系及运算,1.,事件,A,包含,B,(,B,包含于,A,),:表示事,件,B,发生事件,A,必然,发生,,记作,A,B,(或,B,A,)。例如,:A,(掷出奇数点),B(,掷出一点,),解:,1),显然,,B,发生必然导致,A,发生,所以,B,A,;,.,2),又因为,A,发生必然导致,B,发生,所以,A,B,,,由此得,A,=,B,.,Example,口袋中有,a,个白球、,b,个黑球,从中一个一个不返回地取球。,A,=,“,取到最后一个是白球,”,,,B,=,“,取到最后是白球段,”,。问,A,与,B,的关系?,A+B,AB,5.,事件,A,与,B,的差事件,:,表示,A,发生而,B,不发生,,记作,A-B,。,A-B,A,B,B,A,Property,8.,有限个或可数个事件的并与交,9.,完备事件组,七、随机事件的运算律,和的交换律:,和的结合律:,交的交换律:,交的结合律:,第一分配律:,第二分配律:,自反律:,第一对偶律:,第二对偶律:,符号集合论含义概率论含义,全集样本空间,必然事件,空集不可能事件,集合的元素样本点,单点集基本事件,A,一个集合一个事件,A B,A,的元素在,B,中,A,发生必然导致,B,发生,A=B,集合,A,与,B,相等事件,A,与,B,相等,A,B,A,与,B,的所有元素,A,与,B,至少有一个发生,A,B,A,与,B,的共同元素,A,与,B,同时发生,A,的补集,A,的对立事件,A,-,B,在,A,中而不在,B,中的元素,A,发生而,B,不发生,A,B=,A,与,B,无公共元素,A,与,B,互不相容,Example,试用,A,、,B,、,C,表示下列事件:,A,出现;,仅,A,出现;,恰有一个出现;,至少有一个出现;,至多有一个出现;,都不出现;,不都出现;,至少有两个出现;,1.2,随机事件的概率,概率的直观定义,随机事件 发生的可能性大小的度量(数值),称为事件 发生的概率,记为,拉普拉斯有一个信念:偶然现象有稳定的统计规律性,一般人或许认为,:,生男生女的可能性是相等的,因而推测出男婴和女婴的出生数的比应当是,1:1,可事实并非如此,.,1814,年,法国数学家,拉普拉斯,(,Laplace 17941827,),在他的新作,概率的哲学探讨,一书中,记载了一下有趣的统计,.,他根据,伦敦,彼得堡,柏林和全法国,的统计资料,得出了几乎完全一致的男婴和女婴出生数的比值是,22:21,即在全体出生婴儿中,男婴占,51.2%,女婴占,48.8%.,可奇怪的是,当他统计,1745,1784,整整四十年间,巴黎,男婴出生率时,却得到了另一个比是,25:24,男婴占,51.02%,与前者相差,0.14%.,对于这千分之一点四的微小差异,!,拉普拉斯对此感到困惑不解,他深信自然规律,他觉得这千分之一点四的后面,一定有深刻的因素,.,于是,他深入进行调查研究,终于发现,:,当时巴黎人,“,重男轻女,”,有抛弃女婴的陋俗,育婴堂嬷嬷捡去后又上报一次,以至于歪曲了出生率的真相,经过修正,巴黎的男女婴的出生比率依然是,22:21.,定义,一、概率及其频率解释,通常称与试验有关的所有事件的集合为事件域,记为,F,.,则 为,F,上关于,的函数,.,二、从频率的性质看概率的性质,对任意的事件,若 两两互不相容,有,频率的核心性质,实例,将一枚硬币抛掷,5,次、,50,次、,500,次,各做,7,遍,观察正面出现的次数及频率,.,试验,序号,1 2 3 4 5 6 7,2,3,1 5 1 2 4,22,25,21,25,24,18,27,251,249,256,247,251,262,258,0.4,0.6,0.2,1.0,0.2,0.4,0.8,0.44,0.50,0.42,0.48,0.36,0.54,0.502,0.498,0.512,0.494,0.524,0.516,0.50,0,.,502,波动最小,随,n,的增大,频率,f,呈现出稳定性,实验设计。,仿真产生数据。,林觉民,在,“,与妻诀别书,”,中,写不尽对爱妻的不舍。最后说,“,纸短情长,所未尽者尚有几万千,,汝可以模拟得之。,”,纸上谈兵,试验者,抛掷次数,n,“,正面向上,”,次数,m,“,正面向上,”,频率,m/n,棣莫弗,2048,1061,0.518,布 丰,4040,2048,0.5069,费 勒,10 000,4979,0.4979,皮尔逊,12 000,6019,0.5016,皮尔逊,24 000,12012,0.5005,关老师,100 000,随着抛掷次数的增加,“,正面向上,”,的频率的变化趋势有何规律,?,仔细看一看,从上述数据可得,抛硬币次数,n,较小时,频率,f,的随机波动幅,(1),频率有,随机波动性,即对于同样的,n,所得的,f,不一定相同,;,度较大,但,随,n,的增大,频率,f,呈现出稳定性,.,即当,n,逐渐增大时频率,f,总是在,0.5,附近摆动,且逐渐稳定于,0.5.,掷骰子实验,:,把一个骰子抛掷多次,观察其出现的结果,并记录各结果出现的频数,然后计算各频率,.,一枚硬币引发的故事,在掷硬币试验中,当 较小时,比值的波动较大,而当 逐渐增大时,该值波动亦逐渐稳定于,0.5.,若对一试验重复足够多次,我们可认为此试验的所有可能情形均已发生,.,那么,我们再做一次试验,只不过在重复曾经的试验而已,结果当然应该与那次被重复的试验的结果一致,.,于是,我们只要看看我们要考虑的事件与总试验次数的比值的稳定值,便可估计该事件发生的可能性大小,.,当然,此稳定值并非概率的本质,不应作为概率的定义,.,但正如上面所说,由于它揭示了隐藏于随机现象中的内在规律性,用于估计事件发生的可能性大小却是合理的,.,孩子们,明白了吗?,不明白?,好吧,理性点。,大数定律告诉我们,当,n,时,频率的极限是概率!,概率的统计定义,在相同条件下重复进行的,n,次,试验中,事件,A,发生的频率稳定地在某一,常数,p,附近摆动,且随,n,越大摆动幅度越,小,则称,p,为事件,A,的概率,记作,P,(,A,).,统计概率的特性,优点,:,易于理解,生活中比比皆是,缺点,:,大量重复试验的局限性,只能得到近似值,作为频率的稳定值,很自然地有:,对任意的事件,若 两两互不相容,有,概率的核心性质,(2),显然成立,;,Proof,(1),由于,是必然事件,每次试验均发生,则其频,率恒等于,1,自然,p,=1;,1,概率,的统计定义直观地描述了事件发生,的可能性大小,反映了概率的本质内容。,Remark,2,与,P,(,A,),的区别,而,P,(,A,),是一个确定的数,!,随机试验有关,;,是一个随机数,是变数,它与,3,当试验次数,n,很大时,有,4,概率统计定义的缺陷,(1),不便于理论研究,.,需要作大量的试验,才能观察出,的稳定值,即无法根据此定义计算某事件的概率,.,(2),在数学上不够严谨,.,毛泽东,,满江红,和郭沫若同志,:,一万年太久,只争朝夕。,对于机率:,不争一时而争千秋。,观测次数够多后,机率的威力就显现。,机率是千秋的事,马克吐温,(1907),:,There are three kinds of lies:lies,damned,lies,and,statistics,.,(,有三种谎言,:,谎言,可恶的谎言,及统计,),统计为何被当做谎言?,关老师说:有数据说明,掷硬币时正面向上的概率为,80%,。,关老师这么老实,肯定没有说谎。那么,谁说谎了哩?,Example in Practice,(统计数字会撒谎,,美,达莱尔,哈夫),使用多克斯牌牙膏将使蛀牙减少,23%,,结论出自一家信誉良好的,“,独立,”,实验室,并且还经过了注册会计师的证实。然而,如果你不是特别容易轻信他人或者盲目乐观,经验将告诉你:一种牙膏难以比其他牙膏好。那么多克斯公司是怎样制造了上述结论?这里的主要把戏是,不充分的样本,统计角度的不充分,,但对于多克斯公司来说已经足够了。只有当你读小字体的文字时才会发现:被测试的用户仅由,12,人组成。单凭这点,你便不得不佩服多克斯公司,而且它留给你一个可能知道全部情况的机会。有的广告商索性将类似的文字都略去,留给读者,即便他是一个老练的统计专家,一个猜想:这里面到底玩了什么把戏?,让规模不大的一组人连续记录六个月的蛀牙数,接着使用多克斯牙膏。之后一定会发生以下的其中一种结果:蛀牙明显增多,蛀牙明显减少或者蛀牙数量无显著变化。如果是第一或者第三种结果,多克斯公司编档保存好这些数字,当然最好是藏在别人找不到的地方,然后重新实验。由于机遇的作用,迟早有一组被测试者将证明有很好的效果,并且这个结果足以好到作为标题甚至引发一场广告战。不过,不管实验者使用的是多克斯牙膏还是发酵粉,或者还是继续使用原来的品牌,上述结果都会发生。任何由于机遇产生的差异,在大样本的使用中都是微不足道的,不足以作为广告标题。,多克斯公司是怎样轻易地获得一个不存在漏洞并经得起检验的结论?,关老师患了重感冒,奄奄一息地来到医生面前。,听到医生的话,你猜关老师有什么反应,?,“,你的病很重,在十个得这种病的人中只有一个能救活,.,”,当关老师被这个消息吓得够呛时,医生继续说:,“,但你是幸运的。因为你找到了我,我已经看过九个病人了,他们都死于此病,.,”,OR,洗具,医生在检查完的时候摇摇头:,吓出一身冷汗,感冒好了,治疗,10,个病人,相当于做,10,次试验,每次试验的结果都是随机的,所以第,10,次治疗的结果也是随机的,关老师挂掉的概率依然是,90%.,恭喜关老师死里逃生!,继续上课!,Heraclitus,:,Ever-newer waters flow on those who step into the same rivers.,赫拉克利特:人不能两次踏进同一条河流,有的事件无法重复试验,称为,一次性事件,。,如:关老师挂掉的可能性是,90%,关老师肯定没有说谎,明天是否下雨,这个病人是否能治愈,新产品销路如何,火星上是否有生命,核弹爆炸的威力,核能电厂的意外,彗星撞地球,主观概率,主观概率定义:合理的信念的测度,是认识主体根据其所掌握的知识、信息和证据,而对某种情况出现可能性大小所做的数量判断。,如:降水率,治愈率,洲际导弹命中率,明年国民经济增长率,,某君看上一女孩,惊为天人,觉得这是他今生的新娘。评估后信心满满,自认追上的机会有,8,成。旁人却都不看好,问他,8,成这一数字,是如何冒出来的?该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。这个,0.8,的概率,就是所谓主观概率。,大约少有女孩,会让你做实验,反复地追,然后数一数其中成功几次,来定下她会被你追上的机率。对这类无法重复观测的现象,在谈概率时,主观概率就常派上用场。,虽说“主观”,但仍要合理。例如,考试有及格与不及格。若认为会及格的机率为,0.9,,这没问题,人总要有点自信,但若又同时担心有,0.8,的机率会不及格,那就不行了。各种可能性发生机率相加要为,1,。即使是主观,可以独排众议,仍须自圆其说。不能说,既然是主观,便可以任意自定各事件之概率。因此不论是那一种对概率的解释,都自然地,或必须要满足一些共同的规则。,有个与曾子同名的人杀人,好心者告诉曾母,“,曾参杀人,”,。曾母说,“,吾子不杀人,”,,继续织布。,过一会儿,又有人来说,“,曾参杀人,”,。曾母仍继续织她的布,这么好的儿子怎可能杀人?,但当第三人跑来说,“,曾参杀人,”,,曾母就害怕了,丢掉织布器具翻墙而逃。所谓,“,其母惧,投杼踰墙而走,”,。,主观概率,对于不可重复进行的实验,在,符合概率的公理化定义的三个基本条件下所定义的概率。,主观概率的确定或是依赖于经验所形成的个人信念,或是依赖于对历史信息的提炼,概括和应用。,主观概率的确定虽然带有很大的个人成分,但并不是完全的臆测,并且主观概率在一定的条件下,还可使用贝叶斯公式加以修正。,主观概率至少是频率方法及古典方法的一种补充,有了主观概率,至少可以使人们在频率观点不适用时也能谈论概率,且能使用概率统计方法解决相应的实际问题。,主观概率的应用,主要在于决策问题。,在数据分析方面,贝叶斯概率起着重要的作用。它在,20,世纪得到发扬光大,被称为数理统计学中的贝叶斯学派。与频率学派(基于频率的概率,不允许有主观概率的作用)间曾发生令人瞩目的争论,(,部分是主观概率合法性之争,),。,主观概率适用于对只出现一次而不能重复的事件进行概率描述,而频率的解释则适用于能大量重复的随机事件。,批评:如果概率是人的主观信念的数量度量,那么概率论就很象心理学的一个分支,而对概率进行纯主观的解释最终将导致唯心论。,辩解:客观上有很多只出现一次而又需要作出决策的事件,决策人通过主观概率把自己的以数据、分析和经验为依据的判断表示为数量形式,就可以利用概率的整套数学理论和工具得到结论,这些结论对决策往住非常有用。,Example in Practice,1999,年,1,月,14,日的,科学时报,对,“,神农架是否存在野人,”,问题的讨论做了报道。这当然是一个一次性事件,因为普天下并无第二个神农架。从报道上看,学者们的意见基本一致,即可能性很小。但仍有不同:有的学者认为完全不可能,即把,“,神农架存在野人,”,这个事件的概率判为,0,,另一位学者将其判为,0.05,,还有的学者只判断,“,很小,”,但未给出数值。这就是各学者对这事件发生所判的主观概率。,三、概率的公理化定义,1933,年,苏联数学家,柯尔莫哥洛夫,(,1903-1987,),提出了概率论的公理化结构,给出了概率的严格定义,使概率论有了迅速的发展,.,(A.H.,1903-1987,),1939,年任苏联科学,院院士,.,先后当选美,法,意,荷,英,德 等国的外,籍院士 及皇家学会会员,.,为,20,世纪最有影响的苏联数学家,.,苏联数学家,柯尔莫哥洛夫,设 为样本空间,,F,为 上的事件域,称,F,上的实值函数 为,上的一个,概率测度,,若它满足:,公理一:,(规范性),公理二:对任意的事件,(非负性),公理三:若两两互不相容,有,(可列可加性),其中,对任意给定的具体事件 称为事件 的,概率,.,一个具有概率测度的样本空间 称为一个,概率空间,,记为,F,简记为,证明,由公理,3,知,所以,四,、,概率测度的其他性质,不可能事件的概率为零,.,最小性,注意事项,但反过来,如果,P,(,A,),=0,,未必有,A=,例如:,随机在闭区间,0,5,取值,在某次试验中,取到的数字为,2.,我们知道,在这类试验中,刚好取到,2,的概率为,0,,但它却真实发生了,并非不可能事件,.,设,A,1,,,A,2,,,A,n,两两,互不相容,,则,证明,在公理,3,中,取,i,=,(,i,=,n,+1,n,+2,),.,2.,有限可加性,证明,由于与其对立事件互不相容,由有限可加性有,而,所以,3.,逆事件的概率,若,A B,,则,P(B,A)=P(B),P(A),()()(),4.,差事件的概率,推论,1(,单调性,),推论,2(,性质:有界性,),推论,3(,减法公式,),对任意两个随机事件、,有,.,加法定理,又由减法公式,得,因此得,B,C,A,加法定理的推广,Proof,使用数学归纳法证明,.,一般加法公式,以下省略,416,字,.,连续性,8.,下连续性,设 为上升的事件序列,即,则,Proof.,设,9.,上连续性,设 为下降的事件序列,即,则,则由可加性条件,,Proof.,讨论,利用下连续性即可,.,例:,如果某种彩票的中奖概率为,,那么买,1000,张这种彩票一定能,中奖吗?为什么?,不一定,.,买,1000,张这种彩票的中奖概率约为,1-0.999,1000,0.632,,即有,63.2%,的可能性中奖,但不能肯定中奖,.,9,7,3,2,1,4,5,6,8,10,解法,1,例,解法,2,Example,The Wall Street Journal,2004.4.10,公布了,30,家最大的股票和对冲基金的,1,年期收益率和,5,年期收益率,截止日期为,2000.3.31.,假定,1,年期收益率超过,50,,或,5,年期收益率超过,300,称为高收益,.,有,9,项基金,1,年期收益率超过,50,,,7,项基金,5,年期收益率超过,300,,其中,5,项基金,1,年期收益率超过,50,且,5,年期收益率超过,300,.,现在我们随机选择一个基金,问选到的基金,1,年期和,5,年期收益率均非高收益的概率是多少?,若随机试验,E,具有下列,两个,特征:,1),有限性,样本空间,中,只有有限个样本点:,2),等可能性,则称,E,所描述的概率模型为,古典概型,.,古典概型随机试验,一、古典概型定义,1.3,古典概型与几何概型,古典概型中事件概率的计算公式,A,为,E,的任意一个事件,且包含,m,个样本点,则事件,A,出现的概率为,:,设试验,E,的样本空间,由,n,个,样本点构成,例,1,将骰子先后抛掷,2,次,计算:,(,1,)一共有多少种不同的结果?,(,2,)其中向上的数之和是,5,的结果有多少种?,(,3,)向上的数之和是,5,的概率是多少?,问题,1,设箱中有,只白球和,只黑球,现从袋中,(1),无放回地摸球,基本事件总数为,:,A,所包含,基本事件的个数为,解,设,A=,所取球恰好含,a,个白球,b,个黑球,无放回,地依次摸出,a+b,只球,求所取球恰好含,a,个,白球,b,个黑球的概率,(,a,b,),?,古典概型的问题一般可转化为摸球模型,有一个黑壶,一个白壶,.,黑壶中有,5,个红球,,6,个绿球;白壶中有,3,个红球,,4,个绿球,.,你可以先选择一个壶,然后从这个壶中随机抽取一球,.,假如你抽到红球的话,你将会获得奖励,.,你愿意选择哪个壶进行抽球哩?,选择黑壶的话,抽中红球的概率是,5/11=0.455,;,选择白壶的话,抽中红球的概率是,3/7=0.429.,应选择黑壶,.,Example,再考虑另外的一个黑壶和一个白壶,.,这个黑壶中有,6,个红球,,3,个绿球;白壶中有,9,个红球,,5,个绿球,.,现在打算选择哪个壶来抽球哩?,选择黑壶的话,抽中红球的概率是,6/9=0.667,;,选择白壶的话,抽中红球的概率是,9/14=0.643.,还是应该选择黑壶,.,最后,我们把第二次试验中黑壶的球倒入第一次试验中的黑壶,把第二次试验中白壶的球倒入第一次试验中的白壶,.,同样地你可以先选择一个壶来抽取红球,你愿意选择哪个壶?,直观告诉我们,选择黑壶,.,我们还是算一算来验证吧,.,黑壶中有,11,个红球,,9,个绿球,抽到红球的概率是,11/20=0.55.,白壶中有,12,个红球,,9,个绿球,抽到红球的概率是,12/21=0.571.,应当选择白壶,与我们的直觉完全相反,.,辛普森悖论,(,Simpsons paradox,),.,量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏,.,念天地之悠悠,独怆然而涕下,。,如果我们在人生的抉择上选择了一条比较难走的路,就更有可能不被赏识。,迎合普世价值,让我们成为全才,同时也陷入,“,怀才不遇,”,困境。,独特的人生更精彩!,陈子昂,,,登幽州台歌,:,(,2,),有放回地摸球,例,2,设袋中有,4,只红球和,6,只黑球,现从袋中,有放回,地,解,第,1,次摸球,10,种,第,2,次摸球,10,种,6,种,第,1,次摸到黑球,6,种,第,2,次摸到黑球,4,种,第,3,次摸到红球,基本事件总数为,摸球,3,次,求前,2,次摸到黑球、第,3,次摸到红球的概率,.,第,3,次摸球,10,种,基本事件总数为,A,所包含,基本事件的个数为,Example 3,请问:在 个人中,至少有一对生日相同的概率有多大?(假定一年,365,天),本问题可摸球化为:,黑箱中有,365,个球,随机有放回地取 次,问必有重复取球的概率有多大?,世界杯正在举行,5,个球迷好不容易才搞到一张入场券,.,大家都想去,只好用抽签的方法来解决,.,入场,券,5,张同样的卡片,只有一张上写有“入场券”,其余的什么也没写,.,将它们放在一起,洗匀,让,5,个人依次抽取,.,后抽比先抽的确实吃亏吗?,“,先抽的人当然要比后抽的人抽到的机会大,.”,到底谁说的对呢?让我们用概率论的知识来计算一下,每个人抽到“入场券”的概率到底有多大,?,“,大家不必争先恐后,你们一个一个,按次序来,谁抽到入场券的机会都,一样大,.”,“,先抽的人当然要比后抽的人抽到的机会大。”,抽签不必争先恐后,.,袋中有,a,只黑球和,b,只白球,,k,个人把球随机的一只只,解法二,把小球编号,将,k,个人取球构造样本空间,解法一,把小球编号,将,(,a,+,b,),个人取球构造样本空间,则样本点总数为,(,a,+,b,)!,;第,k,个人取到黑球,有,a,种,其余的顺序可以任意排列,因此,摸出来,求第,k,个人摸出的是黑球的概率,.,抽签不必争先恐后,.,Example1.16,解法三,把,a,只黑球看作是无区别的,把,b,只白球也看作没有区别的,.,第一、二种解法考虑到了顺序,因此用排列来解决;,第二种解法不注重顺序而用组合,.,对于同一个随机现象可以用不同的样本空间来描述,,因此同一个概率也有不同的求法,.,二、几何概型,定义,若试验,E,具有下列特征:,1),无限性:,E,的样本空间,是某,几何空间中的,2),等可能性:,每个样本点的出现是等可能的,,则称,E,所描述的概率模型为,几何概型,,,并称,E,为,几何概型随机试验,.,一个区域,其包含无穷多个样本,点,每个样本点由区域,内的点,的随机位置所确定,.,即样本点落在,内几何度量相同,的子区域是等可能的,,例如,考虑平面区域 其面积记为在 中等可能任意投点,.,“,等可能,”,的确切含义是:点落于 中任意子区域 的概率与区域 的面积 成正比,.,即:若仍以 表示,“,点落于 中,”,,则存在常数 使,再利用,有,注,1,几何空间,一维,二维,三维,几何度量,长度,面积,体积,对于随机试验,E,,以,m,(,A,),表示事件,A,的,几何度量,,为样本空间,.,若,0,m,()+,则,对于任一事件,A,,其概率为,2,那末,两人会面的充要条件为,连,.,求甲、乙两人能会面的概率,.,解,甲、乙两人相约在,0,到,T,这段时间内,在预,定地点会面,.,先到的人等候另一个人,经过时间,t,(,t,0),的一些平行线,,向平面任意投一长为,l,(,l,0,则称,(1),定义,1.3,为在,事件,B,发生,的条件下,事件,A,的条件概率,.,Sample space,Reduced sample space given event B,条件概率,P(A|B),的样本空间,条件概率的性质,譬如,2),从加入条件后改变了的情况去算,条件概率的计算,1),用定义计算,:,P,(,B,)0,掷骰子,例:,A,=,掷出2,点,,B,=,掷出偶数点,P,(,A,|,B,),=,B,发生后的缩减,样本空间所含样,本点总数,在缩减样本空,间中
展开阅读全文