1、第四章 大数定律与中心极限定理1 1 特征函数特征函数特征函数是处理许多概率论问题的有力工具特征函数是处理许多概率论问题的有力工具.它能把寻求独立随机变量和的分布的卷积运它能把寻求独立随机变量和的分布的卷积运算转换成乘法运算算转换成乘法运算.它能把求分布的各阶原点矩它能把求分布的各阶原点矩(积分运算积分运算)转换成转换成微分运算微分运算.它能把寻求随机变量序列的极限分布转换成它能把寻求随机变量序列的极限分布转换成一般的函数极限问题一般的函数极限问题.它能完全决定分布函数它能完全决定分布函数.它具有良好的分析性质它具有良好的分析性质函数函数1.1 1.1 特征函数的定义特征函数的定义1.2 1.
2、2 特征函数的计算特征函数的计算例例 常用分布的特征函数常用分布的特征函数1.3 1.3 特征函数的性质特征函数的性质证明证明证明证明证明证明证明证明证明证明例例 常用分布的特征函数常用分布的特征函数解解证明证明证明证明证明证明证明证明证明证明解解解解1.4 1.4 分布函数的再生性分布函数的再生性2 大数定律大数定律“概率是频率的稳定值概率是频率的稳定值”。前面已经提到,。前面已经提到,当随机试验的次数无限增大时,频率总在当随机试验的次数无限增大时,频率总在其概率附近摆动,逼近某一定值。大数定其概率附近摆动,逼近某一定值。大数定理就是从理论上说明这一结果。正态分布理就是从理论上说明这一结果。
3、正态分布是概率论中的一个重要分布,它有着非常是概率论中的一个重要分布,它有着非常广泛的应用。中心极限定理阐明,原本不广泛的应用。中心极限定理阐明,原本不是正态分布的一般随机变量总和的分布,是正态分布的一般随机变量总和的分布,在一定条件下可以渐近服从正态分布。这在一定条件下可以渐近服从正态分布。这两类定理是概率统计中的基本理论,在概两类定理是概率统计中的基本理论,在概率统计中具有重要地位。率统计中具有重要地位。大量的随机现象中平均结果的稳定性大量的随机现象中平均结果的稳定性 大数定律的客观背景大数定律的客观背景大量抛掷硬币大量抛掷硬币正面出现频率正面出现频率字母使用频率字母使用频率生产过程中的生
4、产过程中的废品率废品率 定理(契比雪夫定理(契比雪夫(Chebyshev)不等式)不等式):设设随机变量随机变量X具有数学期望具有数学期望E(X)=,方差方差D(X)=2,则对于任意正数则对于任意正数,有有 定义定义:设设Xk是随机变量序列,数学期望是随机变量序列,数学期望E(Xk)(k=1,2,.)存在,若对于任意存在,若对于任意 0,有,有则称随机变量序列则称随机变量序列Xn服从大数定律服从大数定律.2.1 大数定律的定义大数定律的定义定理定理(契比雪夫契比雪夫(Chebyshev)大数定大数定律律):设设Xk是两两不相关的随机变是两两不相关的随机变量序列量序列,具有数学期望具有数学期望E
5、(Xk)和方差和方差D(Xk),k=1,2,.,若存在常数若存在常数C,使得使得D(Xk)C(k=1,2,),则对于任意给定则对于任意给定的的0,恒有恒有证明证明2.2 大数定律大数定律车贝晓夫车贝晓夫契比雪夫大数定律的特殊情况契比雪夫大数定律的特殊情况 推论推论:设设Xk是两两不相关的随机变量序列是两两不相关的随机变量序列,具有相同的数学期望具有相同的数学期望E(Xk)=和方差和方差D(Xk)=2(k=1,2,),则对于任意给定的则对于任意给定的0,恒恒有有 注注:车贝晓夫大数定律表明,独立随机变量序车贝晓夫大数定律表明,独立随机变量序列列Xn,如果方差有共同的上界,则,如果方差有共同的上界
6、,则与其数学期望与其数学期望 偏差很小的偏差很小的 概率接近于概率接近于1.随机的了,取值接近于其数学期望的概率接随机的了,取值接近于其数学期望的概率接近于近于1.即当即当n充分大时,充分大时,差不多不再是差不多不再是车贝晓夫大数定律给出了车贝晓夫大数定律给出了平均值稳定性的科学描述平均值稳定性的科学描述 例例:设设Xk是相互独立的随机变量序列是相互独立的随机变量序列,均均服从参数为服从参数为的泊松分布的泊松分布,则则Xk服从大数定服从大数定律律.证明证明:已知已知E(Xk)=,D(Xk)=,所以所以Xk满足满足契比雪夫大数定律的所有条件契比雪夫大数定律的所有条件,故对于任意给故对于任意给定的
7、定的0,恒有恒有即即Xk服从大数定律服从大数定律.证明证明定理定理(伯努里伯努里大数定律大数定律):):设进行设进行n n次独次独立重复试验,每次试验中事件立重复试验,每次试验中事件A A发生发生的概率为的概率为p p,记,记n n为为n n次试验中事件次试验中事件A A发生的频率,则对任意的发生的频率,则对任意的0,0,有有证明证明第第i次试验事件次试验事件A发生发生第第i次试验事件次试验事件A不发生不发生则则贝努里贝努里由切由切比雪夫大数定律有比雪夫大数定律有伯努利大数定律表明,当重复试验次数伯努利大数定律表明,当重复试验次数n充分大时,事件充分大时,事件A发生的频率发生的频率n与事件与事
8、件A的的概率概率p有较大偏差的概率很小有较大偏差的概率很小.伯努利大数定律提供了通过试验来确定伯努利大数定律提供了通过试验来确定事件概率的方法事件概率的方法.(理论保障)(理论保障)蒲丰投针问题中解法的蒲丰投针问题中解法的理论依据就是大数定律理论依据就是大数定律 当投针次数当投针次数n很大时,用针与线相交的频率很大时,用针与线相交的频率m/n近似针与线相交的概率近似针与线相交的概率p,从而求得,从而求得的近的近似值似值.针长针长L线距线距a解解解解定理定理(泊松大数定律泊松大数定律):设设Xk是两两不相关的是两两不相关的随机变量序列随机变量序列:PXk=1=pk,PXk=0=qk 其中其中qk
9、=1-pk,则对于任意给定的则对于任意给定的0,恒有恒有0(pk-qk)2=(pk+qk)2-4pkqk证明证明 4pkqk(pk+qk)2=1 E(Xk)=pk,D(Xk)=pk qk0,恒有恒有定理定理(马尔可夫大数定律马尔可夫大数定律):设随机变量序列设随机变量序列Xk,若有马尔可夫条件若有马尔可夫条件则对于任意给定的则对于任意给定的0,恒有恒有解解定理定理(辛钦大数定律辛钦大数定律):设设Xk是相互独是相互独立同分布的的随机变量序列立同分布的的随机变量序列,若有数学若有数学期望期望E(Xk)=(k=1,2,),则对于任意给则对于任意给定的定的0,恒有恒有 注注:若对同一随机变量若对同一
10、随机变量X进行观察进行观察,把第把第k次观察的次观察的结果看着一个随机变量结果看着一个随机变量Xk,则则Xk是相互独立且与是相互独立且与X同分布的随机变量序列同分布的随机变量序列.由辛钦大数定律知由辛钦大数定律知:对随机对随机变量变量X进行进行n次观察的算术平均值依概率收敛于其数次观察的算术平均值依概率收敛于其数学期望学期望E(X),这就为寻找随机变量的数学期望提供了这就为寻找随机变量的数学期望提供了一条切实可行的途径一条切实可行的途径.辛钦辛钦解解3 随机变量序列的收敛性随机变量序列的收敛性则称随机变量序列则称随机变量序列Xn依概率收敛于依概率收敛于X,记为记为 定义:设定义:设Xn是随机变
11、量序列是随机变量序列,若存在随机若存在随机变量变量X(或常数或常数),对于任意对于任意0,有有3.1 依概率收敛依概率收敛 定理定理:设设Xk依概率收敛于依概率收敛于a,Yk依概率收依概率收敛于敛于b,f(x,y)在点在点(a,b)连续连续,则则f(Xk,Yk)依概率依概率收敛收敛f(a,b).证明证明:因因f(x,y)在点在点(a,b)连续连续,故对任给的故对任给的0,存在存在0,当当(x-a)2+(y-b)2 2时有时有|f(Xk,Yk)-f(a,b)|(Xk-a)2+(Yk-b)2 2|f(x,y)-f(a,b)|0,有有不加证明地给出如下定理不加证明地给出如下定理 定理定理:若随机变量
12、序列若随机变量序列Xn以概率以概率1收敛于收敛于X,则则Xn依概率收敛于依概率收敛于X.证明证明:显然对任意显然对任意n有有由于随机变量序列由于随机变量序列Xn以概率以概率1收敛于收敛于X即即Xn依概率收敛于依概率收敛于X.定理定理:若随机变量序列若随机变量序列Xn依概率收敛于依概率收敛于X,则则Xn依分布收敛于依分布收敛于X.证明证明:设随机变量序列设随机变量序列Xn和随机变量和随机变量X的分的分布函数分别为布函数分别为Fn(x)和和F(x),对任意的对任意的x,yR有有Xy=Xnx,XyXnx,Xy Xn xXn x,Xy从而从而F(y)Fn(x)+PXn x,X y如果如果y x,Xy
13、P|Xn-X|x-y0,(n)同理同理,当当xz时时,有有于是于是,当当yx x,Xy P|Xn-X|x-y0,(n)例例:抛掷一枚均匀的硬币抛掷一枚均匀的硬币,有两个可能结果有两个可能结果 1=出现正面出现正面,2=出现反面出现反面,于是有于是有P1=P2=1/2令令则随机变量则随机变量X的分布函数为的分布函数为若令若令Y()=-X(),则则Y()与与X()有相同的有相同的分布函数分布函数F(x),再令再令Xn()=X(),则则Xn()的分的分布函数布函数Fn(x)=F(x),于是对任意的于是对任意的xR有有但对任意识但对任意识0=P2|X|=P|X|/2=1即不可能有即不可能有Xn依概率收
14、敛于依概率收敛于Y.定理定理:随机变量序列随机变量序列Xn依概率收敛于常数依概率收敛于常数C的充要条件是的充要条件是:Xn的分布函数列的分布函数列Fn(x)弱收敛弱收敛于常数于常数C的分布函数的分布函数F(x),即即 证明证明:必要性已证必要性已证,下面只证充分性下面只证充分性.由于由于XC的分布函数为的分布函数为对任意的对任意的0有有P|Xn-C|=PXn C+PXn C-1-Fn(C+/2)+Fn(C-)由于由于Fn(x)弱收敛于弱收敛于F(x),并注意到并注意到F(x)的的表达式只在表达式只在C点不连续点不连续,从而从而即即Xn依概率收敛于常数依概率收敛于常数C.3.5 弱收敛的判断方法
15、弱收敛的判断方法由于此定理表明了分布函数与特征函数的由于此定理表明了分布函数与特征函数的一一对应关系有连续性一一对应关系有连续性,因此该定理称为特因此该定理称为特征函数的连续性定理征函数的连续性定理证明证明定理定理(辛钦大数定律辛钦大数定律):设设Xk是相互独立是相互独立同分布的随机变量序列同分布的随机变量序列,若有数学期望若有数学期望E(Xk)=(k=1,2,),则对于任意给定的则对于任意给定的0,恒有恒有证明证明3.6 强大数定律强大数定律 定义定义:设随机变量序列设随机变量序列Xn有有限的数学期有有限的数学期望望E(Xn),若若则称随机变量序列则称随机变量序列Xn服从强大数定律服从强大数
16、定律.定理定理:设设Xn是相互独立的随机变量序列是相互独立的随机变量序列,且且都有相同的都有相同的0-1分布分布:PXn=1=p,PXn=0=q其中其中0p1,q=1-p,则则Xn服从强大数定律服从强大数定律.定理定理:设设Xn是相互独立的随机变量序列是相互独立的随机变量序列,且且则则Xn服从强大数定律服从强大数定律.推论推论:设设Xn是相互独立的随机变量序列是相互独立的随机变量序列,若存在常数若存在常数C,对任意的对任意的n=1,2,都有都有D(Xn)105的近似值的近似值.解解 易知易知E(Vk)=5,D(Vk)=100/12,由独立同由独立同分布的中心极限定理知分布的中心极限定理知近似服
17、从标准正态分布近似服从标准正态分布N(0,1),于是于是解解解解4.3 二项分布的正态近似 定理定理(德莫佛德莫佛-拉普拉斯极限定理拉普拉斯极限定理):设随机设随机变量变量Yn服从二项分布服从二项分布Yn B(n,p),(op1),则则对于任意对于任意x,恒有恒有注注:此为林德贝尔格此为林德贝尔格-勒维定理的特殊情况勒维定理的特殊情况.证明证明:设设X1,X2,Xn是是n个相互独立的服从个相互独立的服从(0-1)分布分布(PXi=0=1-p,PXi=1=p)的随机变的随机变量量,则则Yn=X1+X2+Xn由于由于E(Xi)=p,D(Xi)=p(1-p)(i=1,2,n),由独由独立同分布的中心
18、极限定理得立同分布的中心极限定理得例例:蒲丰试验中掷铜币蒲丰试验中掷铜币4040次,出正面次,出正面2048次,试计算当重复蒲丰试验时,正面出现的次,试计算当重复蒲丰试验时,正面出现的频率与概率之差的偏离程度不大于蒲丰试验频率与概率之差的偏离程度不大于蒲丰试验中所发生的偏差的概率中所发生的偏差的概率.解:解:将一枚匀称硬币抛掷将一枚匀称硬币抛掷4040次,记次,记X表表示正面出现的次数,示正面出现的次数,X服从参数服从参数n=4040,p=0.5的二项分布。的二项分布。EX=2020,DX=1010,由于,由于n较大,较大,棣莫弗棣莫弗拉普拉斯极限定理拉普拉斯极限定理,X近似服从正态分布近似服
19、从正态分布.例例(供电问题供电问题):某车间有某车间有200台车床台车床,在生产期在生产期间由于需要检修、调换刀具、变换位置及调间由于需要检修、调换刀具、变换位置及调换工件等常需停车换工件等常需停车.设开工率为设开工率为0.6,并设每并设每台车床的工作是独立的,且在开工时需电力台车床的工作是独立的,且在开工时需电力1千瓦千瓦.问应供应多少瓦电力就能以问应供应多少瓦电力就能以99.9%的概率保的概率保证该车间不会因供电不足而影响生产证该车间不会因供电不足而影响生产?用用X表示在某时刻工作着的车床数,表示在某时刻工作着的车床数,解:对每台车床的观察作为一次试验,解:对每台车床的观察作为一次试验,每
20、次试验观察该台车床在某时刻是否工作,每次试验观察该台车床在某时刻是否工作,工作的概率为工作的概率为0.6,共进行,共进行200次试验次试验.依题意,依题意,XB(200,0.6),现在的问题是:现在的问题是:P(XN)0.999的最小的的最小的N.求满足求满足设需设需N台车床工作,台车床工作,(由于每台车床在开工时需电力(由于每台车床在开工时需电力1千瓦,千瓦,N台工作所需电力即台工作所需电力即N千瓦千瓦.)由德莫弗由德莫弗-拉普拉斯极限定理拉普拉斯极限定理近似近似N(0,1),于是于是 P(XN)=P(0XN)这里这里 np=120,np(1-p)=48由由3准则,准则,此项为此项为0.查正
21、态分布函数表得查正态分布函数表得由由 0.999,从中解得从中解得N141.5,即所求即所求N=142.也也就就是是说说,应应供供应应142 千千瓦瓦电电力力就就能能以以99.9%的的概概率率保保证证该该车车间间不不会会因因供供电电不不足而影响生产足而影响生产.3.1,故故解解若第若第i个对象收看此节目个对象收看此节目若第若第i个对象不看此节目个对象不看此节目例:设浙江林学院学生例:设浙江林学院学生10000名,在周一晚上名,在周一晚上去自习的概率为去自习的概率为0.7,假设彼此自习是相互独,假设彼此自习是相互独立的,设立的,设 X为周一晚上学生去上自习的人数为周一晚上学生去上自习的人数.(1
22、)写出)写出X 的分布;的分布;(2)用切贝谢夫不等式估算周一晚上学生上)用切贝谢夫不等式估算周一晚上学生上自习的人数在自习的人数在68007200之间的概率的近似值;之间的概率的近似值;(3)用棣莫弗)用棣莫弗-拉普拉斯定理计算周一晚上拉普拉斯定理计算周一晚上学生上自习人数在学生上自习人数在68007200之间的概率的近之间的概率的近似值似值.解解:(1)(2)(3)例例:在一家保险公司里有在一家保险公司里有1000010000个人参加寿命个人参加寿命保险,每人每年付保险,每人每年付1212元保险费。在一年内一元保险费。在一年内一个人死亡的概率为个人死亡的概率为0.6%0.6%,死亡时其家属
23、可向,死亡时其家属可向保险公司领得保险公司领得10001000元,问:元,问:(1)(1)保险公司亏本的概率有多大?保险公司亏本的概率有多大?(2)(2)其他条件不变,为使保险公司有其他条件不变,为使保险公司有90%90%的把握一年的利润不少于的把握一年的利润不少于6000060000元,赔偿金元,赔偿金至多可设为多少?至多可设为多少?解解 设设X表示一年内死亡的人数,则表示一年内死亡的人数,则XB(n,p),其中其中 n=10000,p=0.6%,设设Y表示保险公司一年的利润,表示保险公司一年的利润,Y=10000 12-1000X于是由中心极限定理于是由中心极限定理 (1)PY0=P100
24、00 12-1000X60000=P1000012-aX60000=PX 60000/a 0.9;(2)设赔偿金为)设赔偿金为a元,则令元,则令由中心极限定理由中心极限定理,上式等价于上式等价于 在前面介绍的中心极限定理中在前面介绍的中心极限定理中,不仅要求不仅要求随机变量序列相互独立随机变量序列相互独立,而且要求它们同分而且要求它们同分布布.而实际问题中的许多随机变量序列而实际问题中的许多随机变量序列,说说其具有独立性是合理的其具有独立性是合理的,但很难满足同分布但很难满足同分布的要求的要求.为了解决此问题为了解决此问题,引入下面的林德引入下面的林德贝尔格条件贝尔格条件:4.4 独立不同分布
25、下的中心极限定理独立不同分布下的中心极限定理 定义定义:设设Xk为相互独立的随机变量序列为相互独立的随机变量序列,且具有数且具有数学期望学期望E(Xk)=k和方差和方差D(Xk)=k2,记记 (1)若若Xk是连续型随机变量序列是连续型随机变量序列,密度函数列为密度函数列为pk(x),如果对任意的如果对任意的0,有有 (2)若若Xk是离散型随机变量序列是离散型随机变量序列,Xk的分布列为的分布列为PXk=xkj=pkj,j=1,2,如果对任意的如果对任意的0,有有则称则称Xk满足林德贝尔格条件满足林德贝尔格条件.定理定理(林德贝尔格定理林德贝尔格定理):设独立随机变量序列设独立随机变量序列Xk满
26、足林德贝尔格条件满足林德贝尔格条件,则对任意实数则对任意实数x,有有注注:由林德贝尔格定理可以推出林德贝尔格-勒维定理:设设Xk为相互独立同分布的随机变量序列为相互独立同分布的随机变量序列,且且具有数学期望具有数学期望E(Xk)=和方差和方差D(Xk)=2,若若Xk为为连续型随机变量连续型随机变量,密度函数为密度函数为pk(x)=p(x),则则 定理定理(李雅普诺夫定理李雅普诺夫定理):设设Xk为相互独立的为相互独立的随机变量序列随机变量序列,且具有数学期望且具有数学期望E(Xk)=k和方和方差差D(Xk)=k2,记记若存在若存在0,使得使得则对任意的实数则对任意的实数x有有证明证明 只需验证只需验证Xk满足林德贝尔格条件满足林德贝尔格条件.仍仍设设Xk为连续型随机变量为连续型随机变量,密度函数为密度函数为pk(x),则则有有解解若学生答对第若学生答对第i题题若学生答错第若学生答错第i题题