1、第四章中心极限定理与参数估计,4.1大数定律,4.2中心极限定理,本章概述大数定律和中心极限定理就是使用极限方法研究大量随机现象统计规律性的。阐明大量重复试验的平均结果具有稳定性的一系列定律都称为大数定律。论证随机变量(试验结果)之和渐进服从某一分布的定理称为中心极限定理。,⒈人们在长期的实践中发现,频率以及大量测量值的算术平均值具有稳定性,也就是说,无论个别测量值如何,其平均结果实际上与个别测量值的特征无关,几乎不再是随机的了。这种稳定性问题如何从理论上给出解释?这正是大数定律要解决的问题。,⒉长期观察表明,如果一个量是由大量的相互独立的随机因素的影响造成的,而每一个个别因素在总影响中所起的
2、作用都很微小,则这种量通常都服从或近似服从正态分布。这个结论的理论依据就是中心极限定理。,⒊总之,大数定律是描述频率稳定性的理论(理解),中心极限定理在概率论的理论研究中占据重要地位(会用)。,2.不等式的其它(等价)形式,证明,4.1大数定律1.切贝雪夫不等式,仅证连续型r.v.的情形,切贝雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。从切贝雪夫不等式还可以看出,对于给定的>0,当方差越小时,事件{|X-E(X)|≥}发生的概率也越小,即X的取值越集中在E(X)附近.这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量.当D(X)已知时,切贝雪夫不等式给
3、出了X与E(X)的偏差小于的概率的估计值.,切贝雪夫不等式的用途:(1)证明大数定律;(2)估计事件的概率。,,,例2设电站供电网有10000盏电灯,夜晚每盏灯开灯的概率均为0.7,假定灯的开、关是相互立的,使用切贝雪夫不等式估计夜晚同时开着的灯数在6800到7200盏之间的概率。解令X表示在夜晚同时开着的灯数目,则X服从n=10000,p=0.7的二项分布,这时,由切贝雪夫不等式可得:,即对于任意>0,当n充分大时,不等式,定理1(切贝雪夫大数定律)如果X1,X2,…,Xn,…是相互独立的随机变量序列,每一个Xi都有数学期望E(Xi)和有限的方差D(Xi),且方差有公共的上界,即D(Xi
4、)≤C,i=1,2,…,n;C>0.则对于任意>0,有,依概率1成立。,3.大数定律,证因X1,X2,…,Xn,…相互独立,所以,又因,由切贝雪夫不等式可得,所以,切贝雪夫大数定律表明,相互独立的随机变量的算术平均值与其数学期望的差,在n充分大时以概率1是一个无穷小量,这意味着在n充分大时,的值将比较紧密地聚集在它的数学期望附近.,说明(1)在不变的条件下,重复测量n次得到n个观察值,x1,x2,…,xn可看作服从同一分布的n个相互独立的随机变量X1,X2,…,Xn的试验值。(2)n充分大时,x1,x2,…,xn的算术平均值与真值的误差依概率1任意小。(3)n不太大时,x1,x2,…,xn的
5、算术平均值与真值的误差可能较大,所以,实际计算平均值时往往采取“去掉几个最高、几个最低”的办法。,推论1设随机变量X1,X2,X3,…,Xn,…独立同分布,且有E(Xk)=,D(Xk)=2,k=1,2,…,则在n时对任意ε>0,有,由于各次试验是独立的,因此X1,X2,…,Xn,…是相互独立的,且,证明定义随机变量,显然有n=X1+X2+…+Xn,且Xk服从参数为p的0-1分布,故有E(Xk)=p,D(Xk)=p(1-p)(k=1,2,…,n,…).,这是以频率定义概率的合理性依据。,定理2(贝努里大数定律)n重贝努里试验中事件A发生n次,每次试验A发生的概率为p,则对任意>0,有,因此,由切贝雪夫不等式得,定义1(依概率收敛)设y1,y2,…,yn,…是一个互相独立的随机变量序列,是一个常数,若对于任意正数,有,则称序列y1,y2,…,yn,…依概率收敛于a.,因此,由贝努里大数定律可得:设n是n次独立试验中事件出现的次数,p是在每次试验中事件A发生的概率,,例2若在每次试验中,A发生的概率为0.5,进行1000次独立试验,估计A发生400~600次之间的概率。,解因X~B(1000,0.5),E(X)=500,D(X)=250,所以P{400