1、第1章 随机事件及其概率()排列组合公式 从个人中挑出n个人进行排列得可能数。 从m个人中挑出n个人进行组合得可能数。(2)加法与乘法原理加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由种方法来完成,则这件事可由mn 种方法来完成。乘法原理(两个步骤分别不能完成这件事):m某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n种方法来完成,则这件事可由 种方法来完成。(3)一些常见排列重复排列与非重复排列(有序)对立事件(至少有一个)顺序问题(4)随机试验与随机事件如果一个试验在相同条件下可以重复进行,而每次试验得可能结果
2、不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验得可能结果称为随机事件。(5)基本事件、样本空间与事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中得一个事件;任何事件,都就就是由这一组中得部分事件组成得。这样一组事件中得每一个事件称为基本事件,用来表示。基本事件得全体,称为试验得样本空间,用表示。一个事件就就就是由中得部分点(基本事件)组成得集合。通常用大写字母A,C,表示事件,它们就就是得子集。为必然事件,为不可能事件。不可能事件()得概率为零,而概率为零得事件不一定就就是不可能事
3、件;同理,必然事件()得概率为1,而概率为1得事件也不一定就就是必然事件。(6)事件得关系与运算关系:如果事件A得组成部分也就就是事件B得组成部分,(A发生必有事件发生):如果同时有,则称事件A与事件B等价,或称等于B:A=B。A、B中至少有一个发生得事件:AB,或者A+B。属于A而不属于B得部分所构成得事件,称为A与得差,记为A-B,也可表示为-B或者,它表示A发生而不发生得事件。A、B同时发生:AB,或者AB。B,则表示与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件就就是互不相容得。-A称为事件A得逆事件,或称得对立事件,记为。它表示A不发生得事件。互斥未必对立。运算:结合
4、率:(BC)()C A(BC)=(AB)C 分配率:(AB)C=(AC)(C) (B)C=(AC)(C) 德摩根率: ,(7)概率得公理化定义设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:1 0P(A)1, P() =1 对于两两互不相容得事件,有常称为可列(完全)可加性。则称P(A)为事件得概率。(8)古典概型1 , 。设任一事件,它就就是由组成得,则有P(A)= =()几何概型若随机试验得结果为无限不可数并且每个结果出现得可能性均匀,同时样本空间中得每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,。其中L为几何度量(长度、面积
5、、体积)。(10)加法公式P(A+)P(A)+(B)-(AB)当P(AB)时,(+B)=P(A)+P(B)(11)减法公式(A)=P(A)-(AB)当BA时,P(-B)=P(A)-P()当A=时,P()=1-P(B)(12)条件概率定义设A、B就就是两个事件,且()0,则称为事件A发生条件下,事件发生得条件概率,记为。条件概率就就是概率得一种,所有概率得性质都适合于条件概率。例如(/)=1P(/A)=1-P(/)(3)乘法公式乘法公式:更一般地,对事件A1,A,n,若P(A1A2An-1)0,则有。(1)独立性两个事件得独立性设事件、满足,则称事件、就就是相互独立得。若事件、相互独立,且,则有
6、若事件、相互独立,则可得到与、与、与也都相互独立。必然事件与不可能事件与任何事件都相互独立。与任何事件都互斥。多个事件得独立性设AB就就是三个事件,如果满足两两独立得条件,P(B)=P()P(B);(B)(B)P(C);(A)()P(A)并且同时满足P(ABC)=(A)(B)P(C)那么、B、C相互独立。对于n个事件类似。(15)全概公式设事件满足两两互不相容,,,则有。(6)贝叶斯公式设事件,,及满足1 ,两两互不相容,0,1,2,,,2,,则,=,2,n。此公式即为贝叶斯公式。,(,),通常叫先验概率。,(,,,),通常称为后验概率。贝叶斯公式反映了“因果”得概率规律,并作出了“由果朔因”
7、得推断。(17)伯努利概型我们作了次试验,且满足u 每次试验只有两种可能结果,发生或不发生;u 次试验就就是重复进行得,即发生得概率每次均一样;u 每次试验就就是独立得,即每次试验发生与否与其她次试验发生与否就就是互不影响得。这种试验称为伯努利概型,或称为重伯努利试验。用表示每次试验发生得概率,则发生得概率为,用表示重伯努利试验中出现次得概率,。第二章 随机变量及其分布(1)离散型随机变量得分布律设离散型随机变量得可能取值为Xk(=1,2,)且取各个值得概率,即事件(X=Xk)得概率为(X=xk)=pk,=1,则称上式为离散型随机变量得概率分布或分布律。有时也用分布列得形式给出:。显然分布律应
8、满足下列条件:(1), (2)。(2)连续型随机变量得分布密度设就就是随机变量得分布函数,若存在非负函数,对任意实数,有, 则称为连续型随机变量。称为得概率密度函数或密度函数,简称概率密度。密度函数具有下面4个性质:1。 。(3)离散与连续型随机变量得关系积分元在连续型随机变量理论中所起得作用与在离散型随机变量理论中所起得作用相类似。(4)分布函数设为随机变量,就就是任意实数,则函数称为随机变量得分布函数,本质上就就是一个累积函数。 可以得到X落入区间得概率。分布函数表示随机变量落入区间( ,x内得概率。分布函数具有如下性质:1 ;2 就就是单调不减得函数,即时,有 ;3, ; ,即就就是右连
9、续得;5 。对于离散型随机变量,;对于连续型随机变量,。(5)八大分布01分布P(X=1)p, P(X0)=二项分布在重贝努里试验中,设事件发生得概率为。事件发生得次数就就是随机变量,设为,则可能取值为。, 其中,则称随机变量服从参数为,得二项分布。记为。当时,这就就就是()分布,所以(-1)分布就就是二项分布得特例。泊松分布设随机变量得分布律为,,则称随机变量服从参数为得泊松分布,记为或者P()。泊松分布为二项分布得极限分布(n=,n)。超几何分布随机变量X服从参数为n,N,M得超几何分布,记为H(n,N,M)。几何分布,其中p0,q=1-p。随机变量X服从参数为p得几何分布,记为(p)。均
10、匀分布设随机变量得值只落在a,b内,其密度函数在a,b上为常数,即axb 其她,则称随机变量在a,b上服从均匀分布,记为XU(a,b)。分布函数为 axb 0, xb。当ax1x2b时,落在区间()内得概率为。指数分布 ,0, ,其中,则称随机变量X服从参数为得指数分布。X得分布函数为 , x0。 记住积分公式:正态分布设随机变量得密度函数为, ,其中、为常数,则称随机变量服从参数为、得正态分布或高斯(Gs)分布,记为。具有如下性质: 得图形就就是关于对称得;2 当时,为最大值;若,则得分布函数为。参数、时得正态分布称为标准正态分布,记为,其密度函数记为,,分布函数为。就就是不可求积函数,其函
11、数值,已编制成表可供查用。(x)1-(x)且()=。如果,则。 ()分位数下分位表:;上分位表:。(7)函数分布离散型已知得分布列为,得分布列(互不相等)如下:,若有某些相等,则应将对应得相加作为得概率。连续型先利用X得概率密度X(x)写出Y得分布函数FY(y)(g(X)y),再利用变上下限积分得求导公式求出fY(y)。第三章 二维随机变量及其分布(1)联合分布离散型如果二维随机向量(X,Y)得所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。设(X,)得所有可能取值为,且事件得概率为pij,称为=(X,Y)得分布律或称为X与得联合分布律。联合分布有时也用下面得概率分布表来表示:
12、YXy1y2yjx1p11p12p1jx2p21p22p2jxipi1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)连续型对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴得矩形区域D,即D=(X,Y)|ax,cx时,有F(,y)F(x,);当2y1时,有F(,y) F(x,y1);(3)F(x,)分别对与y就就是右连续得,即(4)(5)对于、()离散型与连续型得关系(5)边缘分布离散型X得边缘分布为;Y得边缘分布为。连续型X得边缘分布密度为Y得边缘分布密度为(6)条件分布离散型在已知X=x得条件下,取值得条件分布为在已知Y=yj得条件下,取值得条件
13、分布为连续型在已知Y=y得条件下,X得条件分布密度为;在已知X=x得条件下,Y得条件分布密度为(7)独立性一般型F(,)=F(x)FY(y)离散型有零不独立连续型f(,y)=fX(x)Y(y)直接判断,充要条件:可分离变量正概率密度区间为矩形二维正态分布=0随机变量得函数若X1,X2,Xm,Xm1,n相互独立, h,g为连续函数,则:h(X1,X2,m)与g(Xm1,Xn)相互独立。特例:若X与Y独立,则:h(X)与g()独立。例如:若X与Y独立,则:3X+1与-2独立。(8)二维均匀分布设随机向量(,Y)得分布密度函数为其中D为区域得面积,则称(X,Y)服从上得均匀分布,记为(X,Y)(D)
14、。例如图3、1、图、2与图、3。y1 DO x图3、1D211O 2 x图3、2yD3dc a b x图3、3()二维正态分布设随机向量(,)得分布密度函数为其中就就是5个参数,则称(,Y)服从二维正态分布,记为(X,Y)N(由边缘密度得计算公式,可以推出二维正态分布得两个边缘分布仍为正态分布,即X(但就就是若XN(,(X,)未必就就是二维正态分布。(0)函数分布Z=X+Y根据定义计算:对于连续型,fZ(z)=两个独立得正态分布得与仍为正态分布()。个相互独立得正态分布得线性组合,仍服从正态分布。, Z=m,m(X1,Xn)若相互独立,其分布函数分别为,则a,min(X,X2,n)得分布函数为
15、:分布设n个随机变量相互独立,且服从标准正态分布,可以证明它们得平方与得分布密度为我们称随机变量W服从自由度为n得分布,记为W,其中所谓自由度就就是指独立正态随机变量得个数,它就就是随机变量分布中得一个重要参数。分布满足可加性:设则t分布设,Y就就是两个相互独立得随机变量,且可以证明函数得概率密度为我们称随机变量T服从自由度为n得分布,记为T(n)。F分布设,且X与Y独立,可以证明得概率密度函数为我们称随机变量F服从第一个自由度为n1,第二个自由度为n2得F分布,记为f(n1,n2)、第四章随机变量得数字特征()一维随机变量得数字特征离散型连续型期望期望就就就是平均值设X就就是离散型随机变量,
16、其分布律为P()p,k1,,,(要求绝对收敛)设X就就是连续型随机变量,其概率密度为f(x),(要求绝对收敛)函数得期望Y=g(X) Yg(X)方差D()=EX-E()2,标准差,矩对于正整数k,称随机变量X得k次幂得数学期望为X得k阶原点矩,记为vk,即kE(Xk)= , =1,2, 、对于正整数,称随机变量X与E(X)差得k次幂得数学期望为X得k阶中心矩,记为,即=,k1,2, 、对于正整数k,称随机变量得k次幂得数学期望为X得k阶原点矩,记为,即k=E(Xk)= k=1,2, 、对于正整数k,称随机变量X与E(X)差得k次幂得数学期望为X得k阶中心矩,记为,即=k1,, 、切比雪夫不等式
17、设随机变量具有数学期望E(X)=,方差D(X)=2,则对于任意正数,有下列切比雪夫不等式切比雪夫不等式给出了在未知X得分布得情况下,对概率得一种估计,它在理论上有重要意义。(2)期望得性质(1) E(C)=C(2) E(X)CE(X)(3) E(X+Y)E(X)E(Y),(4) E()=(X)E(Y),充分条件:X与Y独立; 充要条件:X与Y不相关。(3)方差得性质(1) (C)=0;E(C)=C(2) D(a)=a2D(X); ()=aE(X)(3) D(a+b)= a(X); E(a+)aE(X)+(4) D(X)=E(2)E2()(5) (XY)=(X)+D(Y),充分条件:X与Y独立;
18、 充要条件:与Y不相关。 D(X)=D(X)+D(Y)2(X-E(X)(-E(Y),无条件成立。而E(XY)=E(X)+(Y),无条件成立。(4)常见分布得期望与方差期望方差01分布p二项分布np泊松分布几何分布超几何分布均匀分布指数分布正态分布nnt分布0(n)(5)二维随机变量得数字特征期望函数得期望=方差协方差对于随机变量X与Y,称它们得二阶混合中心矩为X与Y得协方差或相关矩,记为,即与记号相对应,X与Y得方差D()与(Y)也可分别记为与。相关系数对于随机变量X与Y,如果D(X)0, (Y)0,则称为X与得相关系数,记作(有时可简记为)。|,当|=时,称X与Y完全相关:完全相关而当时,称
19、与Y不相关。以下五个命题就就是等价得:;cv(X,Y)=0;E(XY)=E(X)E();D(XY)=D(X)+D();D(X-)D(X)+(Y)、协方差矩阵混合矩对于随机变量X与,如果有存在,则称之为X与Y得k+阶混合原点矩,记为;+l阶混合中心矩记为:(6)协方差得性质(i) cv (X, )=v (Y,X);(ii) cov(X,b)=ab cov(X,Y);(iii) o(X1+X2, Y)=cov(X,)+cov(X2,Y);(iv) cov(X,Y)=E(Y)-E(X)(Y)、()独立与不相关(i) 若随机变量与Y相互独立,则;反之不真。(ii) 若(X,Y)(),则与Y相互独立得充
20、要条件就就是与Y不相关。第五章 大数定律与中心极限定理(1)大数定律切比雪夫大数定律设随机变量1,X2,相互独立,均具有有限方差,且被同一常数所界:(Xi)C(i1,2,),则对于任意得正数,有特殊情形:若X1,X,具有相同得数学期望E(XI)=,则上式成为伯努利大数定律设就就是次独立试验中事件A发生得次数,p就就是事件A在每次试验中发生得概率,则对于任意得正数,有伯努利大数定律说明,当试验次数n很大时,事件A发生得频率与概率有较大判别得可能性很小,即这就以严格得数学形式描述了频率得稳定性。辛钦大数定律设X1,2,,Xn,就就是相互独立同分布得随机变量序列,且(Xn)=,则对于任意得正数有(2
21、)中心极限定理列维林德伯格定理设随机变量X,X2,相互独立,服从同一分布,且具有相同得数学期望与方差:,则随机变量得分布函数Fn(x)对任意得实数x,有此定理也称为独立同分布得中心极限定理。棣莫弗-拉普拉斯定理设随机变量为具有参数,(0p)得二项分布,则对于任意实数x,有()二项定理若当,则超几何分布得极限分布为二项分布。(4)泊松定理若当,则其中k=0,1,,。二项分布得极限分布为泊松分布。第六章 样本及抽样分布(1)数理统计得基本概念总体在数理统计中,常把被考察对象得某一个(或多个)指标得全体称为总体(或母体)。我们总就就是把总体瞧成一个具有分布得随机变量(或随机向量)。个体总体中得每一个
22、单元称为样品(或个体)。样本我们把从总体中抽取得部分样品称为样本。样本中所含得样品数称为样本容量,一般用表示。在一般情况下,总就就是把样本瞧成就就是n个相互独立得且与总体有相同分布得随机变量,这样得样本称为简单随机样本。在泛指任一次抽取得结果时,表示个随机变量(样本);在具体得一次抽取之后,表示n个具体得数值(样本值)。我们称之为样本得两重性。样本函数与统计量设为总体得一个样本,称()为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。常见统计量及其性质样本均值样本方差样本标准差样本阶原点矩样本k阶中心矩,,其中,为二阶中心矩。(2)正态总体下得四大分布正态分布设为
23、来自正态总体得一个样本,则样本函数t分布设为来自正态总体得一个样本,则样本函数其中(n-1)表示自由度为n-1得t分布。设为来自正态总体得一个样本,则样本函数其中表示自由度为n-1得分布。F分布设为来自正态总体得一个样本,而为来自正态总体得一个样本,则样本函数其中表示第一自由度为,第二自由度为得F分布。(3)正态总体下分布得性质与独立。第七章 参数估计()点估计矩估计设总体X得分布中包含有未知数,则其分布函数可以表成它得阶原点矩中也包含了未知参数,即。又设为总体X得个样本值,其样本得k阶原点矩为这样,我们按照“当参数等于其估计量时,总体矩等于相应得样本矩”得原则建立方程,即有由上面得m个方程中
24、,解出得个未知参数即为参数()得矩估计量。若为得矩估计,为连续函数,则为得矩估计。极大似然估计当总体为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体得一个样本,称为样本得似然函数,简记为Ln、当总体X为离型随机变量时,设其分布律为,则称为样本得似然函数。若似然函数在处取到最大值,则称分别为得最大似然估计值,相应得统计量称为最大似然估计量。若为得极大似然估计,为单调函数,则为得极大似然估计。()估计量得评选标准无偏性设为未知参数得估计量。若E ()=,则称 为得无偏估计量。E()=E(X), E()D(X)有效性设与就就是未知参数得两个无偏估计量。若,则称有效。一致性设就就是得一串
25、估计量,如果对于任意得正数,都有则称为得一致估计量(或相合估计量)。若为得无偏估计,且则为得一致估计。只要总体得E(X)与D(X)存在,一切样本矩与样本矩得连续函数都就就是相应总体得一致估计量。(3)区间估计置信区间与置信度设总体X含有一个待估得未知参数。如果我们从样本出发,找出两个统计量与,使得区间以得概率包含这个待估参数,即那么称区间为得置信区间,为该区间得置信度(或置信水平)。单正态总体得期望与方差得区间估计设为总体得一个样本,在置信度为下,我们来确定得置信区间。具体步骤如下:(i)选择样本函数;(ii)由置信度,查表找分位数;(ii)导出置信区间。已知方差,估计均值(i)选择样本函数(
26、i) 查表找分位数(iii)导出置信区间未知方差,估计均值()选择样本函数(i)查表找分位数(iii)导出置信区间方差得区间估计(i)选择样本函数(i)查表找分位数(ii)导出得置信区间第八章 假设检验基本思想假设检验得统计思想就就是,概率很小得事件在一次试验中可以认为基本上就就是不会发生得,即小概率原理。为了检验一个假设就就是否成立。我们先假定0就就是成立得。如果根据这个假定导致了一个不合理得事件发生,那就表明原来得假定H就就是不正确得,我们拒绝接受H0;如果由此没有导出不合理得现象,则不能拒绝接受H,我们称H0就就是相容得。与H0相对得假设称为备择假设,用H1表示。这里所说得小概率事件就就
27、就是事件,其概率就就就是检验水平,通常我们取=、5,有时也取0、01或、10。基本步骤假设检验得基本步骤如下:(i) 提出零假设H0; (ii) 选择统计量K;(iii) 对于检验水平查表找分位数;(iv) 由样本值计算统计量之值;将进行比较,作出判断:当时否定,否则认为0相容。两类错误第一类错误当H0为真时,而样本值却落入了否定域,按照我们规定得检验法则,应当否定H0。这时,我们把客观上H0成立判为为不成立(即否定了真实得假设),称这种错误为“以真当假”得错误或第一类错误,记为犯此类错误得概率,即P否定H|H0为真=;此处得恰好为检验水平。第二类错误当H1为真时,而样本值却落入了相容域,按照
28、我们规定得检验法则,应当接受0。这时,我们把客观上H0。不成立判为H成立(即接受了不真实得假设),称这种错误为“以假当真”得错误或第二类错误,记为犯此类错误得概率,即接受H0H1为真=。两类错误得关系人们当然希望犯两类错误得概率同时都很小。但就就是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。在实际使用时,通常人们只能控制犯第一类错误得概率,即给定显著性水平。大小得选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把取得很小,如0、0,甚至0、01。反之,则应把取得大些。单正态总体均值与方差得假设检验条件零假设统计量对应样本函数分布否定域已知(,)未知未知