1、概 率 论 与 数 理 统 计 公 式 全HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】第 1 章 随机事件及其概率(1)排列组合公式m!P n = m (m 一 n)!从 m 个人中挑出n 个人进行排列的可能数。m!m n!(m 一 n)!C n = 从 m 个人中挑出n 个人进行组合的可能数。加法原理(两种方法均能完成此事): m+n(2)加法和乘法原理某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种方法来完成,则这件事可由m+n 种方法来完成。乘法原理(两个步骤分别不能完成这件事): mn某件事
2、由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由 n 种方法来完成,则这件事可由 mn 种方法来完成。重复排列和非重复排列(有序)(3)一些常见排列对立事件(至少有一个)顺序问题(4)随如果一个试验在相同条件下可以重复进行,而每次试验的可能结果机试验和不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则随机事件称这种试验为随机试验。试验的可能结果称为随机事件。在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的部分事件组成的。(5)基本事件、样本空间和事件(6)事件的
3、关系与运算这样一组事件中的每一个事件称为基本事件,用 来表示。基本事件的全体,称为试验的样本空间,用 表示。一个事件就是由 中的部分点(基本事件 )组成的集合。通常用大写字母 A, B, C, 表示事件,它们是 的子集。 为必然事件,为不可能事件。不可能事件()的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件()的概率为 1,而概率为 1 的事件也不一定是必然事件。关系:如果事件 A 的组成部分也是事件 B 的组成部分,(A 发生必有事件B 发生): A 仁 B如果同时有 A 仁 B, B A ,则称事件 A 与事件 B 等价,或称 A 等于 B: A=B。A、 B 中至少有一个
4、发生的事件: A U B,或者 A+B。属于 A 而不属于 B 的部分所构成的事件,称为 A 与B 的差,记为A-B,也可表示为 A-AB 或者 AB ,它表示 A 发生而 B 不发生的事件。A、 B 同时发生: An B,或者 AB。 An B=,则表示 A 与 B 不可能同时发生,称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。 -A 称为事件A 的逆事件,或称 A 的对立事件,记为 A 。它表示A 不发生的事件。互斥未必对立。运算:结合率: A(BC)=(AB)C A(BC)=(AB)C分配率: (AB) C=(AC) (BC) (AB) C=(AC) (BC)德摩根率:
5、n A = U Ai ii=1 i=1 A U B = A n B, A n B = A U B(7)概设 为样本空间, A 为事件,对每一个事件 A 都有一个实数率的公理化定义 P(A) ,若满足下列三个条件:1 0P(A)1,2 P() =13 对于两两互不相容的事件 A1, A2 ,有常称为可列(完全)可加性。则称 P(A)为事件 A 的概率。1 = , ,1 2 n(8)古典概型12 P( ) = P( ) = P( ) = 。1 2 n n设任一事件 A ,它是由 , 组成的,则有1 2 mP(A) = ( ) U ( ) U U ( ) = P( ) + P( ) + + P( )
6、1 2 m 1 2 m若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,(9)几则称此随机试验为几何概型。对任一事件 A,何概型P(A) = L(A) 。其中 L 为几何度量(长度、面积、体积)。L()(10)加法公式P(A+B)=P(A)+P(B)-P(AB)当 P(AB) 0 时, P(A+B)=P(A)+P(B)P(A-B)=P(A)-P(AB)(11)减当 B 仁 A 时, P(A-B)=P(A)-P(B)法公式当 A=时, P( B )=1- P(B)(12)条件概率定义 设 A、 B 是两个事件,且 P(A)0,则称
7、 P(AB) 为事件 A 发生条 P(A)件下,事件 B 发生的条件概率,记为 P(B / A) = P(A) 。P(AB)条件概率是概率的一种,所有概率的性质都适合于条件概率。例如 P(/B)=1 P( B /A)=1-P(B/A)乘法公式: P(AB) = P(A)P(B / A)(13)乘法公式更一般地,对事件 A, A ,A ,若 P(A A A )0,则有1 2 n 1 2 n- 1P(A1A2 An ) = P(A1)P(A2 | A1)P(A3 | A1A2) P(An | A1A2 An 1)。(14)独两个事件的独立性立性(15)全概公式设事件 A、 B 满足P(AB) =
8、P(A)P(B) ,则称事件 A、 B 是相互独立的。若事件 A、 B 相互独立,且P(A) 0 ,则有若事件 A、 B 相互独立,则可得到 A 与B、 A 与B、 A 与B 也都相互独立。必然事件 和不可能事件与任何事件都相互独立。与任何事件都互斥。多个事件的独立性设 ABC 是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B); P(BC)=P(B)P(C); P(CA)=P(C)P(A)并且同时满足 P(ABC)=P(A)P(B)P(C)那么 A、 B、 C 相互独立。对于 n 个事件类似。设事件B1, B2 , , Bn 满足1B1, B2 , , Bn 两两互不相容, P
9、(Bi ) 0(i = 1,2, , n),A 仁Un B2 i=1 i,则有P(A) = P(B1)P(A | B1) + P(B2)P(A | B2) + + P(Bn )P(A | Bn )。设事件 B1, B2 , Bn及 A 满足1 B1, B2 , Bn两两互不相容, P(Bi) 0, i = 1, 2 ,n,2A 仁Un Bi i=1 ,P(A) 0(16)贝叶斯公式则P(B / A) = P(Bi )P(A/ Bi ) , i=1, 2,n。i n P(B )P(A/ B )j jj =1此公式即为贝叶斯公式。P(B ) ,( i = 1, 2, n ),通常叫先验概率。 P(
10、B / A),i i( i = 1, 2, n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。(17)伯努利概型我们作了n 次试验,且满足每次试验只有两种可能结果, A 发生或 A 不发生;n 次试验是重复进行的,即 A 发生的概率每次均一样;每次试验是独立的,即每次试验 A 发生与否与其他次试验 A发生与否是互不影响的。这种试验称为伯努利概型,或称为n 重伯努利试验。用p 表示每次试验 A 发生的概率,则 A 发生的概率为1 p = q ,用Pn(k) 表示n 重伯努利试验中 A 出现k(0 k n) 次的概率,Pn (k) = C k p k q n
11、k, k = 0,1,2, , n。n第二章 随机变量及其分布(1)离散型随机变量的分布律设离散型随机变量 X 的可能取值为 X (k=1,2, )且取各kP(X=x )=p, k=1,2, ,k k则称上式为离散型随机变量 X 的概率分布或分布律。有X | x1, x2 , , xk , P(X = xk ) p1, p2 , , pk , 。显然分布律应满足下列条件:(1) pk 0, k = 1,2, , (2) pk = 1k =1 。(2)连续型随机变量的分布密度设F(x) 是随机变量 X 的分布函数,若存在非负函数f (x) ,对F (x) = jx f (x)dx ,则称 X 为
12、连续型随机变量。 f (x) 称为 X 的概率密度函数或密密度函数具有下面 4 个性质:12f (x) 0。j+ f (x)dx = 1 。(3)离散与连续型随机变量的关系(4)分布函数积分元 f (x)dx 在连续型随机变量理论中所起的作用与P(X =设 X 为随机变量, x 是任意实数,则函数称为随机变量 X 的分布函数,本质上是一个累积函数。P(a X b) = F (b) F(a) 可以得到 X 落入区间 (a, b的分布函数具有如下性质:1 0 F(x) 1, x +;2 F (x) 是单调不减的函数,即x1 0, k = 0,1,2 ,布则称随机变量 X 服从参数为入 的泊松分布,
13、记为 X (入泊松分布为二项分布的极限分布(np=, n )。超 随机变量 X 服从参数为n,N,M 的超几何分布,记为 H(n,几何分布几 P(X = k) = qk 一1 p, k = 1,2,3, ,其中 p0, q=1-p。何随机变量 X 服从参数为p 的几何分布,记为 G(p)。 分布均 匀分 布设随机变量 X 的值只落在a, b内,其密度函数f (x) 在( 1f (x) = b a| ,|0,其他,则称随机变量 X 在a, b上服从均匀分布,记为XU(a,分布函数为F (x) = j x f (x)dx =w当 ax x b 时,1 20,xb。X 落在区间(x1 , x2 )内
14、的概率为1 2 b aP(x X 0其中 入 0 ,则称随机变量 X 服从参数为入 的指数分布。X 的分布函数为1 e 入x ,F (x) =0,x 0x0。记住积分公式:正设随机变量 X 的密度函数为态 f (x) = 1 e-( 2装2(x-山)2, -w x 0 为常数,则称随机变量 X 服从参数为 布f (x) 具有如下性质:1 f (x) 的图形是关于 x = 山 对称的;2 当 x = 山 时, f (山) = 1 为最大值;2几装若X N (山,装2 ) ,则 X 的分布函数为F(x) = j x e- 2装 2 dt1 (t -山)22几装 -w 。参数 山 = 0、 装 =
15、1 时的正态分布称为标准正态分布,记为Q(x) = e- 21 x22几 , -w x 山 )a。a离 散 型连 续 型(7)函数分布已知 X 的分布列为X x1, x2, , xn , P(X = xi ) p1, p2, , pn , ,Y = g(X ) 的分布列( y = g(x ) 互不相等)如下:i iY g(x1), g(x2), , g(xn), P(Y = yi ) p1, p2, , pn , ,若有某些 g(xi ) 相等,则应将对应的 pi 相加作为 g(xi ) 的概先利用 X 的概率密度 f (x)写出Y 的分布函数 F (y) P(gX Y第三章 二维随机变量及其
16、分布(1)联合分布离散型如果二维随机向量 (X, Y)的所有可能取值为至多设 = (X, Y)的所有可能取值为 (x , y )(i, j = 1,2, )i j为 = (X, Y)的分布律或称为 X 和Y 的联合分布律。联Yy1Xy2yjx1p11p12p1jx2p21p22p2jxipi1这里 p 具有下面两个性质:ij(1) p 0 (i,j=1,2,); ij(2) p = 1.iji j连续型(2)二维随机变量的本质对于二维随机向量 = (X , Y) ,如果存在非负函数 f (x, y)矩形区域 D,即 D=(X,Y) |axb,cyd有则称 为连续型随机向量;并称 f(x,y)为
17、 = (X, Y)的分布密度 f(x,y)具有下面两个性质:(1) f(x,y) 0;(2) j+ j+ f (x, y)dxdy = 1. (3)联合分布函数设(X, Y)为二维随机变量,对于任意实数 x,y,二元函数称为二维随机向量(X, Y)的分布函数,或称为随机变量 X 和Y 的联合分布函数。分布函数是一个以全平面为其定义域,以事件( , ) | X( ) x, x 时,有 F (x ,y)F(x ,y);当 y y 时,有 F(x,y ) F(x,y );2 1 2 1 2 1 2 1(3) F (x,y)分别对 x 和 y 是右连续的,即(4) F ( , ) = F( , y)
18、= F(x, ) = 0, F (+ ,+ ) = 1.(5)对于 x x, y 0 .2 2 2 1 1 2 1 1(4)离散型与连续型的关系(5) 离散型 X 的边缘分布为边缘P = P(X = x ) = p (i, j = 1,2, );j分布 i i ijY 的边缘分布为P = P(Y = y ) = p (i, j = 1,2, )。 j j ij i连续型X 的边缘分布密度为Y 的边缘分布密度为(6)条件分布离散型在已知 X=x 的条件下, Y 取值的条件分布为i在已知 Y=y 的条件下, X 取值的条件分布为j(7)独立连续型一般型离散型在已知 Y=y 的条件下, X 的条件分
19、布密度为f (x | y) = f (x, y);f ( y)Y在已知 X=x 的条件下, Y 的条件分布密度为F(X,Y)=F (x)F (y)X Y有零不独立性连续型二维正态分布随机变量的函数f(x,y)=f (x)f (y)X Y直接判断,充要条件:可分离变量正概率密度区间为矩形0若 X ,X , X ,X , X 相互独立, h,g 为连续函数,则:1 2 m m+1 nh (X, X , X )和 g (X , X )相互独立。1 2 m m+1 n特例:若 X 与Y 独立,则: h (X)和 g (Y)独立。例如:若 X 与Y 独立,则: 3X+1 和 5Y-2 独立。(8)设随机
20、向量(X, Y)的分布密度函数为二维其中 S 为区域 D 的面积,则称(X, Y)服从 D 上的均匀分布,记为(X, Y)U (D)D均匀例如图 3.1、图 3.2 和图 3.3。分布y1D1O 1 x图 3.1y1O D 2 x2图 3.2ydDcO a b x图 3.3(9)二维正态分布设随机向量(X, Y)的分布密度函数为其中 山 , 山 幸 0, 幸 0, | p |1是 5 个参数,则称(X, Y)服从二维正态分布,1 2 , 1 2记为(X, Y)N ( 山 , 山 幸2 ,幸2 , p).1 2, 1 2由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即 X
21、N ( 山 ,幸 2 ), Y N(山 幸 2 ).1 1 2, 2但是若 XN ( 山 ,幸2 ), Y N(山 幸2 ), (X, Y)未必是二维正态分布。1 1 2, 2(10 Z=X+Y)函数分布根据定义计算: F (z) = P(Z 共 z) = P(X + Y 共 z)Z+w对于连续型, f (z) j f (x, z _ x)dxZ_w两个独立的正态分布的和仍为正态分布( 山 + 山 ,幸 2 +幸1 2 1n 个相互独立的正态分布的线性组合,仍服从正态分布。山 = xC 山 , 幸 2 = xC 2 幸 2i i i ii iZ=max,min(X ,X , X )1 2 n若
22、 X , X1 2X 相互独立,其分布函数分别为 F (x), Fn x1 x2X2 分布t 分布F 分布设 n 个随机变量 X , X , , X 相互独立,且服从标准正1 2 n的分布密度为我们称随机变量 W 服从自由度为 n 的 X2 分布,记为 W所谓自由度是指独立正态随机变量的个数,它是随机X2 分布满足可加性:设则设 X, Y 是两个相互独立的随机变量,且可以证明函数的概率密度为我们称随机变量 T 服从自由度为 n 的 t 分布,记为 Tt设 X X2 (n ), Y X2 (n ) ,且 X 与 Y 独立,可以证明F =1 2我们称随机变量 F 服从第一个自由度为 n1,第二个自
23、由第四章 随机变量的数字特征(1)一维随机变量的数字特征期望期望就是平均值离散型设 X 是离散型随机变量,其分布律为 P( X = x )kp, k=1,2, ,n,k(要求绝对收敛)连续型设 X 是连续型随机变量,其(要求绝对收敛)函数的期望Y=g(X)Y=g(X)方差D(X)=EX-E(X)2,标准差 (X ) = D(X ),矩对于正整数 k,称随机变量 X 的 k 次幂的数学期望为 X 的 k 阶原点矩,记为 v , 即k =E(Xk)= x k p ,k i iik=1,2, .对于正整数 k,称随机变量 X 与E (X)差的 k 次幂的数学期望为 X 的 k 阶中心矩,记为 ,即k对于正整数 k,称随机变k =E(Xk)= j+wx k f (