1、第 1 章排列组) (1合公式随机事件及其概率m!n?P 从 m 个人中挑出n 个人进行排列的可能数。 m(m?n)!m!n?C 从 m 个人中挑出n 个 人进行组合的可能数。 mn!(m?n)!(2)加法和加法原理(两种方法均能完成此事): m+n乘法原理某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由n 种方法来完 成,则这件事可由 m+n 种方法来完成。乘法原理(两个步骤分别不能完成这件事): mn某件事由两个步骤来完成,第一个步骤可由 m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由 mn 种方法来完成。一些常(3) 见排列重复排列和非重复排列(有序)
2、 对立事件(至少有一个) 顺序问题随机试(4)如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一验和随机事次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。件试验的可能结果称为随机事件。基本事) (5在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:件、样本空每进行一次试验,必须发生且只能发生这一组中的一个事件;间和事件任何事件,都是由这一组中的部分事件组成的。?来表示。 这样一组事件中的每一个事件称为基本事件,用?表示。 基本事件的全体, 称为 试验的样本空间,用?A,)组成的集合。通常用大写字母一个事件就是由中的部分点(基
3、本事件?, CB 的子集。表示事件,它们是?为必然事件, ?为不可能事件。不可能事件 (?) 的概率为零, 而概率为零的事件不一定是不可能事件; 同理, 必然事件 ()的概率为 1,而概率为 1 的事件也不一定是必然事件。6)事件的 ( 关系与运 算关系:BAB 发生):的组成部分, (发生必有事件 A 如果事件的组成部分也是事件B?AA?BB?AABAB:如果同时有,则称事件等价,或称,与事件等于A=B。?BABA、BA。+,或者中至少有一个发生的事件: ABA 与 BA-B,也可表而不属于的差,记为属于的部分所构成的事件,称为ABAA-ABB 不发生的事件。发生而,它表示 示为或 者?AB
4、BABA、B=?,则表示 A 与B 同时发生:不可能同时发生,称,或者。 A 互不相容或者 互斥。基本事件是互不相容的。 B 与事件 A 事件A?。它表示 A 不发生的的逆事件,或称A 的对立事件,记为-A 称为事件 A 事件。互斥未必对立。运算:结合率: A(BC)=(AB)C A(BC)=(AB) C分配率: (AB) C=(AC) (BC) (AB) C=(AC) (BC)? AA?iiA?B?A?BA?B?A?B 德摩根率:, 1i?1i?概率的) (7公理化定义?AA 都有一个实数 P(A)为事件, 对每一个事件设, 若满足为样本空间, 下列三个条件: ,1 0P(A)1) =12
5、P(AA,有 3 对于两两互不相容的事件 , 21 常称为可列(完全)可加性。 A 的概率。 P(A)为事件则称古典概 8)( 型?,?, 1 n21 1? )?P()?PP() 2 。n12nA?,组成的,则有 设任一事件,它是由m21?)P(?()?P(?)()?(?)PP(A) = =m11m22(9)几何概 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一型 个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件 A,L(A)?)AP( 。其中 L 为几何度量(长度、面积、体积)。 L(?)10)加法(公 P(A+B)=P(A)+P(B
6、)-P(AB) 当 P(AB) 0 时, P(A+B)=P(A)+P(B)式(11)减法公式P(A-B)=P(A)-P(AB)?A 时, BP(A-B)=P(A)-P(B) 当B)=1- P(B)P(A=时,当)条件(12 概 率P(AB)为事件 A 发生条件下,事件定义 设 A、 B 是两个事件,且 P(A)0,则称)AP()ABP(?A)P(B/ 。 B 发生的条件概率,记为)AP(条件概率是概率的一种,所有概率 的性质都适合于条件概率。?P(/B)=1/A)=1-P(B/A) 例如 P(B)乘法 13( 公 P(AB)?P(A)P(B/A) 乘法公式:更一般地,对事件 A, A,A,若
7、P(AAA)0,则有式 n- 11(A)?n2(P)(1(A)P(A|A)P(A|AA)P(A|AAAA(P21n3211n2121A)1?n 。)独立(14 性 两个事件的独立性P(AB)?P(A)P(B)ABBA 是相互独立满足、设事件、,则称事件 的。 P(A)?0BA,则有相 互独立, 且 若事件、 ABABABAB 也都相互独与、若事件与、 与相互独立, 则可得到 立。? 和不可能事件?必然事件与任何事件都相互独立。 ?与任何事件都互斥。多个事件的独立性设 ABC 是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B); P(BC)=P(B)P(C); P(CA)=P(C)
8、P(A)并且同时满足 P(ABC)=P(A)P(B)P(C)那么 A、 B、 C 相互独立。对于 n 个事件类似。)全概 15( 率公式B,B,?,Bn21 满足设事件B,B,?,BP(B)?0(i?1,2,?,n)i21n,两两互不相容, 1n? BA?i, 21?i 则有P(A)?P(B)P(A|B)?P(B)P(A|B)?P(B)P(A|B)n121n2。BABBn 满足, , 设事件及, 21 P(Bi)i?nBBBn, 1 ,0, ,两两互不相容, 2, , 121n?BA?iP(A)?0, , 21i? 则P(B)P(A/B)ii?/P(BA), i=1, 2,n。in? )B/)
9、P(AP(Bjj1?j 此公式即为贝叶斯公式。ni?11i2)/AP(P(B)B, (, () ,通常叫先验概率。 iin2 ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并,作出了“由果朔因”的推断。)伯努(17 利概型n 次试验,且满足 我们作了 AA 每次试验只有两种可能结果, ? 不发生;发生或nA? 次试验是重复进行的, 即发生的概率每次均一样; AA 每次试验是独立的, 即每次试 验? 发生与否发生与否与其他次试验是互不影响的。 n 重伯努利试验。 这种试验称为伯 努利概型,或称为 1?p?qP(k)pAAn 表示发生的概率为,用用表示每次试验发生的概率, 则 k(0?
10、k?n)nA 次的概率,出现重伯努利试验中)贝叶(16 斯公式Ck kn? kqpP(k)?k?0,1,2,?,nn。 , n第二章)离散(1 型随机变量 的分布 律随机变量及其分布X 的可能取值为 X(k=1,2, )且取各个值的概率,即事件设离散型随机变量 (X=X)的概率为kP(X=x)=p, k=1,2, , X 的概率分布或分布律。有时也用分布列的形式则称上式为离散型k kk随机变量 给出: Xx,x,?,x,?k12|P(X?x)p,p,?,p,?k2k1。显然分布律应满足下列条件:? ?p1k?,kp?0?1,2k。 , , (2) (1) 1k?)连续(2 型随机变量 的分布
11、密 度f()x)(FxxX,有的分布函数,若存在非负函数设是随机变量 ,对任意实数?xdx)(x)?xfF(?, f(x)XX 的概率密度函数或密度函数,简称概率为连续型随机变量。称为则称密度。密度函数具有下面 4 个性质:f(x)?0。 1?f(x)dx?1。?2(3) 离散与 连续型随机 变量 的关系P(X?x)?pkkdx)xf(在离散型积分元在连续型随机变量理论中所起的作用与 随机变量理论 中所起的作用相类似。)分布(4 函数xX 是任意实数, 则函数设 为随机变量, 称为随机变量 X 的分布函数, 本质上是一个累积函 数。 P(a?X?b)?F(b)?F(a)(a,b 的概率。分布函
12、落入区间 可以得到 XF(x)表示随机变量 落入区间( , x 内的概率。 数分布函数具有如下性质:?x?,? 1)0?F(x; 1x?xF(x)?FF(x)(x) ;是单调不减的函数,即 2 时,有2121 F(?)?limF(x)?0F(?)?limF(x)?1; 3 , x?x? F(x?0)?F(x)F(x)是右连续的; ,即 4P(X?x)?F(x)?F(x?0)。 5 p?(x)F;对于离散型随机变量,?f(x)(x)?dxF。 对于连续型随机变量,kx?x ?(5)八大 0- 1 分布 P(X=1)=p, P(X=0)=q 分布二项分布 pnAA重贝努里试验中,设事件。事件在发生
13、的发生的概率为0,1,n2,?XX可能取值为次数是随机变量,设为。 ,则 kkn?kqpP(k)?CP(X?k)?, 其中 nnq?1?p,0?p?1,k?0,1,2,?,n,pnX 的二项分布。记为服从参数为,则称随机变量XB(n,p)。k1?kq)(PX?k?pk?n1?0.1,这就是(当时, 0- 1)分 )分布是二项分布的特例。 0- 1 布,所以(泊松分布X 的分布律为 设随机变量 k?e(X?k)?Pk?0,1,2?0?, !k?)X(X 或者服从参数为的泊松分布,记为则称随机变量?) 。P(泊松分布为二项分布的极限分布(np= , n ) 。超几何分布几何分布随机变量 X 服从参
14、数为n,N,M 的超几何分布,记为 H(n,N,M)。k?1p,k?1,2X?k)?q,3,?P(,其中 p0, q=1-p。随机变量 X 服从参数为p 的几何分布,记为 G(p)。均匀分布f(x)X 在a, b设随机变量的值只落在a, b内, 其密度函数 1 , 即上为常数ab?1? bax,?x)f(ab? 其他, ?,0?X 在a, b上服从均匀分布,记为 X 则称随机变量U(a, b)。分布函数为0, xb 1, x,x )内的概率为 b 当 axx时, X 落在区间( 21 x?x12?x)P(x?X?。 21b?a21指数分布?x?e,? x?0?)f(x,? ?0x?0 的指数分
15、服从参数为其中?,则称随机变量 X,0,布。X 的分布函数为?x? 1?e,x?0 记住积分公式: ,?)(Fx0,x正态分布X 的密度函数为设随机变量2 2?)?(x1?x? ef(x)?2, ?2?0?X、服从参数为其中、为常数,则称随机变量 2?),N(X?。 的正态分布或高斯(Gauss)分布,记为f(x)具有如下性质:?)(xf?x 对称的;的图形是关于 121?x?f()为最大值; 时, 2 当?22?),XN( X?)?(t, 则的分布函数为 若?1?x dt?eF(x)?2?2? 。?0?1 时的正态分布称为标准正态分布,记为参2数、 XN(0,1) x ,其密度函数记为 1?
16、(x)?e2?2?x?,2分布函数为?tx 1? dt?e?(x)2 。 ?2?)x?( 是不可求积函数,其函数值,已编制成表可2供查用。 1 (-x) 1- (x)且(0)。 2?X2?)N(,N(0,1)X。如果,则12 ?xx? ?P(x?X?x)?21。 ?)分位 6( 数?)(X?P 下分位表:; ?)(X?P 上分位表: 。?)函数 7( 分布离散型X 的分布列为已知 x,x,?,x,?Xn21, ? P(X?x)p,p,?,p,?in12y?g(x)Y?g(X互不相等)如下:的分布列( iig(x),g(x),?,g(x),?Yn12,P(Y?y)p,p,?,p,?in12pg(
17、)x)g(x 的概率。 相加作为相等, 则应将对应的若 有某些 iii连续型先利用 X 的概率密度 f(x)写出Y 的分布函数 F(y) P(g(X)y),变上下限积分的求导公式求出 f(y)。Y再利用YX二维随机变量及其分布 第三章(1)联合分 布离散型? (X, Y 如果二维随机向量)的所有可能取值为至多可列个?为离散型随机量。 x,y),则称有序对(?(x,y)(i,j? 1,2,?),设= (X, Y)的所有可能取值为 ji?(x,y)p,且事件称= 的概率为 ij, ji?= (X, Y)为的分布律或称为X 和 Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:Yyyy pp
18、px Xj 21pxpp1j111122j22221xp i1ip 具有下面两个性质: 这里 ijp0 () i,j=1,2, ); (1ij? p?1. ) (2ijji连续型?(X,Y),如果存在非负函数对于二维随机向量f(x,y)(?x?,?y?),使对任意一个其邻边分别平行于坐标轴的矩形区域 D,即 D=(X,Y) |axb,cyx 时,有 F (x,y)F(x,y);当 yy 时,有 F(x,y) F(x,y); (3) F (x,y)分别12211221对 x 和 y 是右连续的,即F(?,?)?F(?,y)?F(x,?)?0,F(?,?)?1. ) (4x?x, y?y, 5)对
19、于( 2121 F(x, y)?F(x,y)?F(x, y)?F(x, y)?0.11221221(4)离散型 与连续型的 关系(5)边缘分 布离散型的边缘分布为 X? p(i,j? 1,2P(X?x)?,?)P?;?ij?jjip(i,j? 1)?,2,?)yP?P(Y?。Yijii?j 的边缘分布为连续型X 的边缘分布密度为Y 的边缘分布密度为6 ()条件分布离散型连续型X=x 的条件下, Y 在已知取值的条件分布为 Y=y 的条件下, X 取值的条件i分布为 在已知j在已知 Y=y 的条件下, X 的条件分布密度为f(x,y)?)f(x|y; f(y)Y 在已知 X=x 的条件下, Y
20、的条件分布密度为(7)独立性一般型离散型F(X,Y)=F(x)F(y) YX有零不独立连续型f(x,y)=f(x)f(y) 直接判断,充要条件:YX可分离变量正概率密度区间为矩形二维正态分布?0随机变量的函 数若 X,X, X,X,X 相互独立, h,g 为连续函数,则: h (X, X, X)nm2m+11和 g (X,X)相互独立。 特例:若 X 与Y 独立,则: h (X)和 g (Y)n21m+1m独立。(8)二维均匀分布例如:若 X 与 Y 独立,则: 3X+1 和 5Y-2 独立。设随机向量(X, Y)的分布密度函数为其中 S 为区域 D 的面积,则称(X, Y)服从 D 上的均匀
21、分布,记为(X, Y)U (D)。D例如图 3.1、图 3.2 和图 3.3。y1D 1 O x13.1图 y1O图y d cO图x2D3abx32D 3.21.3(9)二维正态分布设随机向量(X, Y)的分布密度函数为 ?|?,|?0,1?,0 是 5 个参数,则称(其中 X, Y)服从二维正态分 2,211 布,22?)., (Y)N 记为(X, 22,11 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,22?).(Y),N (XN 即 221,122?,()N),Y (XN(X, Y)未必是二维正态分布。 但是若,12,12(10)函数分布Z=X+YF(z)?P(
22、Z?z)?P(X?Y?z) 根据定义计算: Z? f(x, z?x)dx 对于连续型,f (z) ?22?,? )。两个独立的正态分布的和仍为正态分布( 2121n 个相互Z独立的正态分布的线性组合,仍服从正态分布。?222 , iiiiii?C?CZ=max,min()n21XX,X,X,X?X 相互独立,其分布函数分别为若 n12F(x), F(x)?F(x),则 Z=max,min(X,X,X)的分布函 n12xxxn21 数为:2? 分布X,X,?,X 相互独立,且服从标准正态分 n 个随机变量设 n12 布,可以证明 它们的平方和的分布密度为22?)(n, W 的分布, 记为我们称随
23、机变量 W 服从自由度为n 其中所谓自 由度是指独立正态随机变量的个数,它是随机变量分 布中的一个重要参 数。 2?分布满足可加性:设则t 分布设 X, Y 是两个相互独立的随机变量,且可以证明函数的概率密度为我们称随机变量 T 服从自由度为n 的 t 分布,记为 Tt(n)。F 分布22?(n),YX)(n, 且 X 与设 Y 独立, 可以证明 21X/n1?F 的概率密度函数为 Y/n2 我们称随机变量 F 服从第一个自由度为 n,第二个自由度为 n 的F 分布,记为 Ff(n, n).2121第四章 随机变量的数字特征离散型连续型(1)一维随机变量的数字特征期望 期望就是平均值是离散型随
24、机变量,其分布设Xx?X, ) p 律为 P( k k=1,2,n,k设 X 是连续型随机变量,其概率密度为 f(x), (要求绝对收敛)(要求绝对收敛)Y=g(X)Y=g(X)函数的期望方差 D(X)=EX-E(X), 标准2差?(X)?D(X) ,矩对于正整数 k,称随机变量 X 阶的k 次幂的数学期望为X 的 k 原点矩,?k k记为 v, 即 kpx,k=E(X)= iiik=1,2, . X对于正整数 k,称随机变量)差的 k 次幂的数学期望与 E (X?阶中心矩,记为,?即 为 X 的 kk kpX)x?E( ,=iiik=1,2, .对于正整数 k,称随机变量 X 的 k 次幂的
25、数学期望为 X 的 k 阶原点矩,记为?k k kv, 即 ?k f(x)dxx, =E(X)= ?k=1,2, .对于正整数 k, 称随机变量 X 与E (X)差的 k 次幂的数学期望为X 的?,即 k?阶中心矩, 记为 k?k f(x)dx,(x?E(X=?k=1,2, .(2) 期望 的性 质切比雪夫不等式设随机变量 X 具有数学期望E (X) = ,方差 D (X) = ,则对于任意 正数,2有下列切比雪夫不等式切比雪夫不等式给出了在未知 X 的分布的情况下,对概率的一种估计,它在理论上有重要意义。(1) E(C)=C?(2) E(CX)=CE(X) nn )XCXE)?(E(C ,
26、(3) E(X+Y)=E(X)+E(Y)iiii1?i?1i (4) E(XY)=E(X) E(Y) ,充分条件:X 和 Y 独立;充要条件: X 和 Y 不相关。(3) (1) D(C)=0; E(C)=C方差 E(aX)=aE(X) D(X); 2) D(aX)=a ( E(aX+b)=aE(X)+b ; D(aX+b)= aD(X) (3) (X)2 2 22的性 D(X)=E(X)-E (4)质独立;Y)=D(X)+D(Y),充分条件: X 和 Y5 () D(X YY)=D(X)+D(Y) 2E(X-E(X)(Y-E(Y) ,无条件成立。充要条件: X 和不相关。D(X 而 E(X+
27、Y)=E(X)+E(Y),无条件成立。)(4 常见分布的期望和 方差)pB(1, 0- 1 分布)nB(,p 二项分布期望pnp方差?)P( 泊松分布t 分布)pG( 几何分布),nH(N,M 超几何分布U(a,b) 均匀分布?)e( 指数分布2?)N(, 正态分布n 2n0 n(n2) n?2期望(5)二维随机变量的数字特征EG(X,Y)函数的期望EG(X,Y)方差协方差?为 X 与Y 的协方差对于随机变量 X 与 Y,称它们的二阶混合中心矩 11?或cov(X,Y),即或相关矩,记为 XY?)也可分别记为 YD (的方差 D (X 与记号)与相对应, X 与 YXXXY?。 与 YY对于随
28、机变量 X 与 Y,如果 D (X) 0, D(Y)0,则称?) 。(有时可简记为与 Y 的相关系数,记作 为 XXY? |=1 时,称 X 与 Y|完全相关: |1,当|P(X?aY?b)?1?1 时(a?0), 正相关, 当? 完全相关?,0)时(a?负相关, 当 1?0时,称 X 而当与 Y 不相关。以下五个命题是等价的:?0 ; XYcov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).协方差矩阵lk)XYE(k+l 的 X, 如果有与对于随机变量 XY 与 Y 存在, 则称之为?k+l 阶混合中心矩记为:阶混合原点矩,
29、记为; kl相关系数混合矩(6) 协方 差的 性质 ) 7(独 立和 不 相 关第五章 大数定律和中心极限定理切比雪夫大数定律I12?0? ;反之不真。 (i) 与 Y 相互独立,则若随机变量 XXY22?, (ii),)N (若(X, Y2211 不相关。和 Y则 X 与 Y 相互独立的充要条件是 X设随机变量 X, X,相互独立,均具有有限方差,且被同一常 X)21C(i=1,2, ),则对于任意的正数, 有 数 C 所界: D ( i 特殊情形: 若 X,X,具有相同的数学期望 E (X) = , 则上式成为(i) cov (X, Y)=cov (Y, X);cov(aX,bY)=ab
30、cov(X,Y); (ii)(iii) cov(X+X, Y)=cov(X,Y)+cov(X,Y);cov(X,Y)=E(XY)-E(X)E(Y).(iv)(1)大数定律2211量)伯努利在每 p 是事件 A 设是 n 次独立试验中事件 A 发生的次数, 次试验中发大数定生的概率,则对于任意的正数,有发生的 n 很大时,事件 A 伯努利大律数定律说明, 当试验次数 频率与概率有较大判别的可能性很小, 即 这就以严格的数学形式描述了频率的稳定性。辛钦大数定律EX,是相互独立同分布的随机变量序列,且设 X, X, = ,则对n21于任意的正数有(X)n(2) 中心极限定 理 列维林德伯格定理,相互
31、独立,服从同一分布,且具有相, X 设随机变量X 同的数学期望21和方差: 2?0(k?1)?,2,?)E(X)?D,(X,则随机变量 kkFxx ,有 )对任意的实数的分布函数( 此定理也称为独立同分布的中心极限定理。棣莫弗拉普 拉斯定 理X 为具有参数 n, p(0p1)的二项分布,则对于任意设随机变量有n 实数 x,3)二项定理( M?p(n,k 不变 N?时,),则若当 N 超几何分布的极限分布为二项分布。(4)泊松定理?0np?n?时,,则若当其中 k=0, 1, 2, n ,。二项分布的极限分布为泊松分布。n第六章 样本及抽样分布在数理统计中,常把被考察对象的某一个(或多个)指标的
32、全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机 变量(或随机向。(1)数理统 计的基本概 念总体个体 总体中的每一个单元称为样品(或个体)。样本x,x,?,x 称为样本。样本中我们把从总体中抽取的部分样品 n12 所含的样 品数称为样本容量,一般用 n 表示。在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量, 这样的样本称为简单随机 样本。在泛指任一次抽取的结果 x,x,?,x 表示 n 个随机变量(样本);在 具体的一次抽时, n21x,x,?,x 表示 n 取之后,个具体的数值(样本值) 。 我们称 n21 之为样本的两重性。样本函数和统计量x,x,?,x 为总体的一个样本,称设 n21?x,x,?,x?) ( n12?中不包含任何未知为一个连续函数。如果为样本函数,其中?x,x,?,x)为一个统计量。(参数,则称 n21常见统计量及其性质?1 x?.xn