考研数学《概率论与数理统计》知识点总结.doc

资源描述

第一章概率论的基本概念定义：随机试验E的每个结果样本点组成样本空间S，S的子集为E的随机事件，单个样本点为基本事件．事件关系： 1．AB，A发生必导致B发生． 2．AB和事件，A，B至少一个发生，AB发生． 3．AB记AB积事件，A，B同时发生，AB发生． 4．A－B差事件，A发生，B不发生，A－B发生． 5．AB=Ø，A与B互不相容(互斥)，A与B不能同时发生，基本事件两两互不相容． 6．AB=S且AB=Ø，A与B互为逆事件或对立事件，A与B中必有且仅有一个发生，记B=．事件运算：交换律、结合律、分配率略．德摩根律：，．概率：概率就是n趋向无穷时的频率，记P(A)．概率性质: 1．P(Ø)=0． 2．(有限可加性)P(A1A2…An)=P(A1)+P(A2)+…+P(An)，Ai互不相容． 3．若AB，则P(B－A)=P(B)－P(A)． 4．对任意事件A，有． 5．P(AB)=P(A)+P(B)－P(AB)．古典概型：即等可能概型，满足：1．S包含有限个元素．2．每个基本事件发生的可能性相同．等概公式：．超几何分布：，其中．条件概率：．乘法定理：．全概率公式：，其中为S的划分．贝叶斯公式：，或．独立性：满足P(AB)=P(A)P(B)，则A，B相互独立，简称A，B独立．定理一： A，B独立，则．P(B|A)=P(B)．定理二： A，B独立，则A与，与，与也相互独立．第二章随机变量及其分布 (0—1)分布：，k=0，1 （0<p<1）．伯努利实验：实验只有两个可能的结果：A及．二项式分布：记X~b（n，p），． n重伯努利实验：独立且每次试验概率保持不变．其中A发生k次，即二项式分布．泊松分布：记X~π（λ），，．泊松定理：，其中．当，应用泊松定理近似效果颇佳．随机变量分布函数：，．．连续型随机变量：，X为连续型随机变量，为X的概率密度函数，简称概率密度．概率密度性质： 1．；2．；3．；4．，f(x)在x点连续；5．P{X=a}=0．均匀分布：记X~U(a，b)；；．性质：对a≤c<c+l≤b，有指数分布：；．无记忆性：．正态分布：记；；．性质： 1．f(x)关于x=μ对称，且P{μ-h<X≤μ}=P{μ<X≤μ+h}；2．有最大值f(μ)=()-1．标准正态分布：；．即μ=0，σ=1时的正态分布X~N(0，1) 性质：．正态分布的线性转化：对有；且有．正态分布概率转化：；． 3σ法则： P=Φ(1)－Φ(-1)=68.26%；P=Φ(2)－Φ(-2)=95.44%；P=Φ(3)－Φ(-3)=99.74%，P多落在(μ-3σ，μ+3σ)内．上ɑ分位点：对X~N(0，1)，若zα满足条件P{X>zα}=α，0<α<1，则称点zα为标准正态分布的上α分位点．常用上ɑ分位点： 0.001 0.005 0.01 0.025 0.05 0.10 3.090 2.576 2.326 1.960 1.645 1.282 Y服从自由度为1的χ2分布：设X密度函数fX(x)，，若Y=X2，则若设X~N(0，1)，则有定理：设X密度函数fX(x)，设g(x)处处可导且恒有g′(x)>0(或g′(x)<0)，则Y=g(X)是连续型随机变量，且有 h(y)是g(x)的反函数；①若，则α=min{g(−∞)，g(+∞)}，β=max{g(−∞)，g(+∞)}；②若fX(x)在[a，b]外等于零，g(x)在[a，b]上单调，则α=min{g(a)，g(b)}，β=max{g(a)，g(b)}．应用： Y=aX+b~N(aμ+b，(|a|σ)2)．第三章多维随机变量及其分布二维随机变量的分布函数：分布函数(联合分布函数)：，记作：．． F（x，y）性质： 1．F（x，y）是x和y的不减函数，即x2>x1时，F（x2，y）≥F（x1，y）；y2>y1时，F（x，y2）≥F（x，y1）． 2．0≤F（x，y）≤1且F（−∞，y）=0，F（x，−∞）=0，F（−∞，−∞）=0，F（+∞，+∞）=1． 3．F（x+0，y）=F（x，y），F（x，y+0）=F（x，y），即F（x，y）关于x右连续，关于y也右连续． 4．对于任意的(x1，y1)，(x2，y2)，x2>x1，y2>y1，有P{x1<X≤x2，y1<Y≤y2}≥0．离散型（X，Y）：，，．连续型（X，Y）：． f(x，y)性质： 1．f(x，y)≥0． 2．． 3．． 4．若f(x，y)在点(x，y)连续，则有． n维： n维随机变量及其分布函数是在二维基础上的拓展，性质与二维类似．边缘分布： Fx(x)，Fy(y)依次称为二维随机变量（X，Y）关于X和Y的边缘分布函数，FX(x)=F(x，∞)，FY(y)=F(∞，y)．离散型：和分别为（X，Y）关于X和Y的边缘分布律，记，．连续型：，为（X，Y）关于X和Y的边缘密度函数，记，．二维正态分布：．记(X，Y)~ N(μ1，μ2，σ12，σ22，ρ) ，．，．离散型条件分布律：．．连续型条件分布：条件概率密度：条件分布函数：含义：当时，．均匀分布：若，则称(X，Y)在G上服从均匀分布．独立定义：若P{X≤x，Y≤y}=P{X≤x}P{Y≤y}，即F(x，y)=Fx(x)Fy(y)，则称随机变量X和Y是相互独立的．独立条件或可等价为：连续型：f(x，y)=fx(x)fy(y)；离散型：P{X=xi，Y=yj}=P{X=xi}P{Y=yj}．正态独立：对于二维正态随机变量（X，Y），X和Y相互对立的充要条件是：参数ρ=0． n维延伸：上述概念可推广至n维随机变量，要注意的是边缘函数或边缘密度也是多元(1~n-1元)的．定理：设（X1，X2，…，Xm）和（Y1，Y2，…，Yn）相互独立，则Xi和Yj相互独立．又若h，g是连续函数，则h（X1，X2，…，Xm）和g（Y1，Y2，…，Yn）相互独立． Z=X+Y 分布：若连续型(X，Y)概率密度为f(x，y)，则Z=X+Y为连续型且其概率密度为或． fX和fY的卷积公式：记，其中除继上述条件，且X和Y相互独立，边缘密度分别为fX(x)和fY(y)．正态卷积：若X和Y相互独立且X~N(μ1，σ12)，记Y~N(μ2，σ22)，则对Z=X+Y有Z~N(μ1+μ2，σ12+σ22)． 1．上述结论可推广至n个独立正态随机变量．2．有限个独立正态随机变量的线性组合仍服从正态分布．伽马分布：记，，．，其中．若X和Y独立且X~Γ(α，θ)，记Y~Γ(β，θ)，则有X+Y~Γ(α+β，θ)．可推广到n个独立Γ分布变量之和．：，若X和Y相互独立，则有．分布：，若X和Y相互独立，则有．大小分布：若X和Y相互独立，且有M=max{X，Y}及N=min{X，Y}，则M的分布函数：Fmax(z)=FX(z)FY(z)，N的分布函数：Fmin(z)=1－[1－FX(z)][1－FY(z)]，以上结果可推广到n个独立随机变量的情况．第四章随机变量的数字特征数学期望：简称期望或均值，记为E(X)；离散型：．连续型：．定理：设Y是随机变量X的函数：Y=g(X)(g是连续函数)． 1．若X是离散型，且分布律为P{X=xk}=pk，则：． 2．若X是连续型，概率密度为f(x)，则：．定理推广：设Z是随机变量X，Y的函数：Z=g(X，Y)(g是连续函数)． 1．离散型：分布律为P{X=xi，Y=yj}=pij，则：． 2．连续型：期望性质：设C是常数，X和Y是随机变量，则： 1．E(C)=C．2．E(CX)=CE(X)．3．E(X+Y)=E(X)+E(Y)． 4．又若X和Y相互独立的，则E(XY)=E(X)E(Y)．方差：记D(X)或Var(X)，D(X)=Var(X)=E{[X－E(X)]2}．标准差(均方差)：记为σ(X)，σ(X)= ．通式：．，．标准化变量：记，其中，，称为X的标准化变量．，．方差性质：设C是常数，X和Y是随机变量，则： 1．D(C)=0． 2．D(CX)=C2D(X)，D(X+C)=D(X)． 3．D(X+Y)=D(X)+D(Y)+2E{(X－E(X))(Y－E(Y))}，若X，Y相互独立D(X+Y)=D(X)+D(Y)． 4．D(X)=0的充要条件是P{X=E(X)}=1．正态线性变换：若，是不全为0的常数，则．切比雪夫不等式：或，其中，，为任意正数．协方差：记． X与Y的相关系数：． D(X+Y)=D(X)+D(Y)+2Cov(X，Y)，Cov(X，Y)=E(XY)－E(X)E(Y)．性质： 1．Cov(aX，bY)=abCov(X，Y)，a，b是常数． 2．Cov(X1+X2，Y)=Cov(X1，Y)+Cov(X2，Y)．系数性质：令e=E[(Y－(a+bX))2]，则e取最小值时有，其中，． 1．|ρXY|≤1．2．|ρXY|=1的充要条件是：存在常数a，b使P{Y=a+bX}=1． |ρXY|越大e越小X和Y线性关系越明显，当|ρXY|=1时，Y=a+bX；反之亦然，当ρXY=0时，X和Y不相关． X和Y相互对立，则X和Y不相关；但X和Y不相关，X和Y不一定相互独立．定义： k阶矩(k阶原点矩)：E(X k )． n维随机变量X i的协方差矩阵：， =E{[Xi－E(Xi)][X j－E(X j)]}． k+l阶混合矩：E(X kY l )． k阶中心矩：E{[X－E(X)] k }． k+l阶混合中心矩： E{[X－E(X)]k[Y－E(Y)]l}． n维正态分布：，．性质： 1．n维正态随机变量(X1，X2，…，X n)的每一个分量Xi (i=1，2，…，n)都是正态随机变量，反之，亦成立． 2．n维随机变量(X1，X2，…，X n)服从n维正态分布的充要条件是X1，X2，…，X n的任意线性组合l1X1+l2X2+…+l n X n服从一维正态分布(其中l1，l2，…，l n不全为零)． 3．若(X1，X2，…，X n)服从n维正态分布，且Y1，Y2，…，Y k是X j (j=1，2，…，n)的线性函数，则(Y1，Y2，…，Y k)也服从多维正态分布． 4．若(X1，X2，…，X n)服从n维正态分布，则“Xi 相互独立”与“Xi 两两不相关”等价．第五章大数定律及中心极限定理弱大数定理：若X1，X2，…是相互独立并服从同一分布的随机变量序列，且E(X k)=μ，则对任意ε>0有或，．定义： Y1，Y2，…，Y n ，…是一个随机变量序列，a是一个常数．若对任意ε>0，有则称序列Y1，Y2，…，Y n ，…依概率收敛于a．记伯努利大数定理： ~ 对任意ε>0有或．其中f A是n次独立重复实验中事件A发生的次数，p是事件A在每次试验中发生的概率．中心极限定理定理一：设X1,X2,…,X n ,…相互独立并服从同一分布，且E(X k)=μ，D(X k)=σ2 >0，则n→∞时有近似的 N(0，1)或~N(0，1)或~N(μ，)．定理二：设X1,X2,…,X n ,…相互独立且E(X k)=μ k，D(X k)=σ k2 >0，若存在δ>0使n→∞时，，则~N(0，1)，记．定理三：设，则n→∞时，(0，1)，．第六章样本及抽样分布定义：总体：全部值；个体：一个值；容量：个体数；有限总体：容量有限；无限总体：容量无限．定义：样本：X1,X2,…,X n 相互独立并服从同一分布F的随机变量，称从F得到的容量为n的简单随机样本．频率直方图：图形：以横坐标小区间为宽，纵坐标为高的跨越横轴的几个小矩形．横坐标：数据区间（大区间下限比最小数据值稍小，上限比最大数据值稍大；小区间：均分大区间，组距Δ=大区间/小区间个数；小区间界限：精度比数据高一位）．图形特点：外轮廓接近于总体的概率密度曲线．纵坐标：频率/组距（总长度：<1/Δ；小区间长度：频率/组距）．定义：样本p分位数：记xp，有1．样本xi中有np个值≤xp．2．样本中有n(1－p)个值≥xp．箱线图： xp选择：记．分位数x0.5，记为Q2或M，称为样本中位数．分位数x0.25，记为Q1，称为第一四分位数．分位数x0.75，记为Q3，称为第三四分位数．图形： min Q1 M Q3 max 图形特点：M为数据中心，区间[min，Q1]，[Q1，M]，[M，Q3]，[Q3，max]数据个数各占1/4，区间越短数据密集．四分位数间距：记IQR=Q3－Q1；若数据X<Q1－1.5IQR或X>Q3+1.5IQR，就认为X是疑似异常值．抽样分布：样本平均值：样本方差：样本标准差：样本k阶(原点)矩：，k≥1 样本k阶中心矩：，k≥2 经验分布函数：，．表示F的一个样本X1,X2,…,X n 中不大于x的随机变量的个数．自由度为n的χ2分布：记χ2~χ2（n），，其中X1,X2,…,X n是来自总体N(0，1)的样本．E(χ2 )=n，D(χ2 )=2n． χ12+χ22~χ2（n1+n2）．． χ2分布的分位点：对于0<α<1，满足，则称为的上α分位点．当n充分大时(n>40)，，其中是标准正态分布的上α分位点．自由度为n的t分布：记t~t (n)，，其中X~N(0，1)，Y~χ2(n)，X，Y相互独立． h(t)图形关于t=0对称；当n充分大时，t分布近似于N(0，1)分布． t分布的分位点：对于0<α<1，满足，则称为的上α分位点．由h(t)对称性可知t1－α(n)=－t α(n)．当n>45时，t α(n)≈zα，zα是标准正态分布的上α分位点．自由度为(n1，n2)的F分布：记F~F(n1，n2)，，其中U~χ2(n1)，V~χ2(n2)，X，Y相互独立．1/F~F(n2，n1) F分布的分位点：对于0<α<1，满足，则称为的上α分位点．重要性质：F1－α(n1，n2)=1/Fα(n1，n2)．定理一：设X1,X2,…,X n 是来自N(μ，σ2)的样本，则有，其中是样本均值．定理二：设X1,X2,…,X n 是来自N(μ，σ2)的样本，样本均值和样本方差分别记为，，则有1．；2．与相互独立．定理三：设X1,X2,…,X n 是来自N(μ，σ2)的样本，样本均值和样本方差分别记为，，则有．定理四：设X1,X2,…,X n1 与Y1,Y2,…,Y n2分别是来自N(μ1，σ12)和N(μ2，σ22)的样本，且相互独立．设这两个样本的样本均值和样本方差分别记为，，，，则有1．． 2．当σ12=σ22=σ2时，，其中，．第七章参数估计定义：估计量：，估计值：，统称为估计．矩估计法：令=()(k为未知数个数)联立方程组，求出估计．设总体X均值μ及方差σ2都存在，则有，．最大似然估计法：似然函数：离散：或连续：，化简可去掉与θ无关的因式项．即为最大值，可由方程或求得．当多个未知参数θ1，θ1，…，θk时：可由方程组或（）求得．最大似然估计的不变性：若u=u(θ)有单值反函数θ=θ(u)，则有，其中为最大似然估计．截尾样本取样：定时截尾样本：抽样n件产品，固定时间段t0内记录产品个体失效时间(0≤t1≤t2≤…≤tm≤t0)和失效产品数量．定数截尾样本：抽样n件产品，固定失效产品数量数量m记录产品个体失效时间(0≤t1≤t2≤…≤tm)．结尾样本最大似然估计：定数截尾样本：设产品寿命服从指数分布X~e（θ），θ即产品平均寿命．产品ti时失效概率P{t=ti}≈f(ti)d ti，寿命超过tm的概率，则，化简得，由得：，其中s(tm)=t1+t2+…+tm+(n－m)tm，称为实验总时间．定时截尾样本：与定数结尾样本讨论类似有s(t0)=t1+t2+…+tm+(n－m)t0，，，．无偏性：估计量的存在且，则称是的无偏估计量．有效性：与都是的无偏估计量，若，则较有效．相合性：设的估计量，若对于任意有，则称是的相合估计量．置信区间：，和分别为置信下限和置信上限，则是的一个置信水平为置信区间，称为置信水平，．正态样本置信区间：设X1，X2，…，Xn是来自总体X~N(μ，σ2)的样本，则有μ的置信区间：枢轴量W W分布 a，b不等式置信水平置信区间其中zα/2为上α分位点 θ置信区间的求解： 1．先求枢轴量：即函数W=W(X1，X2，…，Xn；θ)，且函数W的分布不依赖未知参数．如上讨论标注 2．对于给定置信水平，定出两常数a，b使P{a<W<b}=，从而得到置信区间． (0－1)分布p的区间估计：样本容量n>50时，若令，，，则有置信区间(，）．单侧置信区间：若或，称(，)或(，)是θ的置信水平为的单侧置信区间．正态总体均值、方差的置信区间与单侧置信限（置信水平为）待估其他枢轴量W的分布置信区间单侧置信限一个正态总体 μ σ2已知， μ σ2未知， σ2 μ未知，两个正态总体 μ1－μ2 σ12，σ22 已知 μ1－μ2 σ12=σ22=σ2 未知 σ12/σ22 μ1，μ2 未知，单个总体X~N(μ，σ2)，两个总体X~N(μ1，σ12)，Y~N(μ2，σ22)．第八章假设实验定义： H0：原假设或零假设，为理想结果假设；H1：备择假设，原假设被拒绝后可供选择的假设．第Ⅰ类错误：H0实际为真时，却拒绝H0．第Ⅱ类错误：H0实际为假时，却接受H0．显著性检验：只对犯第第Ⅰ类错误的概率加以控制，而不考虑第Ⅱ类错误的概率的检验． P{当H0为真拒绝H0}≤α，α称为显著水平．拒绝域：取值拒绝H0．临界点：拒绝域边界．双边假设检验：H0：θ=θ0，H1：θ≠θ0．右边检验：H0：θ≤θ0，H1：θ>θ0．左边检验：H0：θ≥θ0，H1：θ<θ0．正态总体均值、方差的检验法(显著性水平为α) 原假设H0 备择假设H1 检验统计量拒绝域 1 σ2已知 μ≤μ0 μ>μ0 z≥zα μ≥μ0 μ<μ0 z≤－zα μ=μ0 μ≠μ0 |z|≥zα/2 2 σ2未知 μ≤μ0 μ>μ0 t≥tα(n－1) μ≥μ0 μ<μ0 t≤－tα(n－1) μ=μ0 μ≠μ0 |t|≥tα/2(n－1) 3 σ1，σ2 已知 μ1－μ2≤δ μ1－μ2>δ z≥zα μ1－μ2≥δ μ1－μ2<δ z≤－zα μ1－μ2=δ μ1－μ2≠δ |z|≥zα/2 4 σ12=σ22 =σ2 未知 μ1－μ2≤δ μ1－μ2>δ t≥tα(n1+n2－2) μ1－μ2≥δ μ1－μ2<δ t≤－tα(n1+n2－2) μ1－μ2=δ μ1－μ2≠δ |t|≥tα/2(n1+n2－2) 5 μ未知 σ2≤σ02 σ2>σ02 χ2≥χα2(n－1) σ2≥σ02 σ2<σ02 χ2≤χ21－α(n－1) σ2=σ02 σ2≠σ02 χ2≥χ2α/2(n－1)或χ2≤χ21－α/2(n－1) 6 μ1，μ2 未知 σ12≤σ22 σ12>σ22 F≥Fα(n1－1，n2－1) σ12≥σ22 σ12<σ22 F≤F1－α(n1－1，n2－1) σ12=σ22 σ12≠σ22 F≥Fα/2(n1－1，n2－1)或 F≤F1－α/2(n1－1，n2－1) 7 成对数据 μD≤0 μD>0 t≥tα(n－1) μD≥0 μD<0 t≤－tα(n－1) μD=0 μD≠0 |t|≥tα－2(n－1) 检验方法选择：主要是逐对比较法（成对数据）跟两个正态总体均值差的检验的区别，如上表即7跟3、4的区别，成对数据指两样本X和Y之间存在一一对应关系，而3和4一般指X和Y相互对立，但针对同一实体．关系：置信区间与假设检验之间的关系：未知参数的置信水平为1－α的置信区间与显著水平为α的接受域相同．定义：施行特征函数(OC函数)：β(θ)=Pθ(接受H0)．功效函数：1－β(θ)．功效：当θ*∈H1时，1－β(θ*)的值．

展开阅读全文