华南农业大学概率统计复习知识点.doc

资源描述

知识点第一章随机事件与概率本章重点：随机事件的概率计算．二、知识要点 1．**事件的关系及运算 (1) 包含：若事件发生，一定导致事件发生，那么，称事件包含事件，记作(或)． (2) 相等：若两事件与相互包含，即且，那么，称事件与相等，记作． (3) 和事件：“事件A与事件B中至少有一个发生”这一事件称为A与B的和事件，记作；“n个事件中至少有一事件发生”这一事件称为的和，记作（简记为）． (4) 积事件：“事件A与事件B同时发生”这一事件称为A与B的积事件，记作(简记为)；“n个事件同时发生”这一事件称为的积事件，记作（简记为或)． (5) 互不相容：若事件A和B不能同时发生，即，那么称事件A与B互不相容(或互斥)，若n个事件中任意两个事件不能同时发生，即(1≤i<j≤几)，那么，称事件互不相容． (6) 对立事件：若事件A和B互不相容、且它们中必有一事件发生，即且，那么，称A与B是对立的．事件A的对立事件(或逆事件)记作． (7) 差事件：若事件A发生且事件B不发生，那么，称这个事件为事件A与B的差事件，记作(或) ．　　(8) 交换律：对任意两个事件Ａ和B有，．　　(9) 结合律：对任意事件A，B，C有，．　　(10) 分配律：对任意事件A，B，C有，． (11) 德摩根（De Morgan）法则：对任意事件A和B有 , . 2．*条件概率与乘法公式设A与B是两个事件．在事件B发生的条件下事件A发生的概率称为条件概率，记作．当，规定 . 在同一条件下，条件概率具有概率的一切性质．乘法公式：对于任意两个事件A与B，当,时，有 . 3．**随机事件的相互独立性如果事件A与B满足，那么，称事件A与B相互独立．关于事件A，B的独立性有下列两条性质： (1) 如果，那么，事件A与B相互独立的充分必要条件是；如果，那么，事件A与B相互独立的充分必要条件是．这条性质的直观意义是“事件A与B发生与否互不影响”． (2) 下列四个命题是等价的： (i) 事件A与B相互独立； (ii) 事件A与相互独立； (iii) 事件与B相互独立； (iv) 事件与相互独立．对于任意n个事件相互独立性定义如下：对任意一个，任意的，若事件总满足，则称事件相互独立．这里实际上包含了个等式． 4．*贝努里概型与二项概率设在每次试验中，随机事件Ａ发生的概率，则在n次重复独立试验中．，事件Ａ恰发生次的概率为，称这组概率为二项概率． 5．**全概率公式与贝叶斯公式全概率公式：如果事件两两互不相容，且，，，则第二章一维随机变量及其概率分布本章重点：一维的分布及其概率计算,边缘分布和独立性计算．知识要点 1．一维随机变量若对于随机试验的样本空间中的每个试验结果，变量都有一个确定的实数值与相对应，即，则称是一个一维随机变量．概率论主要研究随机变量的统计规律，也称这个统计规律为随机变量的分布． 2．**离散型随机变量及其概率函数　　如果随机变量仅可能取有限个或可列无限多个值，则称为离散型随机变量．设离散型随机变量的可能取值为，若，则称离散型随机变量的概率函数，概率函数也可用下列表格形式表示：　３．*概率函数的性质　　 (1)　，　　　 (2)　．　　由已知的概率函数可以算得概率，其中，是实数轴上的一个集合．　４．**常用离散型随机变量的分布　(1)　0—1分布，它的概率函数为，其中，或1，．　(2)　二项分布，它的概率函数为，其中，，．　(3)　泊松分布，它的概率函数为，其中，，． 5．*分布函数随机变量的分布可以用其分布函数来表示，随机变量取值不大于实数的概率称为随机变量的分布函数，记作, 即． 6．分布函数的性质　　(1)　 (２) 是非减函数，即当时，有；　 (3) ; (4) 是右连续函数，即．由已知随机变量的分布函数，可算得落在任意区间内的概率也可以求得． 7．**连续型随机变量及其概率密度　设随机变量的分布函数为，如果存在一个非负函数，使得对于任一实数，有成立，则称X为连续型随机变量，函数称为连续型随机变量的概率密度．　 8．**概率密度及连续型随机变量的性质　　（１）　　（２）；　（３）连续型随机变量的分布函数为是连续函数，且在的连续点处有；　（4）设为连续型随机变量，则对任意一个实数c，；　 (5)　设是连续型随机变量的概率密度，则有　　　　　　＝． 9．**常用的连续型随机变量的分布　(1)　均匀分布，它的概率密度为其中，．　 (2)　指数分布，它的概率密度为其中，．　 (3)　正态分布，它的概率密度为，其中，，当时，称为标准正态分布，它的概率密度为，标准正态分布的分布函数记作，即，当出时，可查表得到；当时，可由下面性质得到．　　　设，则有；． 10、**一维随机变量函数的概率密度设是一个随机变量，是一个已知函数，是随机变量的函数，它也是一个随机变量．对离散型随机变量，下面来求这个新的随机变量的分布．设离散型随机变量的概率函数为则随机变量函数的概率函数可由下表求得　　　　　　但要注意，若的值中有相等的，则应把那些相等的值分别合并，同时把对应的概率相加．设连续型随机变量的概率密度为：法一，随机变量的分布函数为其中，与是相等的随机事件，而是实数轴上的某个集合．随机变量的概率密度可由下式得到：．法二，设连续型随机变量的概率密度为，是单调函数，且具有一阶连续导数，是的反函数，则的概率密度为．特别有下面的结论：设，，且与相互独立，则．第三章二维随机变量及其分布 1．二维随机变量若对于试验的样本空间中的每个试验结果，有序变量都有确定的一对实数值与e相对应，即，，则称为二维随机变量或二维随机向量． 2．联合分布函数二维随机变量的联合分布函数规定为随机变量取值不大于实数的概率，同时随机变量取值不大于实数的概率，并把联合分布函数记为，即． 3．联合分布函数的性质　 (1)　；　 (2)　是变量(固定)或(固定)的非减函数；　 (3) ，　　　　；　　(4)　是变量(固定)或(固定)的右连续函数；　 4．*二维离散型随机变量及联合概率函数　　如果二维随机变量仅可能取有限个或可列无限个值，那么，称为二维离散型随机变量．二维离散型随机变量的分布可用下列联合概率函数来表示：其中，． 5．**二维连续型随机变量及联合概率密度对于二维随机变量(X，Y)的分布函数，如果存在一个二元非负函数，使得对于任意一对实数有成立，则为二维连续型随机变量，为二维连续型随机变量的联合概率密度． 6．二维连续型随机变量及联合概率密度的性质 (1) ； (2) ； (3) 设为二维连续型随机变量，则对任意一条平面曲线，有； ’ (4) 在的连续点处有 ; (5) 设为二维连续型随机变量，则对平面上任一区域有． 7.二维离散型随机变量的边缘概率函数设为二维离散型随机变量，为其联合概率函数（），称概率为随机变量的边缘概率函数，记为并有，称概率为随机变量Y的边缘概率函数，记为，并有=. 8、**二维连续型随机变量的边缘概率密度设为二维连续型随机变量的联合概率密度，则的边缘概率密度为；的边缘概率密度为． 9、常用的二维连续型随机变量 (1)　均匀分布如果在二维平面上某个区域G上服从均匀分布，则它的联合概率密度为 (2) 二维正态分布如果的联合概率密度则称服从二维正态分布，并记为 . 如果，则，，即二维正态分布的边缘分布还是正态分布． 10、**随机变量的相互独立性设为二维离散型随机变量，与相互独立的充分必要条件为如果与的联合分布函数等于的边缘分布函数之积，即，称随机变量与相互独立．　设为二维连续型随机变量，则与相互独立的充分必要条件为如果．那么，与相互独立的充分必要条件是．第四章随机变量的数字特征本章重点：随机变量的期望、方差的计算．知识要点 1．**数学期望设是离散型的随机变量，其概率函数为如果级数绝对收敛，则定义的数学期望为；设为连续型随机变量，其概率密度为，如果广义积分绝对可积，则定义的数学期望为．　 2．*随机变量函数的数学期望　　设为离散型随机变量，其概率函数如果级数绝对收敛，则的函数的数学期望为设为二维离散型随机变量，其联合概率函数如果级数绝对收敛，则的函数的数学期望为；特别地. 设为连续型随机变量，其概率密度为，如果广义积分绝对收敛，则的函数的数学期望为．设为二维连续型随机变量，其联合概率密度为，如果广义积分绝对收敛，则的函数的数学期望为；特别地　　　　　　　　 , . 3．**数学期望的性质 (1) (其中c为常数)； (2) (为常数)； (3) ； (4) 如果与相互独立，则. 4．**方差与标准差随机变量的方差定义为．计算方差常用下列公式： ’ 当为离散型随机变量，其概率函数为如果级数收敛，则的方差为；当为连续型随机变量，其概率密度为，如果广义积分收敛，则的方差为 . 随机变量的标准差定义为方差的算术平方根. 5．**方差的性质 (1) (c是常数)； (2) (为常数)； (3) 如果与独立，则. 6．原点矩与中心矩随机变量的阶原点矩定义为；随机变量的阶中心矩定义为]；随机变量的阶混合原点矩定义为；随机变量的阶混合中心矩定义为．一阶原点矩是数学期望；二阶中心矩是方差D(X)； 7．**常用分布的数字特征　　(1) 当服从二项分布时，．　 (2) 当服从泊松分布时，，　 (3) 当服从区间上均匀分布时，　 (4) 当服从参数为的指数分布时，　 (5) 当服从正态分布时，．第六章数理统计的基本概念本章重点：统计量的概念及其分布。主要内容 1．总体、个体我们把研究对象的全体称为总体(或母体)，把组成总体的每个成员称为个体。在实际问题中，通常研究对象的某个或某几个数值指标，因而常把总体的数值指标称为总体。设x为总体的某个数值指标，常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时，称X的概率函数为总体概率函数。当X为连续型随机变量时，称X的密度函数为总体密度函数。当 X服从正态分布时，称总体X为正态总体。正态总体有以下三种类型： (1)未知，但已知； (2)未知，但已知； (3)和均未知。 2．简单随机样本数理统计方法实质上是由局部来推断整体的方法，即通过一些个体的特征来推断总体的特征。要作统计推断，首先要依照一定的规则抽取n个个体，然后对这些个体进行测试或观察得到一组数据，这一过程称为抽样。由于抽样前无法知道得到的数据值，因而站在抽样前的立场上，设有可能得到的值为，n维随机向量()称为样本。n称为样本容量。 (）称为样本观测值。如果样本()满足（1）相互独立； (2) 服从相同的分布，即总体分布；则称()为简单随机样本。简称样本。设总体X的概率函数(密度函数)为，则样本（ )的联合概率函数(联合密度函数为) 3. 统计量完全由样本确定的量，是样本的函数。即：设是来自总体X的一个样本，是一个n元函数，如果中不含任何总体的未知参数，则称为一个统计量，经过抽样后得到一组样本观测值，则称为统计量观测值或统计量值。 4. **常用统计量（1）样本均值：（2）样本方差： 5. **三个重要分布（1）分布设为独立标准正态变量，称随机变量的分布为自由度为n的分布，记为。称满足：的点为分布的分位点。（2）t分布设随机变量X与Y独立，，则称的分布为自由度n的t分布，记为。称满足：的点为t分布的分位点。（3）F分布设随机变量U与V相互独立，，则称的分布为自由度的F分布，记为。称满足：的点为F分布的分位点，且有 6. **正态总体的抽样分布统计量的分布称为抽样分布，设是来自正态总体的一个简单随机样本，与分别为样本的均值和样本方差，则有（1）；（2）与相互独立；（3）学习要点: 统计学的核心问题是由样本推断总体，因此理解统计量的概念非常重要。它是样本的函数，统计量的选择和运用在统计推断中占据核心地位。样本均值、样本方差以及其他样本矩都是一些常用的统计量，必须熟悉它们的计算方法及其有关性质。统计量的分布称为抽样分布，其中分布、t分布、F分布是本章的重点，必须熟悉它们的定义、性质及其上分位点的查表方法；正态总体抽样分布是统计学中最重要的一个理论结果，必须弄清它的条件及结论，并能运用判断一些常用统计量的分布。第七章参数估计本章重点：未知参数的矩估计、极大似然估计及正态总体未知参数的区间估计。主要内容 1. **点估计方法设是来自总体X的样本，是总体的未知参数，若用一个统计量来估计，则称为参数的估计量，在抽样后，称为参数的估计值。这种估计称为点估计。矩估计和最大似然估计是两种常用的点估计法。（1）**矩估计法用样本的各阶原点矩去估计对应的各阶总体的原点矩，这就是矩估计的基本方法。 \ （2）**最大似然估计法设总体X的密度函数（其中为未知参数），已知为总体X的样本的观察值，则求的最大似然估计值的步骤如下： ① 写出似然函数 ② 似然函数取对数 (3)建立并求似然方程 (4)最大似然估计值可以由解对数似然方程得到。 2. 点估计的优良性评判准则（1）无偏性设是的一个估计量，若，对每一成立则称是的一个无偏估计。（2）有效性设是的两个无偏估计，如对每一，有且至少对某个使之成立严格不等式，则称比有效。称在所有的无偏估计中，方差最小的那一个为一致最小方差无偏估计。 3. **单正态总体下的置信区间设是取自正态总体的一个样本，置信水平为，样本均值，样本方差。（1）均值的置信区间若已知，取，故的双侧置信区间为：若未知，取，故的双侧置信区间为：（2）方差的置信区间若已知，取，故的双侧置信区间为：若未知，取，故的双侧置信区间为： 1．正态总体的均值、方差的区间估计单个子样待估参数置信区间备注 [,] 已知 [,] 未知已知未知第八章假设检验本章重点：单个正态总体的参数的假设检验。内容提要 1．假设检验的基本概念假设检验是基于样本判定一个关于总体分布的理论假设是否成立的统计方法。方法的基本思想是当观察到的数据差异达到一定程度时，就会反映与总体理论假设的真实差异，从而拒绝理论假设。原假设与备选假设是总体分布所处的两种状态的刻画，一般都是根据实际问题的需要以及相关的专业理论知识提出来的。通常，备选假设的设定反映了收集数据的目的。检验统计量是统计检验的重要工具，其功能在用之于构造观察数据与期望数之间的差异程度。要求在原假设下分布是完全已知的或可以计算的。检验的名称是由使用什么统计量来命名的。否定论证是假设检验的重要推理方法，其要旨在：先假定原假设成立，如果导致观察数据的表现与此假定矛盾，则否定原假设。通常使用的一个准则是小概率事件的实际推断原理。 2．两类错误概率。第一类错误概率即原假设成立，而错误地加以拒绝的概率；第二类错误概率即原假设不成立，而错误地接受它的概率。 3．显著水平检验。在收集数据之前假定一个准则，即文献上称之为拒绝域，一旦样本观察值落入拒绝域就拒绝原假设。若在原假设成立条件下，样本落入拒绝域的概率不超过事先设定的，则称该拒绝域所代表的检验为显著水平的检验，而称为显著水平。由定义可知，所谓显著水平检验就是控制第一类错误概率的检验。 4．**单正态总体均值和方差的检验(U检验,T检验和卡方检验) 我们以单正态总体均值检验为例，即假定总体。 U检验: (1) 列出问题，即明确原假设和备选假设。先设已知，检验其中已知。 (2) 基于的估计，提出检验统计量 (3) 对给定水平，构造水平检验的拒绝域其中为标准正态分布的双侧分位点。 (4) 基于数据，算出的观察值，如则拒绝，否则只能接受. 因此检验使用统计量U，称之为U-检验。注意:单边检验的区别 H0：m=m0；H1：m>m0 构造水平检验的拒绝域单侧分位数 H0：m=m0；H1：m<m0 构造水平检验的拒绝域单侧分位数 T-检验。当未知时，改检验统计量U为T统计量 (1) 列出问题，即明确原假设和备选假设。先设未知，检验其中未知。 (2) 基于的估计，提出检验统计量 (3) 对给定水平，构造水平检验的拒绝域其中为标准正态分布的双侧分位点。 (4) 基于数据，算出的观察值，如则拒绝，否则只能接受. 因此检验使用统计量T，称之为T-检验。注意:单边检验的区别 H0：m=m0；H1：m>m0 构造水平检验的拒绝域单侧分位数 H0：m=m0；H1：m<m0 构造水平检验的拒绝域单侧分位数 c2检验。当m未知时，单正态总体方差的检验 (1) 列出问题，即明确原假设和备选假设。先设m未知，检验其中m未知。 (2) 基于的估计，提出检验统计量 (3) 对给定水平，构造水平检验的拒绝域其中为标准正态分布的双侧分位点。 (4) 基于数据，算出的观察值，如则拒绝，否则只能接受. 因此检验使用统计量c2，称之为c2-检验。 28 / 28

展开阅读全文