资源描述
第5章 随机试验和随机变量
教学目的与要求:通过本章教学,使学生理解什么是随机试验以及由它所定义的随机变量,并了解统计学的重要任务之一便是把数据看作随机变量(或称之为无限总体)的样本去推断它的这种或那种特征。作为后续章中所介绍的统计推断方法所必需的预备知识,学生通过本章的学习还应了解与随机试验和随机变量有关的属于概率论范畴的若干基本概念。
重点内容与难点:
1.随机试验及事件、概率等基本概念
2.随机变量的概念: 离散型随机变量的分布列和连续性随机变量分布的图示
3.数学期望和方差的定义及数学性质
§5.1 随机试验
一、 随机现象
1.概念:在给定的条件下不能确切预见其结果的现象叫作随机现象。
2.随机现象的产生:因大量的偶然因素存在且无法控制,使现象的结果不能确定和不能完全预见的。于是,现象的随机性便产生了。
3.随机现象有一定规律性的。在给定条件下在规律值附近的数值发生的可能性较大,离规律值越近则发生的可能性越大,离规律值越远则发生的可能性越小。统计学就是要通过对随机现象的有限次的观察结果去探寻它的各种统计规律。
二、 随机试验
1.概念:对随机现象的观测称作随机试验。
2.种类:随机试验有可重复随机试验和不可重复随机试验两种。前者是指可以在相同条件下重复进行的随机试验;后者是指不能在相同条件下重复进行的随机试验。
要注意,随机现象或随机试验的概念都是同给定的一组条件联系在一起的。给定的一组条件发生了改变,就变成了另外的随机现象和另外的随机试验。
三、 事件
(一)事件的种类
1. 概念:随机试验的每一种结果或随机现象的每一种表现称作随机事件,简称为事件。
2. 种类:一个事件如果不能再被分解为两个或两个以上事件,称作基本事件。
基本事件是试验的最基本结果:每次试验必出现一个基本事件,任何两个基本事件都不会同时出现。由两个或两个以上基本事件所组成的事件称做复合事件。
一项随机试验的所有基本事件的集合,称作该随机试验的基本事件空间。
必然事件是每次试验都一定出现的事件,记作。任何一次试验都不可能出现的事件称为不可能事件,记作Ø。
(二)事件的关系和运算
(四)概率
(一)什么是概率
用0与1之间的数值来表明事件A在随机实验中出现的可能性大小,通常记作P(A)。这样的数值叫作事件A的概率。对于概率,通常可有两种解释:(1)某个系统的一种内在特性,这个特性不依赖于我们对该系统的知识;(2)对某一陈述相信程度的度量。
事件A的频率为
(5.1)
当试验次数n较小时,频率的数值有较大的波动;当n充分大时,频率数值的波动明显减弱,并且随着n的增大,频率会趋于稳定在某个常数p附近。我们便说频率Pn(A)的这个稳定值p是 事件A的概率。即:
(5.2)
按照对概率的这种解释,当然只能在可重复随机试验的范围内讨论问题。
概率作为对某一陈述相信程度的度量,叫作主观概率。
(一) 可以直接计算概率的两种场合
有两种可以直接计算概率的场合。一种叫作古典型概率,另一种叫作几何型概率。
1.古典型概率
如果一项随机试验的全部基本事件总数是有限的,并且各个基本事件出现的可能性都相同,事件A由若干基本事件所组成,则A的概率可用下式计算
(5.3)
式中分子亦称作有利于事件A的基本事件个数。
2.几何型概率
如果随机试验可模拟为向区域Ω上随机投点。并且(1)这个区域有明确界限,可以作长度、面积、体积的几何度量。(2)随机点落在这个区域任何一点上的可能性都相同,也就是说,对于Ω中的某一区域g,随机点落在g内的概率与g的几何度量成正比,同它的形状以及在Ω中的位置无关。对于这种随机试验,如果以A表示{随机点落在区域g中}这一事件,则其概率可用下式计算
(5.4)
事件A的概率记作P(A),则不论P(A)是某个系统的内在特性,还是对某一陈述的相信程度,它都应该具有下面的性质:
性质1:非负性,即0≤P(A)≤1
性质2:规范性,即,对于必然事件Ω,有P(Ω)=1;
性质3:对于随机事件Ai(i=1,2,…),只要它们两两互不相容,则有
(三)概率的加法规则
1.任意事件的加法规则
任意两个事件和(并)的概率,等于二事件概率的和再减去二事件同时发生的概率。即
(5.5)
在三个事件,有
(5.6)
2.不相容事件的加法规则
两个不相容事件与的和(并)的概率,等于二事件概率的和。即
(5.7)
(四)条件概率和乘法公式
在实际问题中,除了要知道事件发生概率外,有时还需要知道在“事件已发生”的条件下,事件发生的概率,这种概率称为条件概率,记作
(五)全概率公式
有时事件比较复杂,直接求它的概率有一定困难。如果我们可以把事件分解成互不相容的一些简单事件,而这些简单事件的概率却比较容易求出,那么,我们就可以用全概率公式去计算事件的概率。
全概率公式可表述如下:
设为个互不相容事件,且则任一事件的概率为
(5.8)
(六)贝叶斯公式
设为个互不相容的事件,且是任一事件,且则对任一,有
(5.9)
这就是贝叶斯公式。
(七)事件的独立性
对于两个事件和,假若事件的发生会对事件发生的概率产生影响,即,称事件与之间统计相依。假若事件的发生并不影响事件发生的概率,称事件与之间统计独立。在与独立时显然有,这时,乘法公式式成为
把这个关系式作为事件独立性的定义,即设与是任意两个事件,如果满足
(5.10)
则称事件与独立,否则称与相依。在实际应用中,如果两个事件相互间没有影响,则可以认为这两个事件相互独立。
应该指出,两个事件相互独立与互不相容是两个不同的概念。独立性是指两个事件的发生互不影响,互不相容是指两个事件不能同时发生。两个不相容事件相依,两个独立事件一定相容(除非其中有一个事件的概率为0)。
§5.2 随机变量及其分布
一、随机变量的概念
(一 )什么是随机变量
在随机试验中被测量的量。在一组给定的条件下,这种变量取何值事先不能确定,它的取值只能由随机试验的结果来定,并且随试验的结果而变。
(二)随机变量的种类
一般地,如果随机变量的全体可能取值包括有限个可能结果,或者是一个无限的整数序列,这样的随机变量称作离散型随机变量。
如果随机变量的全体可能取值为实数轴上的某一区间,这样的随机变量称作连续型随机变量。
二、随机变量的分布
(一) 随机变量分布的概念
1.离散型随机变量的分布
离散型随机变量X的每一个可能的取值Xi和随机变量取该值的概率p(xi)之间所确立确立对应关系称作这个离散型随机变量的分布。
P(xi)(i=1,2,3,…)称作随机变量X的概率分布或概率函数。
它满足下面的关系:p(xi)≥0和。对于离散型随机变量,分布列全面地描述了它的分布。
根据分布列,还可以同时作出分布棒图。
2.连续型随机变量的分布
连续型随机变量X的一系列取值区间和随机变量在该区间取值的概率之间确立的对应关系,称作这个连续型随机变量的分布。
连续型随机变量的分布可以用密度函数来描述,随机变量的密度函数记作。随机变量在某一数值区间内取值的概率等于竖立在该区间上的,以密度曲线为上底的曲边梯形的面积。写作
(5.11)
密度函数满足下面两个基本性质:(1)密度函数的函数值不会是负数,从图形看,密度曲线在横轴上方,以横轴为渐近线;(2)在整个实数轴上的密度函数值的和等于1。这两个性质用密度函数式写作
, (5.12)
三、常见的几种分布规律
在理论研究和实际应用中,人们掌握了某些种类随机试验的概率分布模型。对于这种随机试验定义的统计总体,我们说它具有已知的分布。
1.两点分布(0-1分布)。
2.二项分布
3.超几何分布
4.泊松分布
5.均匀分布
如果随机变量的可能取值充满一个区间[,],且落在[,]中任意等长度的子区间内的概率相等,或者说落在子区间内的概率与子区间的长度成正比,与子区间的具体位置无关。
6.正态分布。
令随机变量X是在一个随机试验中被测量的结果,并且,决定这项试验结果的是大量偶然因素作用的总和,每个因素的单独作用相对均匀地小,那么,X的分布就近似于正态分布。它有两个参数:和σ2。实际上是X的数学期望E(X),σ2实际上是X的方差V(X)。
正态分布的概率密度曲线可以用已知的数学解析式表达出来,它是一种已知的分布。
为了方便,人们编制了“正态密度曲线下的面积”表(见附录1表2)。这个表是就标准正态变量情形编制的,因此,查表时要把一般正态变量转化成标准正态变量。
标准正态变量是= 0,σ2=1的正态变量,通常记作N(0,1)。为了和一般正态变量有所区别,我们这里用大写字母Z来表示标准正态变量,用小写字母z表示它的取值。
p(z)
z
0 z1 z2
把随机变量与它的数学期望相减之差除以该随机变量的标准差(方差的平方根),称作随机变量的标准化。把区间的两个端点作如下标准化变换:
得到图中相应的区间(z1,z2),据此来查表。
7.分布
这是v个相互独立的标准正态变量的平方和构成的随机变量所遵循的分布规律。这个分布的概率密度函数的表达式这里略去不作介绍,概率密度函数的图形如图。图中表示了一族曲线,其形态随v值的不同而改变。v是构成变量的标准正态变量个数,称作变量的自由度。今后,对变量的分布规律,总要说明它的自由度,记作(v)。
8.F–分布。
这是两个相互独立的变量(分别除以各自自由度之后)相除构成的随机变量所遵循的分布规律。即,设X和Y是相互独立的服从分布的随机变量,自由度分别为f 1,f 2,则称随机变量
所遵循的分布规律为 F–分布,记作F(f1,f2)。f1称作F–分布的第一自由度(分子自由度),f2称作F–分布的第二自由度(分母自由度)。
9.t–分布。
这是相互独立的一个标准正态变量与一个变量(除以它自己的自由度后)的平方根相除构成的随机变量所遵循的分布规律。即,设X是标准正态变量,Y是自由度为v的变量,且X和Y相互独立,则称随机变量
所遵循的分布规律为t–分布。v称为它的自由度,记作t (v)。
四、随机变量分布的特征数
(一)位置特征数
随机变量分布的位置特征数,有数学期望、中位数、众数,等等。我们只介绍数学期望。
1.随机变量X的数学期望:X的一切可能值以相应的概率为权数的加权算术平均数。。今后我们把X的数学期望记作E(X)。
E(X)= (5.13)
若是连续型随机变量,其概率密度函数为,则的数学期望定义为
(5.14)
式中的定积分应绝对收敛。
(二)离散特征数
离散特征又叫“散布特征”、“离中趋势”。
随机变量的离散特征,是指随机变量取值的不均匀状况。随机变量的离散特征数是对随机变量离散特征的数值度量。包括:方差、标准差、变异系数。
§5.3 随机变量与样本
如果随机变量是在某个可以在不变条件下重复进行的随机试验中被观测的量。我们想要知道的分布。
进行的有限次的试验(观测)叫作的样本。相对于样本而言,在统计学中把随机变量叫作总体(统计总体)。
71
展开阅读全文