1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,第四军医大学卫生统计学教研室,*,Click to edit Master title style,Click to edit Master text styles,Second Level,
2、Third Level,Fourth Level,Fifth Level,*,第四章随机变量、概率和概率分布,第1页,第1页,本章内容,第一节 概率相关概念,第二节 随机变量及其概率分布概述,第三节 惯用概率分布,二项分布、泊松分布、,正态分布,第四节 惯用抽样分布,卡方分布、,t,分布、,F,分布,第2页,第2页,第一节 概率相关概念,第3页,第3页,样本实际发生率,称为,频率,。设在相同条件下,独立重复进行,n,次试验,事件A出现,f,次,则事件A出现频率为,f,/,n,。,概率,:,随机事件发生也许性大小,,用大写,P,表示;取值,0,1,。,一、频率与概率 frequency and
3、probability,第4页,第4页,必定事件,P,=1,随机事件 0,P,1,不也许事件,P,=0,P,0.05(5)或,P,0.01(1),称为,小概率事件,(习惯),统计学上认为不大也许发生。,二、随机事件,Random events,Certain,Impossible,0.5,0,1,样本空间(sampling space):,随机试验所有也许结果称为样本空间。,第5页,第5页,频率与概率间关系:,1.样本频率总是围绕概率上下波动,2.样本含量,n,越大,波动幅度越小,频率越靠近概率。,第6页,第6页,第二节 随机变量及其概率分布概述,第7页,第7页,一、随机变量,每次抛两个硬币,
4、统计正、反面结果;结果可统计为:,硬币1正面朝上,硬币2正面朝上;2个正面,硬币1正面朝上,硬币2反面朝上;1个正面,硬币1反面朝上,硬币2正面朝上;1个正面,硬币1反面朝上,硬币2反面朝上 0个正面,正面数就是一个随机变量,记为,x,,我们通常对,x,每个取值概率感兴趣。,对于本例,,x,取值为0、1、2。,第8页,第8页,二、离散型随机变量与连续型随机变量,离散型随机变量,(discrete random variable):数据间有缝隙,其,取值能够列举,。,比如抛硬币10次,正面也许取值,x,为0、1、2、3、4、5、6、7、8、9、10,连续型随机变量,(continous rand
5、om variable)数据间无缝隙,其,取值充斥整个区间,无法一一列举,每一也许值,比如,身高、体重、血清胆固醇含量,第9页,第9页,三、概率分布(probability distribution),概率分布,:描述随机变量值,x,i,及这些值相应概率,P,(,X,=,x,i,)表格、公式或图形。,离散型随机变量,概率分布,连续型随机变量,概率分布,第10页,第10页,1.离散,型随机变量概率分布,第11页,第11页,离散,型随机变量概率分布举例,第12页,第12页,2.连续,型随机变量概率分布,变量取值,充斥整个数值区间,,无法一一列出其每一个也许值。,普通将连续型随机变量整理成频数表,对
6、频数作,直方图,,直方图每个矩形顶端连接阶梯形曲线来描述连续型变量频数分布。,第13页,第13页,第14页,第14页,假如样本量很大,组段诸多,矩形顶端构成,阶梯型曲线,可变成,光滑分布曲线,。大多数情况下,可采用一个函数拟合这一光滑曲线。这种函数称为,概率密度函数,(probability density function),第15页,第15页,假如连续型随机变量,X,概率,密度函数,记为:,则在区间,x,1,x,2,范围内概率可由微积分函数定义,第16页,第16页,第三节 惯用概率分布,离散型随机变量分布一、二项分布二、泊松分布连续型随机变量分布,三、正态分布,第17页,第17页,一、二项
7、分布,毒性试验:白鼠 死亡生存,临床试验:病人 治愈未愈,临床化验:血清 阳性阴性,事件 成功(A)失败(非A),这类“成功失败型”试验称为Bernoulli试验。,第18页,第18页,Bernoulli,试验序列,n,次Bernoulli试验构成了Bernoulli试验序列。,其特点(如抛硬币)下列:,(1)每次试验结果,只能是两个,互斥,结果之一(A或非A)。,(2)每次试验,条件不变,。即每次试验中,结果A发生概率不变,均为,。,(3)各次试验,独立,。即一次试验出现什么样结果与前面已出现结果无关。,第19页,第19页,成功次数概率分布二项分布,例 设某毒理试验采用白鼠共3只,它们有相同
8、死亡概率,,相应不死亡概率为1,。记试验后白鼠死亡例数为,X,,分别求,X,0、1、2和3概率,第20页,第20页,第21页,第21页,第22页,第22页,二项分布概率计算,=BINOMDIST(1,3,0.4,0),=CRITBINOM(3,0.4,0.217),第23页,第23页,二项分布性质,第24页,第24页,第25页,第25页,第26页,第26页,第27页,第27页,第28页,第28页,(二)样本率与总体率比较,二项分布应用,第29页,第29页,第30页,第30页,二、泊松分布,当二项分布中,n,很大,,很小时,二项分布就变成为Poisson分布,因此Poisson分布事实上是二项分
9、布极限分布。,由二项分布概率函数可得到泊松分布概率函数为:,第31页,第31页,在,m,处概率最大,第32页,第32页,在,m,处概率最大,第33页,第33页,Poisson分布主要用于描述在单位时间(空间)中稀有事件发生数,比如:,1.放射性物质在单位时间内放射次数;,2.在单位容积充足摇匀水中细菌数;,3.野外单位空间中某种昆虫数等。,第34页,第34页,Poisson分布概率计算,第35页,第35页,Poisson分布性质(1),一、Poisson分布均数与方差相等,即,2,=,m,二、Poisson分布可加性,第36页,第36页,第五节 Poisson分布性质(2),三、,Poisson分布正态近似,m,相称大(,20,)时,近似服从正态分布:,N,(,m,m,),四,、二项分布Poisson分布近似,第37页,第37页,第38页,第38页,