资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章,二项分布,与,Poisson,分布,离散型随机变量概率分布,:,二项分布,、累积,二项分布,、超几何分布、负,二项分布,和泊松分布。最常用的概率分布,即,二,项分布,和,泊松分布,二项分布与,Poisson,分布及其,应用,三种重要分布:正态分布,二项分布,Poisson,分布,二 项 分 布,定义:在,n,次独立实验中,每次有两个对立的结果,(,如阳性或阴性,生存或死亡),其中某种阳性或阴性发生数,X,所服从的概率分布称为二项分布,(binomial,distrbution,),。,成,败型试验,:成功次数的概率分布呈二项分布,.,故,构成,Bernoulli Test,序列中的,n,次试验中,事件,A,出现的次数的概率分布为:,P(X=k)=(,k,n,),k,(1-,),n-k,其中,k=0,,,1,,,,,n,。,上式是二项式,+,(,1-,),n,展开式的各,项,所以此分布为二项分布。,n、,是二个参数。,若一个随机变量,X,其取值是0,1,,n。,则相应取值概率为:,P(X=k)=(,k,n,),k,(1-,),n-k,所以,,X,服从以,n、,为参数的,二项,分布。记为:,XB(,n、,).,二项分布的均数与方差,若,XB(,n、,),,则,X,的均数,x,=,n,X,的方差,2,x,=,n,(1-,),X,的标准差,x,=,n,(1-,),例:已知,=0.6 3,只鼠中死亡鼠数,X,的,总体均数,x,=,n,=3,0.6=1.8(,只,),总体方差,2,x,=,n,(1-,)=,3,0.6(1-0.6)=0.72(,只,),总体标准差,x,=,n,(1-,),=,3,0.6(1-0.6),=,0.72=0.85(,只,),条件:,(1),总体中各观察单位具有互相对立的一种结果,(,“,成功”或“失败”,),(2),已知发生某一结果的概率为,,,则对立结果的概率为,1-,。,出现“成功”的概率,p,对每一次试验是相同的,“失败”的概率,q,也不变,且,p+q,l,。,(3),n,个观察单位的观察结果相互独立,即每个观察单位结果不会影响其他观察单位的结果,例题,例:用淋菌培养方法,检查患者是否患有淋病。对于淋病患者,若用该方法检查一次的检出率为,0.8,,问:,1),重复检查,3,次,检查结果均为阴性的概率是多少?,P=(1-0.8),3,=0.008,2),重复检查,3,次,检查结果中最少是阳性的概率是多少?,P=1-(1-0.8),3,=0.992,3),检查,4,个患者,每人检查一次,第一个患者和第二个患者为阳性且其他均为阴性的概率是多少?,P=0.8,2,0.2,2,=0.0256,如果研究背景满足下列条件,:,1),每次试验的可能结果,(Outcome),仅为两种,(,视为成功或失败,在上例中阳性或阴性,),。,2),定义试验中其中一个可能的结果成功,另一种可能的结果为失败,(,在上例中把检查结果为阳性可视为成功,检查结果为阴性为失败,),。,3),每次试验的条件相同。每次试验成功的概率为,,,失败的概率为,1-(,在上例中把检出阳性的概率,为,0.8,,检查阴性的概率,1-,为,=0.2),4),试验次数为,n(,上例中,n=4),。,则在,n,次试验中,有,X,次成功的概率,(,在上例,中,,4,个患者检查,即,:n=4;,有,x,个患者为阳性的,),为:,并记为,X,B(n,),二项分布图形,平均发生率,P,的均数和标准差,:,平均发生率对应的总体均数为,标准误为,对应的样本标准误为,例:某医院治疗了,50,个,HP,的患者,,35,个患者转阴,请计算样本转阴率和样本标准误,(,把治疗一个,HP,患者视为一次试验,治疗,50,个患者,视为,50,次试验,把患者通过治疗后转阴的结果视为试验成功,),。,转阴率,转阴率的标准误,二项分布的应用,一、总体率可信区间估计,:,1,、大样本时,,二项分布的总体发生率,的,95%,可信区间(设,X,服从二项分布,B(n,),,,n,5,以及,n(1-,)5,,当,n,充分大时,),则,的,95,可信区间,(95%CI),为,例:调查了,1000,名男性,检查出,10,名男性是色盲的,试求色盲患病率的,95,可信区间。,色盲样本患病率,,,n=1000,。,因此,nP,与,n(1-P),均大于,5,以及,n,也充分大,所以,95,CI,为:,(0.01-1.96,0.003146,,,0.01+1.96,0.003146)=(0.003834,,,0.016166),2,、样本量较小时,,计算比较复杂,因此建议查本书,附表,6,(P709),例:治疗,25,个,HP,患者,,12,个患者转阴,求转阴率的,95,可信区间,:,解:,n=25,,,X,12,,,查附表,6,,,95%CI=(0.28,,,0.69),例:某医院抢救,20,个,AMI,患者,,14,个抢救成功,求抢救成功率的,95%CI,。,解:由于,X,仅列出,n/2,的可信区间,不能直接查表求,95,CI,。,本例,n=20,,,6,个抢救未成功,,故可查未成功率,1-,的,95%CI,为:,0.121-,-1-0.54,,所以,0.88=1-0.12,1-0.54=0.46,,即:,95,CI,为,(0.46,,,0.88),。,二、,分类资料的假设检验,1,、,样本率与总体率的比较,总体率(,0,),一般为标准值,(,或经过大量观察所得到的稳定值,),,比较目的,是推断实验所得某个样本率所代表的总体率,是否是来自,0,总体的一个样本。,(,即检验假设为,H,0,:,=,0,是否成立,),1,),X,服从二项分布,总体发生率为,,并且,且 ,且,n40,,则,例:用传统的治疗方案治疗,HP,患者的治愈率为,0.8,。某研究用一种新的治疗方案治疗了,100,个,HP,患者,治愈了,90,个,问:用新的治疗方案的治愈率是否高于传统的治疗方案?,H,0,:,新的治疗方案的总体治愈率,=0.8,;,H,1,:,0.8,=0.05,(,单侧),且 且,n=10040,,,故可用正态分布进行近似。,U U,0.05,=1.64,差别有统计意义,,,P0.05,结论:新的治疗方案的治愈率高于传统治疗方案的治愈率,差别有统计意义,,P50,时,可以用近似正态的方法计算可信区间,:,Poisson,分布的样本均数与总体均数的比较,1,、直接计算,P,值,已知在培养液中,每毫升平均有,3,个细菌数,今采集放在,5,。,C,冰箱中的,1,毫升培养液测得细菌数,5,个,能否说培养液中细菌数有增长?,H,0,:,3/ml,vs,H,1,:,3/ml,样本值,X,5,,,对应的概率,P(X,5),值,=1,-,P(4),-,P(3),-,P(2),-,P(1),-,P(0)=,1,-,0.1494-0.2240-0.2240-0.1680-0.0498 =,0.18470.05,2,、,正态近似法:,当,0,20,时,,H,0,成立时,服从标准正态分布,例:已知人群的肝癌的患病率为,0.03%,,调查了,10,万个饮用灌溉沟水的人,共有,50,人患肝癌,问:饮用灌溉沟水的人的肝癌患病率是否高于,0.03%,?,0,=n,0,=1000000.0003=3020,H,0,:,=30,vs,H,1,:,30,=0.05,(,单),1.65,,故可以认为:饮用灌溉沟水的人肝癌患病率高于一般。,Poisson,分布的两个样本均数比较的,U,检验,若两个样本均数,X,1,和,X,2,均大于,20,观察单位相等的情况下:,观察动物不相等的情况下,用除法将化大单位为小单位,例:调查,100000,个饮用灌溉沟水的人,患肝癌,50,人,调查,150000,个饮用河水的人,患肝癌,65,人,问饮用河水与饮用灌溉沟水的人的肝癌患病率是否不同。,因为单位不同,故选用,5000,人为单位,因此,n,1,=2,,,n,2,=3,,,即:样本均数均大于,20,,可以正态近似进行检验:,Thank You,
展开阅读全文