1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 几种常见的概率分布律,离散型变量,连续型变量,二项分布,泊松分布,超几何分布,负二项分布,指数分布,正态分布,第一节 二项分布,(,Binomial Distribution,),1.,贝努利试验和在什么情形下应用二项分布,贝努利,试验,(,Bernoulli trial,):试验只有两种可能的结果,并且发生每种结果的概率是一定的。,例如:抛一枚硬币,看得到正面还是反面;,掷一次骰子,看得到,6,还是没有得到,6
2、随机抽查一名婴儿的性别,看是男是女,在贝努利试验里,两种结果可分别称为,“成功”和“失败”,,或者“事件,A,发生”和“事件,A,没有发生”。,什么情形时应用二项分布,:,实验中进行了,n,次独立的贝努利试验,,统计在这,n,次试验中总共获得了多少次“成功”。“成功”的次数,记为变量,Y,;,Y,称为二项分布变量,,Y,的概率分布称为二项分布。,(,1,)连续抛硬币,100,次,统计总共出现正面的次数。次数,Y,服从二项分布。,Y,的可能取值为,0,,,1,,,2,,,,,n,。所以,Y,是个离散型变量。,二项分布变量的一些例子:,(,2,)调查,250,名新生婴儿的性别,记男婴的总数为
3、Y,,则,Y,服从二项分布。,(,3,)调查,n,枚种蛋的出雏数,出雏数,Y,服从二项分布。,(,4,),n,头病畜治疗后的治愈数,Y,,,Y,服从二项分布。,(,5,),n,尾鱼苗的成活数,Y,,,Y,服从二项分布。,2.,二项分布的常用符号,3.,二项分布的概率函数,P(y,),怎样得到,P(y,)?,以,n,4,,,y,2,为例,欲求,P(y,2,),?,。,每种方式发生的概率为:,其它,5,种方式发生的概率也是如此。,例一,,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为,3,:,1,。求窝产仔,10,头,有,7,头白猪的概率。,所以,窝产仔,10,头,有,7
4、头白猪的概率是,0.2503,。,例二,,有一批玉米种子,出苗率为,0.67,。现任取,6,粒种子种,1,穴中,问这穴至少有,1,粒种子出苗的概率是多少?,这说明每穴种,6,粒种子,几乎肯定出苗。,4,二项分布的概率分布表和概率分布图,除以,P(y,),表示,二项分布也可通过表或图来直观显示。,Y,P(y,),0,0.062,1,0.250,2,0.375,3,0.250,4,0.062,例如,抛硬币,4,次,获得的正面数记为,Y,,则,Y,服从二项分布。,Y,的概率分布表为,Y,的概率分布图为,注意:,5,二项分布变量的平均数和标准差,平均数,方差和标准差,例三,,某树种幼苗成材率为,70
5、现种植,2000,株,问成材幼苗数的平均值和标准差是多少?,二项分布,(实例),【,例,】,已知,100,件产品中有,5,件次品,现从中任取一件,有放回地抽取,3,次。求在所抽取的,3,件产品中恰好有,2,件次品的概率,解:,设,Y,为所抽取的,3,件产品中的次品数,则根据二项分布公式有,二项分布的程序计算方法,二项分布函数,Binomdist,(,k,n,p,false,/true,),某数阶乘的计算函数,Fact,从给定元素数目,m,的集合中抽取若干,n,元素的排列组合数 计算函数,Combin,(,m,,,n,),第二节 泊松分布,(,Poisson Distribution,),1
6、在什么情形下应用泊松分布,泊松分布是一种用来描述,一定的空间或时间里稀有事件发生次数,的概率分布。,服从泊松分布的变量的一些例子:,一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。,畜群中遗传的畸形怪胎数,单位空间内某些野生动物或昆虫数,每升饮水中的大肠杆菌数,2.,泊松分布的概率函数与特征数,泊松分布变量,Y,只取零和正整数:,0,1,2,,其概率函数为,泊松分布的平均数,泊松分布的方差和标准差,例一,,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到,3,个微粒,问在一次观察中看到,3,个微粒的概率是多大?少于,3,个微粒的概率是多少?若观察,100,张片子
7、大约有多少张片子看到的微粒数少于,3,个?,程序计算,Poisson,(,y,true,or false,),超几何分布,适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中,不重复抽样,,抽样成功的次数,Y,的概率分布服从超几何分布,如福利彩票,数学期望与方差,计算程序:,P,(,Y,),=,hypgeomdist,(,y,,,n,,,M,,,N,),例子,四川卧龙大熊猫自然保护区共有野生大熊猫,100,只,其中,10,只做了标记。某小组去调查研究大熊猫的生活习性,随机观察了,15,只大熊猫,问这,15,只大熊猫中有,5,只做了标记的概率?,解:依题意有,N=100,,,M=10
8、n=15,,,y=5,,求,p,(,5,),p,(,5,),=,hypgeomdist,(,y,,,n,,,M,,,N,),=,hypgeomdist,(,5,,,15,,,10,,,100,),=0.00569,第三节 正态分布,(,Normal Distribution,),正态分布是一种最重要的连续型变量的概率分布。,在生物科学研究里,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等;,许多统计分析方法是以正态分布为基础的。,不少随机变量的概率分布在样本容量增大时趋于正态分布。,因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。,1
9、正态分布的定义与主要特征,定义:若变量,Y,的概率分布的密度函数为,f(y,)的曲线为,Y,的分布函数,没有更简化的形式,正态分布曲线的主要特征:,(,1,)曲线是单峰、对称的“悬钟”形曲线,对称轴是,x=,(,2,)曲线是非负函数,以,x,轴为渐近线,分布从,到,(,3,)曲线在,x=,处各有一个拐点,即在,-,+,范围内是上凸,其余是下凸。,(,4,)曲线有两个参数:,和,。,代表平均数,,代表标准差,,和,一起决定曲线的位置和形状。,越大,则曲线沿,x,轴越向右移动;反之向左。,是变异度参数,,愈大则曲线愈“胖”;反之则愈瘦。,(,5,)曲线下和,x,轴所夹的总面积为,1,=0.5,=
10、1,=2,2,标准正态分布,定义:,=0,,,=1,时的正态分布称为标准正态分布。标准正态分布变量记为,U,,写作,U,N(0,1),。,3,标准正态分布的概率计算,查表法:附,表,2,(,325,页)列出了标准正态变量的累积分布函数值,即,U,小于某个值,u,的概率:,P(Uu),关系式:,定理,:,4,一般正态分布的概率计算,通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。,关于一般的正态分布,以下的一些概率经常用到:变量,Y,落在,的不同倍数,区间的概率。,这些结论可以用,一个实例,来印证:,以第一章里的,120,头母羊的体重资料为例:,由表可见,实际频率与理论概率相当接近,说明,120,头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。,5,正态分布的单侧、双侧临界值(分位数),附表,2,列出了概率的数值,即对于给定的,u,,列出了曲线下,u,左边的面积。,在以后的统计推断中,我们经常需要做与上面相反的工作:即,已知曲线下右侧尾区的一定面积,,求,对应的临界值,u,注意:这些临界值在第五章假设检验时经常用到,






