收藏 分销(赏)

第二概率与概率分布-PPT.pptx

上传人:1587****927 文档编号:1680301 上传时间:2024-05-07 格式:PPTX 页数:61 大小:659KB 下载积分:14 金币
下载 相关 举报
第二概率与概率分布-PPT.pptx_第1页
第1页 / 共61页
第二概率与概率分布-PPT.pptx_第2页
第2页 / 共61页


点击查看更多>>
资源描述
第二概率与概率分布频率就是由样本数据计算得到得。由于样本分布得不均衡性,不同得随机试验,一个事件得出现频率也不一样,有一定得波动。随着试验次数得增大,频率将围绕着某一确定得常数P做平均幅度愈来愈小得变动,这就就是所谓频率得稳定性,其中P即为概率(表2-1)。简单得说概率就就是频率得稳定值。在试验次数较多时,可以用频率作为概率得近似值。概概率率就就是是事事件件在在试试验验结结果果中中出出现现可可能能性性大大小小得得定定量量计量。计量。概率就是事件固有得属性概率就是事件固有得属性,有以下明显得性质有以下明显得性质:随机事件随机事件A A得概率得概率:0 0P P(A A)1 1必然事件必然事件WW得概率为得概率为1 1,即即P P(WW)=1=1不可能事件不可能事件(V V)得概率为得概率为0 0,即即P P(V V)=0=0概率接近于概率接近于0 0(如如P0P0、0505)得事件称为小概率事件。得事件称为小概率事件。2 2、2 2 概率分概率分布布一、一、随机变量随机变量表示随机现象结果得变量,也就就是在随机试验中被测定得量,所取得得值称为观察值。随机变量随机变量离散型离散型连续型连续型(与我们前面所讲得连续型数据与离散型数据得意义一样与我们前面所讲得连续型数据与离散型数据得意义一样)二、离散型变量得概率分布随机变量取得得数值为有限个,或为无穷个孤立得值。将随机变量X所取得值x得概率P(X=xi)写成x得函数pi,称为随机变量X得概率函数pi=P(X=xi)。将X得一切可能值x1,x2,x3,xn,以及取得这些值得概率p1,p2,pn,排列起来,构成了离散型随机变量得概率分布。常用概率分布表或概率分布图表示(如,p27表2-2图2-1)。概率函数应满足得条件:离散型变量概率得累积分布函数:离散型变量概率得向上累积。其公式为 ,即随机变量小于等于某一可能值(x0)得概率。离散型概率分布得例子离散型概率分布得例子例例:从从100件件产产品品(其其中中合合格格品品95件件,废废品品5件件)。任任意意抽抽取取10件件,求每次抽到废品数得概率分布。求每次抽到废品数得概率分布。xp(x)0 123450、5837523670、3393909110、0702188090、0063835280、0002510380、000003347 累积分布函数图累积分布函数图0 00.20.20.40.40.60.60.80.81 10 01 12 23 34 45 5xF(x)0 123450、5837523670、9231432780、9933620770、9997456050、9999966531、000000000概率分布表概率分布表概率分布表概率分布表累积概率分布表累积概率分布表累积概率分布表累积概率分布表离散型随机变量概率分布得特点离散型随机变量概率分布得特点列出随机变量所有可能值得列出随机变量所有可能值得xi,pi 组合组合 xi=随机变量值随机变量值(取值取值)pi 为为 xi 得值对应得概率得值对应得概率互斥性互斥性(不相交不相交/无重复无重复)0 p(xi)1p(xi)=1对于离散型随机变量得任何值对于离散型随机变量得任何值,都可以求出它得概率。都可以求出它得概率。三、三、连续型概率分布连续型概率分布连连续续型型随随机机变变量量(如如体体长长、体体重重、卵卵重重)则则不不同同,连连续续型型随随机机变量任何值得概率都为变量任何值得概率都为0 0。连续型随机变量连续型随机变量,仅研究某一区间内取值得概率。仅研究某一区间内取值得概率。例例如如,某某品品种种小小麦麦得得高高度度为为100cm100cm120cm120cm。我我们们可可以以说说该该品品种种得得任任何何一一株株小小麦麦得得高高度度准准确确地地等等于于某某一一标标准准高高度度(如如105cm105cm)得得概概率率等等于于0 0。我我们们只只能能确确定定它它高高度度得得范范围围在在某某一一固固定得区间内定得区间内,在实际中无限提高测定得精确度也无意义。在实际中无限提高测定得精确度也无意义。连连续续型型随随机机变变量量得得概概率率分分布布不不能能用用分分布布列列来来表表示示,改改用用随随机机变量变量x x在某个区间内取值得概率在某个区间内取值得概率P(P(axbaxb)来表示。来表示。随随机机变变量量X X得得值值落落在在区区间间(x x,x x+x x)内内得得概概率率为为P P(x xX Xx x+x x)其中其中x x为区间长度。为区间长度。大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点当当x趋于零时趋于零时,此时区间概率称为密度函数此时区间概率称为密度函数:概率密度得图形概率密度得图形y=f(x),称为分布曲线。称为分布曲线。概率就是曲线下面概率就是曲线下面概率就是曲线下面概率就是曲线下面积积积积!f(x)Xab概率密度曲线概率密度曲线概率密度曲线概率密度曲线f f(x x)与与与与x x轴所围成得面积为轴所围成得面积为轴所围成得面积为轴所围成得面积为 1 1 分分分分布布布布函函函函数数数数(或或或或称称称称为为为为累累积积分分布布函函数数)就就就就是是是是随随随随机机机机变变变变量量量量X X取取取取得得得得小小小小于于于于x x0 0得值得概率得值得概率得值得概率得值得概率概率密度函数图与概率分布函数图概率密度函数图与概率分布函数图概率密度函数图概率密度函数图 概率分布函数图概率分布函数图yp(x)yF(x)x1x2x2x1P(x1xx2)=F(x2)F(x1)连续型随机变量概率分布得性质:分布密度函数总就是大于或等于0,即f(x)0;当随机变量x取某一特定值时,其概率等于0;即 (c为任意实数)因而,对于连续型随机变量,仅研究其在某一个区间内取值得概率,而不去讨论取某一个值得概率。2 2、3 3 离散型概率分布离散型概率分布二项分布(binomial distribution)泊松分布(poisson distribution)超几何分布(hypergeometric probability distritution)负二项分布(Negative binomial distribution)u贝努利试验(Bernoulli trial):我们把只有两种可能观测值(每次试验只可能就是两个对立事件之一)得随机试验统称为贝努利试验。这种试验在实际中广泛存在,如观察某一实验动物得卵孵化与否、某一实验动物就是雌性还就是雄性、实验反应就是阴性还就是阳性等。un次独立地贝努利试验称为n重贝努利试验,其试验结果得分布(一种结果出现x次得概率就是多少得分布)即为二项分布。u应用二项分布得重要条件就是:每一种试验结果在每次试验中都有恒定得概率,各试验之间就是重复独立得。一、二项分布一、二项分布 B(n,p)例:例3、1注意:1)放回式抽样适用于二项分布,非放回式抽样适用于超几何分布;2)通式为:n=试验次数;x=在n次试验中事件A出现得次数p=事件A发生得概率(每次试验都就是恒定得)1p=事件 发生得概率P(x)=X 得概率函数为 P(X=x);F(x)=P(Xx)xnxxnppcxP-=)1()(服从二项分布得随机变量得特征数服从二项分布得随机变量得特征数总体平均数总体平均数:np,p(用比率表示时)总体方差总体方差:(用比率表示时)偏斜度偏斜度:峭度峭度:从以上公式可以瞧出二项分布决定于两个参考数:试验次数n 与概率P,因此其图形变化趋势与这两个参数有关。1 13 3、1111 2 29 9、5050 1 10 0 2 20 0 1 10 0 2 20 0、0202 1 10 0 2 20 0、2020 1 10 0、1212 2 20 0、0101 1 10 0、2727 2 20 0、0505 1 10 0、4444 2 20 0、1919 1 10 0、9898 2 20 0、9595 1 10 0、8484 2 20 0、5151n=10,p0.0100.20.40.60.810246810n=100,p0.0100.10.20.30.40.50255075100n=500,p0.0100.10.20.30.40.50100200300400500n=10,p0.1000.10.20.30.40.50246810n=100,p0.1000.050.10.150.20255075100n=500,p0.1000.020.040.060.080.10100200300400500n=10,p0.5000.10.20.30246810n=100,p0.5000.020.040.060.080.10255075100n=500,p0.5000.010.020.030.040.050100200300400500二项分布得应用条件有三二项分布得应用条件有三:(1)各观察单位只具有互相对立得一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料;(2)已知发生某一结果(如死亡)得概率为p,其对立结果得概率则为1-p=q,实际中要求 p 就是从大量观察中获得得比较稳定得数值;(3)n个观察单位得观察结果互相独立,即每个观察单位得观察结果不会影响到其它观察单位得观察结果。二、泊松分布二、泊松分布P(P()在生物学研究中,有许多事件出现得概率很小,而样本容量或试验次数却往往很大,即有很小得p值与很大得n值。这时二项分布就变成另外一种特殊得分布,即泊松分布。如,显微镜视野内染色体有变异得细胞计数、单位容积得水中细菌数目得分布、作物种子内杂草得分布以及样方内少见植物得个体数等都属于泊松分布。其概率函数可由二项分布得概率函数推导。1、泊松分布概率函数得推导、泊松分布概率函数得推导(将系数得分子分母同乘以将系数得分子分母同乘以nx)(当当当当n n时时时时,系数得极限为系数得极限为系数得极限为系数得极限为1,1,且且且且n n =)平均数平均数:=方差方差:2=偏斜度偏斜度:峭度峭度:概率函数内得概率函数内得,不但就是它得平均数不但就是它得平均数,而且就而且就是它得方差。是它得方差。很大时很大时,1与与2则接近于则接近于0,这时得泊松分布近似于这时得泊松分布近似于正态分布。正态分布。2、服从泊松分布得随机变量得特征数服从泊松分布得随机变量得特征数3、泊松分布应用实例泊松分布应用实例例3、5 在麦田中,平均每10m2有一株杂草,问每100m2麦田中,有0株、1株、2株、杂草得概率就是多少?解:先求出每100m2麦田中,平均杂草数 100/10 10株 将代入泊松分布得概率密度函数中,p(x)=10 x/(x!e10),(e=2、71828)即可求出x 0,1,2,时所相应得概率。例例:为监测饮用水得污染情况为监测饮用水得污染情况,现检验某社区每毫升现检验某社区每毫升饮用水中细菌数饮用水中细菌数,共得共得400400个记录如下个记录如下:试分析饮用水中细菌数得分布就是否服从泊松分布,计算每毫升水中细菌数得概率及理论次数并将頻率分布与泊松分布作直观比较。解:经计算得每毫升水中平均细菌数为0、500,x 0、5,s20、496,两者相接近,可认为服从泊松分布代入泊松分布公式1ml水中细菌数0123合计次数f243120316400注意,二项分布得应用条件也就是泊松分布得应用条件。要求n 次试验就是相互独立得。然而一些具有传染性得罕见疾病得发病数,因为首例发生之后可成为传染源,会影响到后续病例得发生,所以不符合泊松分布得应用条件。1ml水中细菌数0123合计实际次数f243120316400频率0、60750、30000、07750、01501、00概率0、60650、30330、07580、01441、00理论频数242、60121、3230、325、764002、4 主要得连续型随机变量得概率分布主要得连续型随机变量得概率分布正态分布正态分布 在生物统计学中,正态分布占有极其重要得地位。许多生物学现象所产生得数据,都服从正态分布。一、正态分布(xN(,2)得密度函数与分布函数正态曲线正态分布得规律就是数据分布正态分布得规律就是数据分布集中在平均数附近集中在平均数附近,并且在平均并且在平均数得两侧成对称分布。正态分数得两侧成对称分布。正态分布密度函数得图像布密度函数得图像,称为正态曲称为正态曲线。线。密度函数密度函数:分布分布(累积累积)函数函数:正态分布密度曲线特点正态分布密度曲线特点:密度曲线以x=直线为对称;x=与x=-所确定得点为曲线得两个“拐点”;曲线向左、向右无限延伸,以x轴为渐近线;x=时,f(x)具有最大值,其值为 ;得大小,决定曲线得“胖”、“瘦”程度(展开程度),越小,曲线越“瘦”,数据越集中,越大,曲线越“胖”,数据越分散。固定时,值决定曲线得位置,当增大时曲线向右平移,当减少时曲线向左平移,但曲线形状不变。二、二、标准正态分布标准正态分布(xN(0,1)=0,=1时得正态分布称为标准正态分布。时得正态分布称为标准正态分布。密度函数密度函数:分布分布(累积累积)函数函数:标准正态分布有以下特性标准正态分布有以下特性:=0时,概率密度值最大;概率密度曲线向左、向右无限延伸,以x轴为渐近线;左右对称u=1与u=1就是概率分布曲线得两个拐点;曲线与横坐标轴所夹得图形面积为1;累积分布函数曲线从到0平稳上升,围绕点(0,0、5)对称;标准正态分布得偏斜度1与峭度2均为零。以下一些特征值很重要以下一些特征值很重要:6868、27%27%9595、45%45%9999、73%73%1 1 1 1 2 2 2 2 3 3 3 3 -3 -3 -3 -3 -2-2 -1-1-1-1 P P(-1u-1u1 1)=0=0、68266826 P P(-2u-2u2 2)=0=0、95459545 P P(-3u-3u3 3)=0=0、99739973以下一些特征值很重要以下一些特征值很重要:90%90%95%95%1 1 1 1、645645645645 1 1 1 1、96 296 296 296 2、58585858 -2 -2 -2 -2、58 58 58 58 -1-1、9696 -1-1-1-1、645645645645 99%99%P(-1、96u1、96)=0、95P(-2、58u2、58)=0、99三、三、标准正态分布表得查法标准正态分布表得查法对于标准正态分布,其累积分布函数值F(u)可直接查表(书p315附表1)得到,其值等于标准正态曲线与横坐标轴从到u所夹得面积,该曲线下得面积即表示随机变量U 落入区间(,u)得概率;标准正态分布查表常用得几个关系式:P(0U u1)=F(u1)=1F(u1)P(Uu1)=2F(u1)P(Uu1)=1 2F(u1)P(u1U u2)=F(u2)F(u1)u ux=5=109、2正态分布正态分布u=0=10、42标准正态分布标准正态分布v对于一般正态分布对于一般正态分布,要先进行标准化要先进行标准化,再查表再查表;标准化得公式为标准化得公式为:例3、7 查标准正态分布u-0、82 及u1、15时得F(u)得值例3、8 随机变量u服从正态分布N(0,1),问随机变量u得值落在(0,1、21)区间得概率?例3、9 已知随机变量u服从正态分布N(0,1),问随机变量u得值落在(-1、96,1、96)区间得概率就是多少?例3、10 已知某高粱品种得株高X服从正态分布N(156、2,4、822),求:(1)1)X X161cm164cm164cm得概率得概率;(3)152(3)152X X162162得概率。得概率。利用公式利用公式P(0Uu)=F(u)0、5利用公式利用公式 P(U u)=1 2F(u)或或 P(u1Uua)=时得ua值;下侧分位数:P(uua/2)=时得ua值(从附表2中以/2查出得ua即可);大数定律与中心极限定理得应用大数定律与中心极限定理得应用样本容量越大,样本统计数与总体参数之差越小。对于容量大于30得样本,样本均值得分布可以较好地用一个正态分布近似(其中均值为,即,样本均值得平均值,标准差为 ,即样本均值得标准差)样本容量越大,近似得效果越好。如果原始总体就就是正态分布,则对于任意样本容量n,样本均值都将就是正态分布得。EXCEL在本章内容得应用EXCELEXCEL电子表格提供得粘帖函数电子表格提供得粘帖函数BINOMDIST 计算二项式分布得概率值NORMDIST 计算正态分布得累积函数NORMINV 计算正态分布累积函数得逆函数NORMSDIST 计算标准正态分布得累积函数NORMSINV计算标准正态分布累积函数得逆函数POISSON 计算泊松分布得概率AVERAGE计算算术平均值GEOMEAN 计算几何平均数MAX 计算最大值MEDIAN计算一组给定数字得中位数STDEV计算样本标准差STDEVP计算样本总体得标准差VAR计算样本得方差VARP计算样本总体得方差各种分布函数计算1、二项分布工具平均数、方差与标准差二项分布得概率函数为二项分布函数得概率及累积概率得计算实例二项分布函数得概率及累积概率得计算实例 已知某种猪病得死亡率为30%,现有10头病猪,如不给予治疗,问死亡4头及死亡4头与4头以下得概率为多少?解:死亡4头得概率计算公式为:死亡4头与4头以下累积概率得计算公式为:用粘帖函数 BINOMDIST 计算死亡4头得概率计算本计算在编缉栏中为本计算在编缉栏中为BINOMDISTBINOMDIST(4 4,1010,0 0、3030,FALSEFALSE)死亡4头与4头以下概率得计算本计算在编缉栏中为BINOMDIST(4,10,0、30,TRUE)利用BINOMDIST函数与填充柄计算2 2、泊松分布工具、泊松分布工具 泊松分布得概率函数 为常数,它等于平均数等于方差=2 泊松分布概率得计算实例泊松分布概率得计算实例 已知某一地区,出现怪胎得事件服从泊松分布P(2),请计算该地区出现3次怪胎得概率,及出现3次与3次以下怪胎得概率为多少?出现3次怪胎概率得公式为:出现3次与3次以下怪胎得概率计算公式为:用用POISSONPOISSON粘帖函数计算粘帖函数计算出现3次怪胎概率得计算本计算在编缉栏中显示POISSON(3,2,FALSE)出现3次与3次以下怪胎得概率计算本计算编缉栏中显示POISSON(3,2,TRUE)3 3、正态分布工具、正态分布工具 用符号N(,2)表示(1)、正态分布得概率函数为:NORMDIST粘帖函数粘帖函数:计算累积函数计算累积函数 NORMINV粘帖函数粘帖函数:计算逆函数计算逆函数 已知某品种成年猪体重得总体平均数=100kg,总体标准差=20kg。试计算成年猪体重在70kg以下得概率。计算公式如下:用正态分布粘帖函数得计算用NORMDIST粘帖函数计算概率 本计算在编缉栏中得形式为NORMDIST(70,100,20,TRUE)用NORMDIST粘帖函数计算函数值 本计算在编缉栏中得形式为NORMDIST(70,100,20,FALSE)已知某品种成年猪体重得总体平均数=100kg,总体标准差=20kg。如果我们希望淘汰30%体重最轻得猪,问体重在多少kg以下得猪应给予淘汰。计算公式如下:用NORMINV粘贴函数计算 本计算在编缉栏中得形式为NORMINV(0、30,100,20)(2)、标准、标准正态分布正态分布 用符号N(0,1)表示标准正态分布得概率函数为:标准化得公式为:利用标准正态分布函数计算概率利用标准正态分布函数计算概率 NORMSDIST粘贴函数:计算累积函数 NORMSINV粘贴函数:计算逆函数 已知某品种成年猪体重得总体平均数=100kg,总体标准差=20kg。试计算成年猪体重在70kg以下得概率。首先对70kg进行标准化,得u值等于-1、5,计算公式如下:用NORMSDIST粘帖函数计算概率 本例在编缉栏中得形式就是NORMSDIST(-1、5)
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服