收藏 分销(赏)

三概率分布与抽样分布.ppt

上传人:w****g 文档编号:13167677 上传时间:2026-01-28 格式:PPT 页数:44 大小:745.54KB 下载积分:8 金币
下载 相关 举报
三概率分布与抽样分布.ppt_第1页
第1页 / 共44页
三概率分布与抽样分布.ppt_第2页
第2页 / 共44页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第三概率分布与抽样分布,(优选)第三概率分布与抽样分布,条件概率:,A,、,B,为两个随机事件,,P,(,A,B,)称为事件,B,发生的前提下事件,A,发生的条件概率。,P,(,A,B,),=,,,P,(,B,),0,。,由于增加了新的条件(附加信息),一般说来,,P,(,A,B,),P,(,A,)。,乘法公式:,将条件概率公式变形可得:,P,(,AB,),=P,(,B,),P,(,A,B,),将上式中,A,、,B,的位置对调,可得:,P,(,AB,),=P,(,A,),P,(,B,A,),以上两式统称概率乘法公式。,1、完备事件组,其中N为产品总数,n为试验次数也即抽取出的产品数;,随机变量:离散型、连续型。,二项分布、几何分布都是贝努利试验导出的分布。,全概率公式与逆概率公式:,其中N为产品总数,n为试验次数也即抽取出的产品数;,数据经过标准化后,均变换成均值为0、方差为1的样本。,2、全概率公式,若X1、X2、Xn相互独立,且均服从标准正态分布N(0,1)。,则称f(x)为连续型随机变量X的概率密度函数。,再比如,为研究家庭食品支出与收入的关系,随机抽取了10户家庭作为样本,得到如下数据:,这样的抽样一般采取“不放回抽样”,也就是说,每次抽取之后并不放回。,P(AB)=P(B)P(AB),若事件A1、A2、An为完备事件组,则对任一事件B,有,PX(a,b)=PaXb=,全概率公式与逆概率公式:,1,、完备事件组,若事件,A,1,、,A,2,、,A,n,互不相容(互斥),且其中之一必然发生,则事件,A,1,、,A,2,、,A,n,组成完备事件组。即,A,1,A,2,A,n,=,,,A,i,A,j,=,(,ij,),2,、全概率公式,若事件,A,1,、,A,2,、,A,n,为完备事件组,则对任一事件,B,,有,一、概率与概率分布,(二)概率分布,概率与随机变量密不可分。,随机变量:离散型、连续型。,概率分布:随机变量取一切可能值的概率的规律称为概率分布,即,P,(,x=everyprobnumber,),=?,概率分布可以用表、图形或公式等多种方式来表示。,二项分布:,只有两种可能结果的试验称为贝努利试验。,n,次独立重复的贝努利试验称为,n,重贝努利试验。在,n,重贝努利试验中,结果,A,(成功)出现,m,次的概率分布为:,其中:,几何分布:,在可列重贝努利试验中,结果,A,(成功)在第,m,次首次出现的概率分布为:,二项分布、几何分布都是贝努利试验导出的分布。,超几何分布:,二项分布与几何分布都是在,n,重或可列重相互独立的贝努利试验中形成的。那么,如果这种试验不是相互独立的呢?比如:,假定有一批,500,个产品,而其中有,5,个次品。假定该产品的质量检查采取随机抽取,20,个产品进行检查。如果抽到的,20,个产品中含有,2,个或更多不合格产品,则整个,500,个产品将会被退回。,这时,人们想知道该批产品被退回的概率是多少。该概率满足超几何分布,(hypergeometric distribution),。,这样的抽样一般采取“不放回抽样”,也就是说,每次抽取之后并不放回。在这种情况下,每次抽取之后,总体之中的合格和不合格品的比例都会发生变化,和以前不一样了,因此,每次试验不再是独立的贝努利试验,在,n,次试验中,结果,A,(成功)出现,m,次的概率分布也就不再服从二项分布,而是服从超几何分布:,其中,N,为产品总数,,n,为试验次数也即抽取出的产品数;,K,为产品中结果,A,的总数也即产品中的总次品数。,一、概率与概率分布,(三)概率密度函数与累积概率分布函数,连续型随机变量不好讲概率分布,所以讲累积概率分布,,P(x,everyprobnumber)=?,而,其累积概率分布也是无穷的,所以用函数来刻画,引入了概率密度函数,(probability density function,,,pdf),和累积概率分布函数,(cumulative distribution function,,,cdf),。,若,X,为连续型随机变量,且存在一个非负函数,f(x),,使得对任意区间(,a,,,b,),有,P,X(a,,,b),=P,a,X,b,=,则称,f(x),为连续型随机变量,X,的概率密度函数。,在平面直角坐标系中画出,f(x),的图形,则对于任何实数,x,1,x,2,,,P(x,1,=30,的条件,样本均值也近似服从正态分布,即:,同理,对于两个相互独立的正态总体,N,(,1,,,1,2,)、,N,(,2,,,2,2,),假设我们从这两个总体中分别抽取一个,n,1,、,n,2,个观察值组成的样本,那么,这两个样本均值的差也服从正态分布,即:,思考:如果这两个总体不是正态总体而,n,1,、,n,2,足够大,样本均值差的分布形态还是这样的吗?,标准正态分布,N(0,,,1),:,标准正态分布的重要性在于,任何一个一般的正态分布都可以化为标准正态分布,即 ,N,(,0,,,1,)。,所以,说一个随机变量服从正态分布,与说它服从标准正态分布没什么太大差别,因为它可以转化为标准正态分布。,数据的标准得分:,我年收入,60,万,多吗?,两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样,(,数据:,grade.txt),。一班的平均分和标准差分别为,78.53,和,9.43,,二班的均值和标准差分别为,70.19,和,7.00,。那么,一班得,90,分的张颖是不是比二班得,82,分的刘疏成绩更好呢?怎么比较才更合理呢?,数据的标准化:,虽然均值和标准差不同的数据不好直接比较,但是可以把它们进行标准化,再比较标准化后的数据。,数据标准化的方法主要有两种;数据标准化后得到的值称为标准得分(,standard score,、,z-score,):,可以看出,原始数据在各自的均值附近,离散程度也不一样。但它们的标准得分则在,0,周围,且离散程度也差不多。数据经过标准化后,均变换成均值为,0,、方差为,1,的样本。标准化后的数据没有量纲;不同样本观测值的比较只有相对意义,没有绝对意义。,100,97,N=,?,?,?,?,110,100,90,80,70,60,50,40,2,1,100,97,N=,?,?,?,?,3,2,1,0,-1,-2,-3,-4,2,1,三、分布,若,X,1,、,X,2,、,X,n,相互独立,且均服从标准正态分布,N,(,0,,,1,)。则随机变量,Y=X,1,2,+X,2,2,+,+X,n,2,的概率分布为自由度为,n,的 分布,简记为,Y,(,n,)。,自由度:变量的自由程度。对于样本方差,S,2,,则:,比如,有些产品出厂时不仅需要标注其性能参数均值,而且要标明均值的方差(标准差)。为了估计某产品能耗的方差,我们随机抽取了,10,件,测得其能耗为(千瓦时,/,小时):,12.5,,,12.12,,,12.01,,,12.28,,,12.09,,,12.03,,,12.01,,,12.11,,,12.06,,,12.14,。,那么,当其能耗,x,服从正态分布时,:,思考:,在上一张片子中,下面的统计量是严格服从卡方分布还是近似服从卡方分布?为什么?,再,比如,为研究家庭食品支出与收入的关系,随机抽取了,10,户家庭作为样本,得到如下数据:,那么,当食品支出,y,服从正态分布时,:,下表是工商,07,级,1,班、,2,班某门课的考试成绩,。思考:,服从卡方分布吗?如果服从,其自由度是多少?如果不服从,那在什么情况或什么条件下服从?,四、,t,分布,若随机变量,X,Z,(,0,,,1,),,Y,(,n,),且,X,、,Y,相互独立,则随机变量,Z=,服从自由度为,n,的,t,分布,简记为,Z,t,(,n,)。,(三)概率密度函数与累积概率分布函数,数据经过标准化后,均变换成均值为0、方差为1的样本。,下表是工商07级1班、2班某门课的考试成绩。,比如,有些产品出厂时不仅需要标注其性能参数均值,而且要标明均值的方差(标准差)。,二项分布、几何分布都是贝努利试验导出的分布。,其中N为产品总数,n为试验次数也即抽取出的产品数;,实际中,要求n30。,二项分布、几何分布都是贝努利试验导出的分布。,二项分布与几何分布都是在n重或可列重相互独立的贝努利试验中形成的。,标准正态分布的重要性在于,任何一个一般的正态分布都可以化为标准正态分布,即 N(0,1)。,数据经过标准化后,均变换成均值为0、方差为1的样本。,虽然均值和标准差不同的数据不好直接比较,但是可以把它们进行标准化,再比较标准化后的数据。,服从卡方分布吗?如果服从,其自由度是多少?如果不服从,那在什么情况或什么条件下服从?,若X1、X2、Xn相互独立,且均服从标准正态分布N(0,1)。,1、完备事件组,t,分布概率密度曲线图如下:,特点:,1,、,t,分布为对称分布;,2,、,n,充分大时,,t,分布近似,Z,(,0,,,1,)。,考察统计量,其中,分子 ,分母中 。因此,,T,t,(,n-1,)。,五、,F,分布,若随机变量,X,(,n,1,),,Y,(,n,2,),且,X,、,Y,相互独立,则随机变量,Z=,服从自由度为(,n,1,,,n,2,)的,F,分布,简记为,Z,F,(,n,1,,,n,2,)。,F,分布的概率密度曲线如下:,正态分布是最常见、最重要的概率分布。,因此,Tt(n-1)。,F分布的概率密度曲线如下:,若X1、X2、Xn相互独立,且均服从标准正态分布N(0,1)。,下表是工商07级1班、2班某门课的考试成绩。,下表是工商07级1班、2班某门课的考试成绩。,全概率公式与逆概率公式:,将条件概率公式变形可得:,在这种情况下,每次抽取之后,总体之中的合格和不合格品的比例都会发生变化,和以前不一样了,因此,每次试验不再是独立的贝努利试验,在n次试验中,结果A(成功)出现m次的概率分布也就不再服从二项分布,而是服从超几何分布:,假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,数据经过标准化后,均变换成均值为0、方差为1的样本。,实际中,要求n30。,1、完备事件组,其中,分子 ,分母中 。,概率分布可以用表、图形或公式等多种方式来表示。,比如,下表是工商,07,级,1,班、,2,班某门课的考试成绩,。假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,比如,下表是工商,07,级,1,班、,2,班某门课的考试成绩,。假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,六、随机变量,X,与,Y,相互独立的充要条件:,1,、离散变量:,P,(,X=x,i,,,Y=y,i,),=P,(,X=x,i,),P,(,Y=y,i,),(边缘概率分布之积等于联合概率分布),2,、连续变量:,f,(,x,,,y,),=f,X,(,x,),f,Y,(,y,),(边缘概率密度之积等于联合概率密度),
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服