资源描述
*,*,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,6.1,连续型随机变量的概率分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值,它取任何一个特定的值的概率都等于,0,不能列出每一个值及其相应的概率,通常研究它取某一区间值的概率,用概率密度函数的形式和分布函数的形式来描述,常用连续型概率分布,6.2,正态分布,(normal distribution),由,C.F.,高斯,(,Carl Friedrich Gauss,,,1777,1855,),作为描述误差相对频数分布的模型而提出,描述连续型随机变量的最重要的分布,许多现象都可以由正态分布来描述,可用于近似离散型随机变量的分布,例如:二项分布,经典统计推断的基础,x,f,(,x,),概率密度函数,f,(,x,)=,随机变量,X,的频数,=,正态随机变量,X,的均值,=,正态随机变量,X,的方差,=3.1415926,;e=,2.71828,x,=,随机变量的取值,(-,x,+,),正态分布函数的性质,图形是关于,x,=,对称钟形曲线,且峰值在,x,=,处,均值,和标准差,一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”,均值,可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的,“,陡峭,”,或,“,扁平,”,程度,。,越大,正态曲线扁平;,越小,正态曲线越高陡峭,当,X,的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于,1,标准正态分布,(standardize normal distribution),标准正态分布,的概率密度函数,随机变量具有均值为,0,,标准差为,1,的正态分布,任何一个,一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布,的分布函数,标准正态分布,X,m,s,一般正态分布,=1,Z,标准正态分布,正态分布,(,例题分析,),【,例,】,计算以下概率,(1),X,N,(50,10,2,),,求 和,(2),Z,N,(0,1),,求 和,(3),正态分布概率为,0.05,时,求标准正态累积分布函数,的反函数值,z,6.3,数据正态性的评估,对数据画出频数分布的直方图或茎叶图,若数据近似服从正态分布,则图形的形状与上面给出的正态曲线应该相似,求出样本数据的四分位差,Q,d,和标准差,s,,,然后计算比值,Q,d,/,s,。,若数据近似服从正态分布,则有,Q,d,/,s,1.3,绘制正态概率图,正态概率图的绘制,(normal probability plots),正态概率图可以在概率纸上绘制,也可以在普通纸上绘制。在普通纸上绘制正态概率图的步骤,第,1,步:,将样本观察值从小到大排列,第,2,步:,求出样本观察值的标准正态分数,z,i,。标准正,态分数满足,第,3,步:,将,z,i,作为纵轴,,x,i,作为横轴,绘制图形,即为,标准正态概率图,正态概率图的绘制,(,例题分析,),【,例,】,一家电脑公司连续,10,天的销售额,(,单位:万元,),分表为,176,,,191,,,214,,,220,,,205,,,192,,,201,,,190,,,183,,,185,。绘制正态概率图,判断该组数据是否服从正态分布,用,SPSS,绘制正态概率图,用,SPSS,绘制正态概率图,第,1,步:,选择,【,Graphs,】,下拉菜单,并选择,【,Q-Q,】,选项进入主对话框,第,2,步:,在主对话框中将变量选入,【,Variables,】,,点击,【,OK,】,正态概率图的绘制,(,例题分析,),电脑公司销售额的正态概率图,正态概率图的绘制,(SPSS,绘制的例,2.3,的正态概率图,),正态概率图的分析,(normal probability plots),正态概率图有时也称为分位数,分位数图,或称,Q,-,Q,图,实际应用中,只有样本数据较多时正态概率图的效果才比较好。当然也可以用于小样本,但此时可能会出现与正态性有较大偏差的情况,在分析正态概率图时,最好不要用严格的标准去衡量数据点是否在一条直线上,只要近似在一条直线上即可,对于样本点中数值最大或最小的点也可以不用太关注,除非这些点偏离直线特别远,因为这些点通常会与直线有偏离。如果某个点偏离直线特别远,而其他点又基本上在直线上时,这个点可能是离群点,可不必考虑,
展开阅读全文