资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第六章 抽样与抽样分布,第一节 抽样与抽样分布的相关知识,一、简单随机抽样样本,(一)简单随机抽样样本定义,定义,6.1.1,:从含有,N,个元素中,抽取,n,个 元素作为样本,使得总体中的每一个容量为,n,的样本都有相同的机会被抽中这样抽出来的样本称为简单随机抽样样本。,(二)简单随机抽样样本类型,它有两种类型:重复抽样与不重复抽样,1,、,重复抽样,重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中,再抽取第二个元素,直至抽取,n,个元素为止,这样的抽样方法称为重复抽样(,sampling with replacement),。,2,、,不重复抽样,不重复抽样:一个元素被抽中后不再放回总体,然后再从所剩的元素中抽取第二个元素,直至抽取,n,个元素为止,这样的抽样方法称为不重复抽样(,sampling without replacement),。,二、三种不同性质的分布,(一)总体分布:总体中各元素的观测值所形成的相对频数分布,称为总体分布。,(,population distribution,)。,(二)样本分布:从总体中抽取容量为,n,的样本,有这,n,个观测值形成的相对频数分布,称为样本分布(,sample distribution,)。,(三)某个样本统计量的抽样分布:从理论上说就是在重复选取容量为,n,的样本时,由该统计量的所有可能值形成的相对频数分布。,可分为样本均数的抽样分布;样本率的抽样分布;样本标准差的抽样分布。,1,、样本均数的抽样分布,定义:在重复选取容量为,n,的样本时,由样本均值的所有可能取值形成的相对频数分布,称为样本均数的抽样分布。,(,1,),x-bar,抽样分布的形成过程,例,6.1.1,:设一个总体有,4,个元素,即总体元素的个数,N=4,4,个元素的取值分别为:,x1=1,,,x2=2,,,x3=3,,,x4=4,。,从总体中采取重复抽样方法抽取容量为,n=2,的随机样本,写出样本均值,x-bar,的抽样分布。,第六章 抽样与抽样分布,.ppt,(,2,)抽样均值抽样分布的形成过程可以概括如下:,总体,N,容量为,n,的,所有样本,计算出每一,个样本的均值,X-bar,的抽样分布,(,3,),X-bar,抽样分布形式,x-bar,的抽样分布与原总体的分布和样本容量有关。,结论:,如果原有总体是正态分布,则无论样本容量的大小,样本均值的抽样分布都服从正态分布。,如果原有总体分布是非正态分布,则要看样本的大小,随着样本容量的增大(,n30,)不论原有总体是否是正态分布,样本均值的抽样分布都趋于正态分布,该正态分布的均值为,,标准差为,如果总体不是正态分布,当,n,为小样本时(,n30,),样本均值的分布不是正太分布,这时就不能按正态分布来推断总体均值。样本均值的抽样分布与总体分布的关系可用下图来描述。,样本分布与总体分布关系图,总体分布,正态分布,非正态分布,样本均值分布,为正态分布,样本均值分布,为正态分布,样本均值分布,为非正态分布,大样本,小样本,大样本,小样本,(,4,)样本均值的抽样分布特征,设总体共有,N,个元素,其均值为,,方差为,从中抽取容量为,n,的样本,样本均值的数学期望(样本均值的均值)为,,样本均值的方差为总,体方差的,1/n,。,样本均值的均值,=,样本的方差值,=,2,、样本比例的抽样分布,比例问题适用于研究分类变量。就一个具有,N,个元素的总体而言,具有某种属性的元素个数为,N0,,具有另一种属性的元素个数为,N1,,将具有某种属性的元素个数与总体全部元素个数之比称为总体比例,用,表示,则有,=N0,N,,而具有另一种属性的元素个数与总体全部单位数之比为,N1,N=1-,。相应地,样本比例用,p,表示,同样有,p=n0,n,,,n1,n=1-p,。,(,1,)定义:样本比例的抽样分布是指在重复选取容量为,n,的样本时,由样本比例的所有可能取值形成的相对频数分布,称为样本比例的抽样分布。,(,2,)结论,结论:当样本容量很大时,样本比例,p,的抽样分布可用正态分布近似。,结论:对于一个具体的样本比例,p,,若,np5,和,n,(,1-p,),5,,就可以认为样本容量足够大。,3,、样本方差的抽样分布,(,1,)定义:在重复选取容量为,n,的样本时,由样本方差的所有可能取值形成的相对频数分布,称为样本方差的抽样分布。,(,2,)样本抽样分布的性质(卡方分布),当,n=20,时,卡方分布分布基本成对称分布,卡方分布性质:,卡方分布的值始终为正。,卡方分布的形状取决于,n,的大小,通常为 不对称的右偏分布,随着自由度的增大趋向对称。,卡方对应的面积值是指从某一卡方(,2,)到正无穷所对应的面积。,(,3,)卡方分布函数及反函数,卡方分布函数,【CHIDIST】,它的格式为,CHIDIST,(,2,,,df,),,2,是 指卡方值,,df,是指自由度。,卡方分布的反函数,【CHIINV】,它的格式为,CHIDIINV,(,,,df,),,是,指从某一卡方值到正无穷大的概率,,df,是指自由度。,样本统计量的抽样分布,样本统计量,样本均值,样本比例,样本方差,正态总体或,非正态总体,大样本,正态分布,非正态总体,(小样本),非正态分布,大样本,正态分布,卡方(,2,),分布,第二节 两个总体参数推断时样本统计量的抽样分布,在实际问题中,有时研究的是两个总体,即总体,1,和总体,2,,所关心的总体参数主要是两个总体均数之差,12,,两个总体比例之差,12,,两个总体的方差比 。相应地,用于推断这些参数的统计量分别是两个样本均值之差 ,两个样本比例之差,p1p2,,两个样本方差之比 。因此,此时需要分别研究两个总体参数推断时样本统计量的抽样分布。包括两个样本均值之差的抽样分布、比例之差的抽样分布、方差比的抽样分布。,一、两样本均值之差的抽样分布,(一)两样本均值之差的抽样分布定义:从两个总体中分别独立地抽取容量为,n1,和,n2,的样本,在重复选取,n1,和,n2,的样本时,由两个样本均数之差的所有可能取值形成的相对频数分布,称为两样本均值之差的抽样分布。,1-2,二、两样本比例之差的抽样分布,(一)两样本比例之差的抽样分布定义:从两个服从二项分布的总体中,分别独立地抽取,n1,和,n2,的样本,在重复选取容量为,n1,和,n2,的样本时,由两个样本比例之差的所有可能取值形成的相对频数分布,称为两样本比例之差的抽样分布。,注:所谓二项分布是指在总体中只存在两种随机变量的分布。如要么是正品,要么是次品;要么是正面,要么是反面;要么是进球,要么是不进球,等等。,(二)两个样本比例之差的抽样分布特征,1-2,三、两样本方差比的抽样分布,(一)两样本方差比的抽样分布定义:从两个正态总体中分别独立地抽取容量为,n1,和,n2,的样本,在重复抽取容量为,n1,和,n2,的样本时,有两个样本比的所有可能取值形成的相对频数分布,称为两样本方差比的抽样分布,或称为,F,分布。,(二),F,分布图,(三),F,函数及反函数,1,、,【FDIST】,函数,其格式为,FDIST,(,x,,,df1,,,df2,),其中,x,是随机变量,F,的取值,,df1,,,df2,分别为分子和分母的自由度。,2,、,【FINV】,函数,其格式为,FINV,(,,df1,,,df2,),其中是欲查的某一特定值,F,右侧但尾概率,,df1,,,df2,分别为分子和分母的自由度。,
展开阅读全文