资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,3,章 抽样分布,本章内容,3.1 Excel,模拟抽样过程与抽样分布,3.2,总体分布与抽样分布,3.3,中心极限定理,3.4,t,分布,下一页,返回目录,1,3.1,模拟抽样过程与抽样分布,3.1.1,抽样与抽样分布,3.1.2 Excel,抽取样本常用函数,3.1.3,运用,Excel,随机抽取样本,3.1.4,使用,Excel,建立抽样分布,上一页,下一页,返回本章首页,2,3.1.1,抽样与抽样分布,抽样,抽样是根据随机原则从总体中抽取一部分单位作为样本,并根据样本数量特征对总体数量特征做出具有一定可靠性的估计与推断。,将从总体中抽取的部分单位称为样本;将描述样本数量特征的指标称为统计量;描述总体数量特征的指标称为参数。,抽样分布,从一个总体中随机抽取容量相同的样本,则由这些样本可以计算出某统计量(如样本均值)的取值,这个统计量所有可能取值的概率分布称为该统计量(如均值)的抽样分布。,上一页,下一页,返回本节首页,3,1,索引函数,INDEX,索引函数,INDEX(),有两种形式:数组和引用。,数组索引函数的语法为:,INDEX(array,row_num,column_num),引用索引函数语法:,INDEX(reference,row_num,column_num,area_num),3.1.2 Excel,抽取样本常用函数,上一页,下一页,返回本节首页,4,2,随机数函数,RAND(),随机数函数,RAND(),用于生成一个大于等于,0,小于,1,的均匀分布随机数,每次计算时都将返回一个新的数值。其语法结构为:,RAND(),。,3,取整函数,CEILING,取整函数,CEILING,将参数,Number,沿绝对值增大的方向,舍入为最接近的整数或基数,significance,的最小倍数。其语法结构为:,CEILING(number,significance),。其中:,Number,为待舍入的数值。,Significance,为基数。,上一页,下一页,返回本节首页,5,3.1.3,运用,Excel,随机抽取样本,打开“第,5,章 抽样分布”工作簿,选择“抽样模拟”工作表。,上一页,下一页,返回本节首页,6,选择,G1,单元格,在工具栏中单击“函数”快捷按钮,,打开“粘贴函数”对话框,在“函数分类”列表中选择,“数学与三角函数”,在“函数名”列表中选择“随机函,数,RAND”,,打开随机函数对话框如下图所示。,上一页,下一页,返回本节首页,7,随机函数对话框中不需要填加任何数据,按住,Ctrl+Shift,键,单击“确定”按钮,在单元格,G1,中将显示一组随机数。,下面将,0,和,1,之间的数转换为整数。,将单元格,C2,中的公式改为“,=15*RAND()”,,按住,Ctrl+Shift,键,单击回车键。区域,C2,:,C8,中的各数值均扩大,15,倍。同时工作表重新计算一次,各值均发生改变。,上一页,下一页,返回本节首页,8,选定,D2,:,D8,单元格区域,打开“插入”菜单,选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”中选择“数学与三角函数”,在“函数名”列表中选择“取整函数,CEILING”,,打开取整函数对话框如下图所示。,上一页,下一页,返回本节首页,9,在,Number,中输入单元格地址,C2,:,C8,,在,Significance,中输入,1,,按住,Ctrl+Shift,键,单击“确定”按钮。,重复按,F9,键,在,D2,:,D8,各单元格中将出现介于,1,和,15,之间的随机整数,即将要抽取的样本点。,上一页,下一页,返回本节首页,10,选定单元格区域,E2,:,E8,,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表 中选择“查找与引用”选项,在“函数名”列表中选择 “索引函数,INDEX”,,打开选定参数对话框如下图所示。,上一页,下一页,返回本节首页,11,在选定参数窗口中,选择引用,(reference),,单击“确定”,按钮,进入索引函数,INDEX,窗口如下图所示,上一页,下一页,返回本节首页,12,在,Reference,中输入,A2,:,A16,,为抽取样本提供,区域。在,Row-num,中输入,D2,:,D8,,说明在,Reference,区域中要选哪些值。按住,Ctrl+Shift,组,合键,单击“确定”按钮,即得到随机抽取的样本,容量为,7,的样本。每按一次,F9,键,工作表都将,重新抽取一次样本。,上一页,下一页,返回本节首页,13,3.1.4,使用,Excel,建立抽样分布,1,编制频数分布,打开“第,3,章 抽样分布,.xls”,工作簿,选择“总体”工作表,如下图所示。,上一页,下一页,返回本节首页,14,在单元格,B1,:,B10,,输入,10,,,20,,,30,,,,,100,。用,鼠标选定,C1,:,C10,区域作为频数接受区域。,在“插入”菜单中选择“函数”,打开“粘贴函数”对话框如,下图所示。,上一页,下一页,返回本节首页,15,在“函数分类”列表中选择“统计”,在“函数名”列表中选择,频数函数,FREQUENCY,。单击“确定”按钮,打开频数分布,函数对话框如下图所示。,上一页,下一页,返回本节首页,16,在,Data_array,中输入,A1,:,A200,,在,Bin_array,中输,入,B1:B10,。,由于这是数组操作,所以按,Ctrl,shift,组合键,同,时击回车键。则得到总体数据的频数分布。,C1:C10,区域中每个单元格都应显示“,20”,。,在单元格,C11,中单击自动求和,钮,在编辑栏中,确认显示,SUM(C1:C10),后,敲回车键,则自动求,和为,200,。,上一页,下一页,返回本节首页,17,2,建立直方图,在“插入”菜单中选择“图表”选项,打开“图表向导”对话,框如下图所示,进入向导第,1,步。,上一页,下一页,返回本节首页,18,在“图表类型”列表中选择“柱形图”,在“子图,表类型”中选择“簇状柱形图”单击“下一步”按,钮,进入第,2,步。,在图表源数据对话框窗口中,在数据区域页,面下输入,B1,:,C10,。,单击“系列”页面,在“系列”选项对话框中删,除“系列,1”,,保留“系列,2,,则对话框中显示,10,个等高柱,但,X,轴为,1,、,2,、,3,、等如下图所示。,上一页,下一页,返回本节首页,19,上一页,下一页,返回本节首页,20,在“分类(,X,)轴标志中输入“,B1,:,B10”,,这时对话窗口柱形图的,X,轴为,10,、,20,、,30,等如图所示。单击“下一步”按钮。,上一页,下一页,返回本节首页,21,在图表选项对话框中,打开“图例”页面,取消图例,单 击”完成“按钮”,得柱形图如图所示。,上一页,下一页,返回本节首页,22,3,计算均匀分布总体的均值和标准差,在单元格,B13,中输入“均值”,在单元格,C13,中输入,公式“,=AVERAGE(A1:A200)”,,按回车键显示值为,50.3,。,在单元格,B14,中输入“标准差”,在单元格,C14,中输,入公式“,=StDEVP(A1:A200)”,,按回车键显示数值,为,28.86715,。,上一页,下一页,返回本节首页,23,4,从均匀分布总体中抽样,打开“第,3,章 抽样分布,.xls”,工作簿,选择“样本”工,作表。,选定,A1:AD1,区域,从“插入”菜单中选择“函数”,选项,打开“粘贴函数”对话框,在“函数分类”列表中选择“查找与引用”,在“函数,名”列表中选择“索引函数,INDEX”,,单击“确定”按,钮,打开索引函数中“选定参数”对话框。,上一页,下一页,返回本节首页,24,在“选定参数”对话窗口中选择第一行数组引用,(array,row_num,column_num),,单击“确定”按钮,打开索引函数,INDEX,对话框如下。,上一页,下一页,返回本节首页,25,在“,Array”,中输入“总体,!$A$1:$A$200”,。,在“,Row_num”,中输入嵌套公式,“,CEILING(200*RAND(),1)”,,按住,Ctrl+Shift,组合,键,单击“确定”按钮。,在单元格,AE1,中输入“均值”。,选定单元格,AF1,,输入公式,“,=AVERAGE(A1:AD1)”,,敲回车键。,按,F9,键。,AF1,单元格中出现的值应接近,50,。重复,按这个键,数值虽有所变化,但仍接近,50,。,上一页,下一页,返回本节首页,26,3.2,总体分布与抽样分布,3.2.1,总体分布与抽样分布之间的关系,3.2.2,检验总体分布与抽样分布的关系,上一页,下一页,返回本章首页,27,3.2.1,总体分布与抽样分布之间的关系,样本均值抽样分布的均值等于总体均值:,样本均值抽样分布的方差等于总体方差除以样本容量的平方根:,n,x,V,x,2,2,),(,s,s,=,=,m,=,),(,x,E,上一页,下一页,返回本节首页,28,3.2.2,检验总体分布与抽样分布的关系,打开“第,3,章 抽样分布,.xls”,工作簿,选择“样本”工,作表。,在单元格,AG1,中输入“抽样分布与总体分布”,单,元格,AG3,中输入“总体分布”,单元格,AG4,中输入,“抽样分布”,单元格,AH2,中输入“均值”,单元格,AJ2,中输入“标准误差”。,上一页,下一页,返回本节首页,29,在单元格,AH3,中输入从“总体”工作表中的总体均,值,其公式是“总体,!C13”,。,在单元格,AJ3,输入公式“,=,总体,!C14,SQRt(30)”,,,显示值为,5.27039,,计算标准误差。,在单元格,AH4,中输入公式,“,=AVERAGE(AF1:AF1000)”,,以计算,AF1:AF1000,范围内随机样本均值的均值。,上一页,下一页,返回本节首页,30,在单元格,AJ4,中输入公式“,=StDEV(AF1:AF1000)”,,计算,AF1:AF1000,范围内样本均值的标准差,结果如图所示:,上一页,下一页,返回本节首页,31,3.3,中心极限定理,3.3.1,中心极限定理的内容,3.3.2,均匀分布与正态分布,3.3.3,非均匀分布与正态分布,3.3.4,偏态分布与正态分布,上一页,下一页,返回本章首页,32,3.3.1,中心极限定理的内容,中心极限定理是指从总体中抽取样本容量为,n,的样本,当样本容量足够大时,其统计量的分布可用正态概率分布近似。,上一页,下一页,返回本节首页,33,上一页,下一页,返回本节首页,34,上图中,在图的上部分中,三个总体分别为均匀分布、,U,形分布和,J,形分布,即都是非正态的。,随着样本容量的增加,抽样分布开始发生变化。,当样本容量为,2,时,抽样分布开始呈现与总体分布不同的外形;,当样本容量为,5,时,抽样分布开始呈现一个钟形;,当样本容量为,30,时,三个抽样分布近似于同一种分布,即正态分布。,因而,当样本容量足够大时,抽样分布可用正态概率分布近似。,上一页,下一页,返回本节首页,35,3.3.2,均匀分布与正态分布,1.,均匀分布的抽样分布,打开“第,5,章 抽样分布,.xls”,工作簿,选择“样本”工,作表,此时工作表中的数据为上面的抽样结果。,在单元格,AG9,中输入“变量值”,在,AH9,中输入“均,匀总体的抽样分布”。,在单元格,AG10,中输入,5,,敲回车键。,上一页,下一页,返回本节首页,36,选定单元格,AG10,,在“编辑”菜单中选择“填充”选项中的“序列”,打开“序列”对话框如图所示。,上一页,下一页,返回本节首页,37,在“序列产生在”框中选择“列”,步长值为,5,,终止值为,100,,单击“确定”按钮,则在,AG10,:,AG29,区域中得到变量值。,选定,AH10,:,AH29,,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框如图,5.7,所示。,上一页,下一页,返回本节首页,38,在“函数分类”列表中选择“统计”,在“函数名”列表,中选择“频数分布”函数,单击“确定”按钮,打开频,数分布函数对话框如下图所示。,上一页,下一页,返回本节首页,39,在,Data_array,中输入“,AF1,:,AF1000”,,在,Bins_array,中输入“,AG10:AG29”,。按,Ctrl+Shift,组合键,同时单击“确定”按钮,可得均匀分布的抽样分布如下图所示。,上一页,下一页,返回本节首页,40,2,构建正态分布,打开“第,5,章 抽样分布,.xls”,工作簿,选择“样本”工作表,此时工作表中的数据为,5.1.4,中的抽样结果。,在单元格,AI9,输入“正态分布。,选定单元格,AI10,,输入“,1000*”,,在“插入”菜单中选择“函数”选项,打开“粘贴函数”对话框,在“函数分类”列表中选择“统计”,在“函数名”列表中选择“正态分布,NORMDISt”,函数。单击“确定”按钮,打开正态分布函数,NORMDISt,对话框。,上一页,下一页,返回本节首页,41,在“,x”,中输入,AG11,,在“,Mean”,中输入总体均值,$AH$3,,,并绝对引用,在“,Standard_dev”,中输入均匀总体抽样分,布的标准误差,$AI$3,,并绝对引用。,上一页,下一页,返回本节首页,42,在“,Cumulative”,中输入,1,,表示使用累积分布函数。单击“确定”按钮。,计算两个累计正态概率的差,其计算公式与,AI10,相似。选定,AI11,单元格,输入公式:,=1000*NORMDISt(AG11,$AH$3,$AI$3,1)-,1000*NORMDISt(AG10,$AH$3,$AI$3,1),敲回车键。,把,AI11,单元格的公式复制到,AI12:AI29,各单元格中。,可以看到变量值,3565,之间出现的概率比较大。,上一页,下一页,返回本节首页,43,3,均匀总体抽样分布与正态分布的比较,在“插入”菜单中选择“图表”选项,打开“图表向导”对话框。,单击“自定义类型”页面,选择“线,-,柱”图,单击“下一步”按钮。进入第,2,步“图表源数据”对话框。,在数据区域中输入“,=,样本,!$AG$9:$AI$29”,,单击“系列”页面,在“分类,X,轴标志”中输入“,=,样本,!$AG$9:$AG$29”,作为横轴,在“系列”中删除“变量值”系列,保留“均匀分布抽样分布”和“正态分布”。单击“下一步”按钮。,上一页,下一页,返回本节首页,44,上一页,下一页,返回本节首页,45,在第,3,步“图表选项”对话框中,单击“图例”页面,将图,例置于底部。单击“下一步”,单击“完成”按钮,得到,图如下。,上一页,下一页,返回本节首页,46,3.3.3,非均匀分布与正态分布,1,构建非均匀总体,打开“第,5,章 抽样分布,.xls”,工作簿,选择“非均匀总体”工作表,接,5.1.1,的数据处理结果。,在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框。单击选择“随机数发生器”,打开对话框如图所示。,上一页,下一页,返回本节首页,47,上一页,下一页,返回本节首页,48,由于要构造一个非均匀分布,所以要分两次生成随机数。,在“变量个数”区域中输入,1,,在“随机数个数”区域中输入,100,。,在“分布”中选择“均匀”。,在参数下输入,020,,随机数发生器将会产生,020,之间的数。,在输出选项下选择“输出区域”,输入,A1,作为随机数的起点,单击“确定”按钮,,A1,:,A100,将被填满均匀分布的随机数。,上一页,下一页,返回本节首页,49,下面生成非均匀分布的第二部分,即产生一个数值位于,80100,的均匀分布。,在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框。单击选择“随机数发生器”,打开对话框。,在对话框中只需改变,2,处,一是“参数”改为从,80,100,,二是“输出区域”的起点改为,A101,,这样所生成的范围在,80-100,的随机数便会放置在,A101,以后的单元格中。,上一页,下一页,返回本节首页,50,由于非均匀总体中没有,20,80,的值,所以直方图中只有,4,个条,左边,2,条,右边,2,条,上一页,下一页,返回本节首页,51,2,抽样分布与正态分布的比较,打开“非均匀样本”工作表,检查样本均值的直方图。,重复按,F9,,可以看到非均匀总体抽样均值的分布和正态分布非常接近,图中表现的集中趋势也和原来的一样,只是这个总体的标准差比原总体的大。,上一页,下一页,返回本节首页,52,3.3.4,偏态分布与正态分布,1,构造偏态分布,打开“第,3,章 抽样分布,.xls”,工作簿,选择“偏态总体”工作表,与编制非均匀分布相同,需要分几次运行“随机数发生器”来构建偏态分布。,在每次运行“随机数发生器”时,变量个数和均匀分布的选项不变,而随机变量个数、参数和输出地址则要变化。这些变化的选项如下表所示。,上一页,下一页,返回本节首页,53,运行次数,随机变量个数,参数起点,参数终点,输出区域,1,20,0,20,A1,2,40,20,40,A21,3,60,40,60,A61,4,80,60,80,A121,根据上表的各项要求,运行,4,次“随机数发生器”,便可构建偏态总体。,上一页,下一页,返回本节首页,54,上一页,下一页,返回本节首页,55,2,偏态总体抽样分布与正态分布比较,打开“偏态样本”工作表,检查样本均值的直方图。,上一页,下一页,返回本节首页,56,3.4,t,分布,3.4.1,t,分布与,t,分布函数,3.4.2,t,分布与正态分布之间的关系,上一页,下一页,返回本章首页,57,3.4.1,t,分布与,t,分布函数,样本统计量的抽样分布,并不完全服从正态分布,而是服从与正态分布相似的,t,分布。,当样本容量不大于,30,,而且总体标准差未知时,可以使用,t,分布。,t,分布为对称分布。,对于不同的样本容量都有一个不同的,t,分布,随着样本容量增加,,t,分布的形状由平坦逐渐变得接近正态分布。,当样本容量大于,30,时,,t,分布就非常接近于正态分布。,上一页,下一页,返回本节首页,58,1,t,分布函数,tDISt,t,分布分函数用在一定的自由度和显著水平下得出,t,分布的概率面积。,t,分布适用于小样本数据的假设检验。,t,分布的语法结构为:,tDISt(x,deg_freedom,tails),其中:,X,为需要计算分布的数值;,Deg_freedom,为自由度;,tails,指明分布函数是单侧分布还是双侧分布。,上一页,下一页,返回本节首页,59,2,t,分布反函数,tINV,t,分布反函数可以根据概率返回某定自由度的,t,分布值。其语法结构为:,tINV(probability,deg_freedom),其中:,Probability,为对应于双侧,t,分布的概率;,Deg_freedom,为,t,分布的自由度。,上一页,下一页,返回本节首页,60,3.4.2,t,分布与正态分布之间的关系,1.,计算概率,打开“第,5,章 抽样分布,.xls”,工作簿,选择“,t,分布”工作表。,上一页,下一页,返回本节首页,61,在单元格,E1,中输入“,10”,。,在单元格,B2,中输入标准正态分布函数公式“,=NORMSDISt(A2)”,,用来确定一个小于,A2,单元格变量值的标准正态变量的概率,此值为,3.17E-0.5,。,在单元格,C2,输入,t,分布函数公式“,=tDISt(ABS(A2),$E$1,1)”,,这个公式是以单元格,A2,的绝对值为变量,以单元格,E1,的数值为自由度的单侧,t,分布的概率,此值是,0.001259166,。,上一页,下一页,返回本节首页,62,在单元格,B3,,输入公式“,=NORMSDISt(A3)-NORMSDISt(A2)”,,用来计算单元格,A3,与单元格,A2,之间的正态分布概率。,在单元格,C3,中输入公式“,=tDISt(ABS(A3),$E$1,1)-tDISt(ABS(A2),$E$1,1)”,,用来计算单元格,A2,到单元格,A3,之间的,t,分布的概率。注意这个公式中的单元格,E1,是绝对引用,这样便于复制公式。单元格,C3,中显示为,0.000221338,。,上一页,下一页,返回本节首页,63,将单元格,B3,与,C3,中的公式复制至第,82,行。找到第,38,行,单元格,A38,应显示,-0.4,,,B38,应显示,0.036041,,,C38,应显示,0.034837,。如果正确,便可以拟合两种图形了。,单击单元格,C43,,在其公式前面加上绝对值函数,以避免出现负值。其公式为:,=ABS(tDISt(ABS(A43),$E$1,1)-,tDISt(ABS(A42),$E$1,1),并复制此公式到,C44:C82,中的各单元格中。,上一页,下一页,返回本节首页,64,2,绘制图形,打开“第,5,章 抽样分布,.xls”,工作簿,选择“,t,分布”工作表。,在“插入”菜单中选择“图表”选项,打开“图表向导”对话框。,在第,1,步的“图表类型”中选择“折线图”,在“子图表类型”中选择“数据点折线图”,单击“下一步”按钮。,在第,2,步“图表源数据”对话框中,在数据区域输入,A1:C82,。打开“系列”页面,在系列中删除“变量值”,在分类,X,轴标志中输入“,=t,分布,!$A$2:$A$82”,,单击“下一步”按钮。,上一页,下一页,返回本节首页,65,在步骤,3,的“图表选项”对话框中,不选标题,打开“图例”页面,选择图例在底部,上一页,下一页,返回本节首页,66,在单元格,E1,中分别输入,8,,,5,,,2,,,1,,可以看出随着自由度的值变小,两个分布的差异便更加明显。,在单元格,E1,中分别输入,20,,,100,,,1000,,,10000,和,100000,,可以看到随着自由度的增加,两个分布的差异逐渐变小,甚至相同。,所以,结论是随着自由度增加,,,t,分布将越来越接近于正态分布。,上一页,下一页,返回本节首页,67,
展开阅读全文