收藏 分销(赏)

第八章 抽样推断.ppt

上传人:xrp****65 文档编号:13134396 上传时间:2026-01-25 格式:PPT 页数:53 大小:411.50KB 下载积分:10 金币
下载 相关 举报
第八章 抽样推断.ppt_第1页
第1页 / 共53页
第八章 抽样推断.ppt_第2页
第2页 / 共53页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第八章 抽样推断,本章学习目的与要求,第一节 抽样推断的一般问题,第二节 抽样误差,第三节 抽样估计方法,第四节 抽样组织设计,下,一页,返回本节首页,本章学习目的与要求,目的:,学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。,要求:,明确抽样调查的概念、特点、作用;,理解抽样误差的影响因素;,掌握抽样平均误差的计算方法;,掌握抽样估计方法与样本容量确定的方法;,理解类型抽样、等距抽样、整群抽样的含义、特点,与适用场合。,上一页,下,一页,返回本节首页,第一节 抽样推断的一般问题,一、抽样推断的概念,二、抽样推断的特征,三、抽样推断的内容,四、有关抽样的基本概念,上一页,下,一页,返回本节首页,一、抽样推断的概念,抽样推断,是根据随机原则从总体中抽取部分总体单位,以这一部分总体单位的实际数据推算总体相应数量特征的一种统计分析方法。,随机原则,是指在抽样调查中,使每一个单位被抽中的概率都相等且不等于零。,随机抽样,的目的是使样本与总体同分布。,上一页,下,一页,返回本节首页,二、抽样推断的特征,(一)是由部分推算整体的一种认识方法;,(二)按随机原则抽取样本;,(三)运用概率估计的方法;,(四)抽样推断的误差可以事先计算并加以,控制。,上一页,下,一页,返回本节首页,三、抽样推断的内容,(一)抽样估计,抽样估计,是通过以样本数据对总体某一未知数量特征进行估计的一种统计分析方法。,(二)假设检验,假设检验,是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。,上一页,下,一页,返回本节首页,四、有关抽样的基本概念,(一)总体和样本,(二)样本容量和样本个数,(三)参数和统计量,(四)重复抽样和不重复抽样,上一页,下,一页,返回本节首页,(一)总体和样本,总体,总体又称母体或全及总体,它是指所要认识的,具有某种共同性质的许多单位的集合体,也就是研究对象的全体。总体单位数一般用“,N”,表示。,样本,样本又称子样或总体样本,是从全及总体中抽取并进行观察,代表全及总体的那部分单位的集合体。样本单位数一般用“,n”,表示。,上一页,下,一页,返回本节首页,(二)样本容量和样本个数,1,样本容量,样本容量是指样本所包含的单位数。,2,样本个数,样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。,对于一次抽样调查,总体是唯一确定的,而样本却是不确定的,一个全及总体可能抽出很多个样本总体。,上一页,下,一页,返回本节首页,(三)参数和统计量,根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为,全及指标,。全及指标是总体变量的函数,其数值是确定的、惟一的,因此称为参数。,根据样本各单位标志值或标志属性计算的,反映样本数量特征的综合指标称为,样本指标,。样本指标是样本变量的函数,用来估计总体参数,因此也称统计量,其值随着样本的不同而不同,因此统计量是个随机变量。,上一页,下,一页,(,1,)常用的参数,(,2,)常用统计量,a.,平均数:,成数:,b.,方差:,成数方差:,常用的参数和统计量,上一页,下,一页,返回本节首页,(四)重复抽样和不重复抽样,1.,重复抽样,从,N,个单位中每次抽取,1,个,抽取后将其号码记下,再放回,一直抽取,n,个单位组成一个样本,这样的抽样方法称为重复抽样。,2.,不重复抽样,从,N,个单位中每次抽取,1,个,抽取后不放回,一直抽取,n,个单位组成一个样本这样的抽样方法称为不重复抽样。,上一页,下,一页,返回本节首页,第二节 抽样误差,一、抽样误差的概念及影响因素,二、抽样平均误差,三、抽样极限误差,上一页,下,一页,返回本节首页,一、抽样误差的概念及影响因素,(,一)抽样误差的概念,指由于抽样的随机性而造成样本指标与总体参数之间的误差,这种误差是抽样调查所固有的、不可避免的,也叫随机误差。,(二)抽样误差的影响因素,1.,总体各单位标志值的差异程度:差异越大,抽样误差越大;,2.,样本的单位数:单位数越多,抽样误差越小;,3.,抽样的方法:重复抽样的抽样误差比不重复抽样的大;,4.,抽样调查的组织形式,:,不同的组织方式有不同的抽样误差,上一页,下,一页,返回本节首页,二、抽样平均误差,(一)什么是抽样平均误差,抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了抽样指标与总体指标的平均离差程度,通常用抽样平均数的标准差来衡量。,(二)抽样平均误差的计算,1.,重复抽样的条件下,2.,不重复抽样的条件下,上一页,下,一页,返回本节首页,1.,重复抽样的条件下,式中,,n,为样本容量;,为总体标准差,一般情况下是未知,可用样本标准差替代,。,式中,,n,为样本容量;,为总体成数标准差,一般情况下是未知,可用样本成数标准差替代,。,上一页,下,一页,返回本节首页,2.,不重复抽样的条件下,式中,,N,为总体单位数;,n,为样本容量;,X,2,为总体方差,一般情况下是未知,可用样本方差替代,x,2,式中,,N,为总体单位数;,n,为样本容量;,P,2,为总体成数方差一般情况下是末知,可用样本成数方差替代,p,2,。,上一页,下,一页,返回本节首页,三、抽样极限误差,抽样极限误差是指样本指标与全及指标之间的误差范围。即:,或,如果抽样极限误差用抽样平均误差来衡量,则有:,或,即,抽样极限误差是抽样平均误差的多少倍。我们把倍数,t,称为抽样误差的概率度,上一页,下,一页,返回本节首页,第三节 抽样估计方法,一、总体参数的点估计,二、总体参数的区间估计,三、样本容量的确定,上一页,下,一页,返回本节首页,一、总体参数的点估计,(一)参数点估计的基本特点,(二)抽样估计的优良标准,(三)抽样估计的置信度,上一页,下,一页,返回本节首页,(一)参数点估计的基本特点,基本特点:,根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。,例如,样本平均值作为相应总体平均数的估计值;以抽样调查所获得的人口结构代表总体的人口结构等。,上一页,下,一页,返回本节首页,(二)抽样估计的优良标准,无偏性,作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为无偏估计量。,有效性,即方差越小的估计量就越有效,.,以抽样指标估计总体指标,要求作为优良估计量的方差应比其它估计量的方差小。,一致性,亦称相合性,是指当,n,时,估计量依概率收敛于总体参数的真值,即,作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。,上一页,下,一页,返回本节首页,(三)抽样估计的置信度,抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率的概率保证程度。,置信度一般用“,1-”,表示区间估计的可靠程度或把握程 度,也即所估计区间包含总体真值的可能性。,例如,“在,95%,置信度下,样本平均身高与总体平均身高的误差为,5cm”,表示在很多次抽样中,样本平均身高与总体平均身高相差小于,5cm,的抽样次数占总抽样次数的,95%,。,上一页,下,一页,置信度与概率度的之间关系:,因此,可以通过,正态分布概率表,获得。,上一页,下,一页,返回本节首页,二、总体参数的区间估计,(一)区间估计的基本特点及要素,(二)总体平均数,(,成数,),的区间估计,上一页,下,一页,返回本节首页,(一)区间估计的基本特点及要素,区间估计的基本特点,根据给定的概率保证度,利用实际抽样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。,区间估计必须具备的三个要素,(,1,)估计值,(,2,)抽样误差范围,(,3,)概率保证程度,上一页,下,一页,返回本节首页,(二)总体平均数,(,成数,),的区间估计,表,达,式,其中,为极限误差,其中,为极限误差,上一页,下,一页,返回本节首页,1.,计算抽样平均数和标准差,或抽样成数平均数和成数标准差,2.,计算抽样平均误差,5,.,结论,3,.,计算,极限误差,4,.,计算,区间的上下限,总体均值(成数)区间估计的一般步骤,上一页,下,一页,返回本节首页,1.,计算抽样平均数和标准差:,如果总体标准差末知,则用样本标准差代替,对于大样本用,对于小样本用,(1),平均数,(2),标准差,上一页,下,一页,返回本节首页,计算抽样平均数和标准差,1.,计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,或,(1),平均数,如果总体标准差末知,则用样本标准差代替,(2),标准差,上一页,下,一页,返回本节首页,1.,计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,重复抽样:,2.,计算抽样平均误差:,不重复抽样:,N,很大时,上一页,下,一页,返回本节首页,计算抽样平均误差,计算,极限误差,1.,计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,3,.,计算,极限误差:,2.,计算平均误差:,注意:如果给定的是置信度,则可查,正态分布概率表,获得。,上一页,下,一页,返回本节首页,计算区间的上下限,1.,计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,2.,计算平均误差:,4,.,计算,区间的上下限:,3,.,计算,极限误差:,或,上一页,下,一页,返回本节首页,结论,1.,计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,2.,计算平均误差:,5,.,结论,3,.,计算,极限误差:,4,.,计算,区间的上下限:,如:可以在,1-,的概率保证程度下,估计*在*之间,。,如果给定的是概率度,则可查,正态分布概率表,获得。,这是上面所计算的上下限,上一页,下,一页,返回本节首页,例:某灯泡厂某月生产,5000000,个灯泡,在进行质量检查中,,随机抽取,500,个进行检验,这,500,个灯泡的耐用时间见下表:,耐用时间,(,小时,),灯泡数,800850,35,850900,127,900950,185,9501000,103,10001050,42,10501100,8,试求:,该厂全部灯泡平均耐用时间的取值范围(概率保证程度,0.9973,),检查,500,个灯泡中不合格产品占,0.4%,,试在,0.6827,概率保证下,估,计全部产品中不合格率的取值范围。,解:,计算平均数与标准差,计算抽样平均误差,计算抽样极限误差,(,由概率保证程度,0.9973,,查表得概率度,t=3),估计总体指标区间,在,99.73%,概率保证程度下,估计该厂全部灯泡平均耐用时间,在,919,933.8,小时之间。,p=0.4%,概率保证程度为,0.6827,时,,t=1,在,68.27%,概率保证下,估计全部产品中不合格率,在,0.12%,0.68%,之间。,三、样本容量的确定,(一)确定适当样本容量的意义,(二)简单随机抽样下样本容量的确定,上一页,下,一页,返回本节首页,(一)确定适当样本容量的意义,1.,在一定的误差允许下,样本容量太大,则,会增大工作量,造成人力、财力和时间的,浪费。,2.,如果改变了对误差的要求,则可以通过增,减样本容量来控制抽样误差的大小。,上一页,下,一页,返回本节首页,(二)简单随机抽样下样本容量的确定,1.,对于重复抽样:,由于,2.,对于不重复抽样:,由于,上一页,下,一页,返回本节首页,【,例,】,某药厂为检查瓶装药片数量,随机抽取,100,瓶,结果平均每瓶,101.5,片,标准差为,3,片。试以,99.73%,的概率保证程度推断成品库该种药平均每瓶数量的区间。如果允许误差减少到原来的一半,其他条件不变,问需抽取多少瓶?,解:,上一页,下,一页,返回本节首页,【,例,】,一家广告公司想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为,1800000,元。如置信度取,95%,,并要使估计处在总体平均值附近,500,元的范围内,这家广告公司应抽多大的样本?,解,:,已知,2,=1800000,,,=0.05,,,t=1.96,,,=500,上一页,下,一页,返回本节首页,第四节 抽样组织设计,一、抽样组织设计的基本原则,二、几种常用的抽样组织形式,上一页,下,一页,返回本节首页,一、抽样组织设计的基本原则,(一)随机原则,抽取样本单位时,应确保每个总体单位都有被抽取的,可能;在对样本单位的资料进行搜集和整理时,不能随,意遗漏或更换样本单位。,(二)抽样误差最小,在其他条件相同的情况下,选择抽样误差最小的方案。,(三)费用最少,在其他条件相同的情况下,选择费用最少的方案。,上一页,下,一页,返回本节首页,二、抽样组织形式,(一)简单随机抽样,(二)等距抽样,(,三,),类型抽样,(四)整群抽样,上一页,下,一页,返回本节首页,(一)简单随机抽样,1,简单随机抽样(纯随机抽样),对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本,应用,仅适用于规模不大、内部各单位标志值差异较小的总体,是最简单、最基本、最符合随机原则,,但同时也是抽样误差最大的抽样组织形式,上一页,下,一页,返回本节首页,(,二,),等距抽样(机械抽样或系统抽样),将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。,随机起点,半距起点,对称起点,(总体单位按某一标志排序),按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。,上一页,下,一页,返回本节首页,(,三,),分层抽样(类型抽样),将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。,总体,N,样本,n,等额抽取,等比例抽取,最优抽取,能使样本结构更接近于总体结构,提高样本的,代表性;能同时推断总体指标和各子总体的指标,上一页,下,一页,返回本节首页,(,四,),整群抽样,将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本,即对抽中“群”中的所有单位都进行调查。,例:总体群数,R=16,样本群数,r=4,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,样本容量,简单、方便,能节省人力、物力、财,力和时间,但其样本代表性可能较差,上一页,下,一页,返回本节首页,练习:,从一批元件中按简单随机重复抽样抽取,100,件产品进行检验,结果发现,10,件不合格品。要求:在,95.45%,的概率保证程度下(,t=2,)估计该批元件合格率的区间范围;当允许误差不变,概率保证程度提高到,99.73%,(,t=3,)时,这时应抽取多少元件进行检验?,某工厂,5000,名职工中,不重复随机抽选,2%,的职工调查每月手机话费,所得分配数列如下表,试以,95.45%,的可靠性:,估计总体平均每月的话费的区间范围;,估计总体每月话费在,80,元及以上的职工比重区间范围。,手机花费(元),职工人数占全部职工总数的比重(,%,),0,40,10,40,80,30,80,120,40,120,160,15,160,以上,5,合计,100,3.,某乡,2005,年播种小麦,2000,亩,随机重复抽样调查其中,100,亩,测得平均亩产,800,斤,标准差为,50,斤。要求:,计算抽样平均亩产量的抽样平均误差;,概率度为,0.9973,(,t=3,)的条件下,平均亩产量的可能范围;,概率度为,0.9973,的条件下,,2000,亩小麦总产量的可能范围。,Thank you very,much,!,上一页,结束放映,返回首页,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 环境建筑 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服