ImageVerifierCode 换一换
格式:PPT , 页数:80 ,大小:1.05MB ,
资源ID:1886483      下载积分:16 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/1886483.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(第2章简单随机抽样.ppt)为本站上传会员【a199****6536】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

第2章简单随机抽样.ppt

1、第第2章章 简单随机抽样简单随机抽样1精选精选2.1 简单随机抽样的概念简单随机抽样的概念n简单随机抽样(简单随机抽样(Simple Random Sampling,SRS):从容量为):从容量为N的总体中的总体中抽取一个容量为抽取一个容量为n的样本,若所有可能的的样本,若所有可能的 个样本中的每一个被抽到的概率都相等,即个样本中的每一个被抽到的概率都相等,即每个可能样本被抽中的概率均为每个可能样本被抽中的概率均为 ,这,这种抽样方法称为不放回的简单随机抽样,简种抽样方法称为不放回的简单随机抽样,简称称简单随机抽样简单随机抽样,所得的样本称为不放回的,所得的样本称为不放回的简单随机样本,简称简

2、单随机样本,简称简单随机样本简单随机样本2精选精选n简单随机抽样的实施方法:将总体中的单元简单随机抽样的实施方法:将总体中的单元依次从依次从1到到N进行编号,然后利用抽签法或随进行编号,然后利用抽签法或随机数法来进行简单随机抽样机数法来进行简单随机抽样n抽签法抽签法:一般用于总体所含单元不多的情况,:一般用于总体所含单元不多的情况,首先做首先做N个签并依次写上个签并依次写上1至至N的号码,然后的号码,然后将签充分混合均匀,再一次抽取其中的将签充分混合均匀,再一次抽取其中的n个个签或逐个不放回地抽取签或逐个不放回地抽取n个签,则编号为这个签,则编号为这n个签上的号码的单元就构成一个简单随机样个签

3、上的号码的单元就构成一个简单随机样本本3精选精选n随机数法随机数法:产生:产生n个在个在1,2,N中离散均匀分中离散均匀分布的随机整数(舍去重复的或大于布的随机整数(舍去重复的或大于N的数),的数),编号为这编号为这n个随机整数的单元就构成一个简个随机整数的单元就构成一个简单随机样本单随机样本(1)随机数骰子)随机数骰子(2)随机数表)随机数表n简单随机抽样是其他抽样方法的基础,其理简单随机抽样是其他抽样方法的基础,其理论最容易处理也最为成熟,在抽样理论中占论最容易处理也最为成熟,在抽样理论中占有重要的地位;效率一般比较高,但当总体有重要的地位;效率一般比较高,但当总体单元比较多时不容易实施,

4、且有时精度不高单元比较多时不容易实施,且有时精度不高4精选精选n引理引理2.1.1 从容量为从容量为N的总体中抽取一个容量的总体中抽取一个容量为为n的简单随机样本,则总体中每个特定单的简单随机样本,则总体中每个特定单元的入样概率为元的入样概率为n/N,总体中每两个特定单,总体中每两个特定单元的入样概率为元的入样概率为注:简单随机抽样是一种不放回的等概率抽样方法注:简单随机抽样是一种不放回的等概率抽样方法5精选精选n引理引理2.1.2 从容量为从容量为N的总体中抽取一个容量的总体中抽取一个容量为为n的简单随机样本,对总体中每个单元引的简单随机样本,对总体中每个单元引入一个随机变量:入一个随机变量

5、则:则:其中:其中:称为抽样比称为抽样比6精选精选2.2 总体均值与总体总值的简单估计总体均值与总体总值的简单估计n从容量为从容量为N的总体中抽取一个容量为的总体中抽取一个容量为n的简单的简单随机样本,对某个指标随机样本,对某个指标Y,总体中,总体中N个单元个单元的指标值用的指标值用 来表示,样本中来表示,样本中n个单个单元的指标值用元的指标值用 来表示,则:来表示,则:(注:这里的(注:这里的 为定量,为定量,为随机变量)为随机变量)指标指标Y的的总体均值总体均值为为指标指标Y的的样本均值样本均值为为7精选精选指标指标Y的的总体总值总体总值为为指标指标Y的的样本总值样本总值为为指标指标Y的

6、的总体方差总体方差为为指标指标Y的的样本方差样本方差为为8精选精选显然有:显然有:9精选精选n如果还有一个指标如果还有一个指标X,N个总体单元的指标值个总体单元的指标值为为 ,n个样本单元的指标值为个样本单元的指标值为指标指标X的总体均值和样本均值分别为的总体均值和样本均值分别为指标指标X的总体总值和样本总值分别为的总体总值和样本总值分别为10精选精选指标指标X的总体方差和样本方差分别为:的总体方差和样本方差分别为:指标指标Y与与X的的总体协方差总体协方差为为指标指标Y与与X的的样本协方差样本协方差为为11精选精选同样有:同样有:12精选精选n在简单随机抽样中,称在简单随机抽样中,称 为为总体

7、均值总体均值 的简单估计量的简单估计量,称,称 为为总体总值总体总值 的简的简单估计量单估计量n定理定理2.2.1 在简单随机抽样中,在简单随机抽样中,分别是分别是 的无偏估计量,即的无偏估计量,即n定理定理2.2.2 在简单随机抽样中,估计量在简单随机抽样中,估计量 的的方差分别为方差分别为13精选精选注注1:的精度随着样本量的增加而提高,随着总体的精度随着样本量的增加而提高,随着总体方差即总体变异程度的增加而降低方差即总体变异程度的增加而降低注注2:1-f称为称为有限总体校正系数有限总体校正系数(finite population correction,简记为,简记为fpc),当抽样比),

8、当抽样比f很小时,很小时,1-f就接近于就接近于1,这样抽样比对,这样抽样比对 的精度就没有直接影的精度就没有直接影响;一般地,当抽样比小于响;一般地,当抽样比小于5%,甚至小于,甚至小于10%时,时,fpc可以忽略不计,即认为可以忽略不计,即认为1-f为为1;事实上略去;事实上略去fpc的影响是使的影响是使 高了一些高了一些注注3:中的中的 一般是未知的,因此需要通一般是未知的,因此需要通过样本进行估计过样本进行估计14精选精选n定理定理2.2.3 在简单随机抽样中,样本方差在简单随机抽样中,样本方差 是总体方差是总体方差 的无偏估计量,样本协方差的无偏估计量,样本协方差 是总体协方差是总体

9、协方差 的无偏估计量的无偏估计量n推论推论2.2.1 在简单随机抽样中,在简单随机抽样中,是是 的无偏估计量的无偏估计量 是是 的无偏估计量的无偏估计量注:把注:把 分别作为分别作为 的估计的估计量,都称为量,都称为标准差估计量标准差估计量15精选精选n 当当n充分大时,可以认为:充分大时,可以认为:的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:它们分别可以用它们分别可以用 来估计来估计16精选精选n书上书上P36例例2-3n例例1 为估计某中学为估计某中学200名新生的平均身高,用简

10、单名新生的平均身高,用简单随机抽样的方法抽取随机抽样的方法抽取10名进行测量,得数据如下:名进行测量,得数据如下:158,149,156,153,160,151,157,145,152,159(单位为(单位为cm),求平均身高的置信度为),求平均身高的置信度为90%的置信区间。的置信区间。n例例2 从一个有从一个有14848户居民的某区中抽取一个户居民的某区中抽取一个30户户的简单随机样本,样本中每户的人数为:的简单随机样本,样本中每户的人数为:5,6,3,3,2,3,3,3,4,4,3,2,7,4,3,5,4,4,3,3,4,3,3,1,2,4,3,4,2,4,试,试估计该区居民总数及其标准

11、差。估计该区居民总数及其标准差。17精选精选n习题习题2.5,2.6作作 业业18精选精选2.3 总体比例的估计总体比例的估计n从容量为从容量为N的总体中抽取一个容量为的总体中抽取一个容量为n的简单的简单随机样本,用随机样本,用P来表示具有某种特征的总体来表示具有某种特征的总体单元在全体总体单元中所占的比例(简称单元在全体总体单元中所占的比例(简称总总体比例体比例),用),用A来表示具有某种特征的总体来表示具有某种特征的总体单元的数目;相应地,用单元的数目;相应地,用p来表示具有这种来表示具有这种特征的样本单元在全体样本单元中所占的比特征的样本单元在全体样本单元中所占的比例(简称例(简称样本比

12、例样本比例),用),用a来表示具有这种来表示具有这种特征的样本单元的数目特征的样本单元的数目;显然有:;显然有:19精选精选n在简单随机抽样中,用在简单随机抽样中,用 作为作为 的估计量,的估计量,用用 作为作为 的估计量的估计量n定理定理2.3.1 在简单随机抽样中,在简单随机抽样中,是是 的无偏的无偏估计量,估计量,是是 的无偏估计量,即的无偏估计量,即n定理定理2.3.2 在简单随机抽样中,估计量在简单随机抽样中,估计量 的的方差分别为方差分别为其中其中20精选精选n定理定理2.3.3 在简单随机抽样中,在简单随机抽样中,是是 的无偏估计量的无偏估计量 是是 的无偏估的无偏估 计量,其中

13、计量,其中21精选精选n 当当n充分大时,充分大时,的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:22精选精选n可以用可以用 分别作为分别作为的估计的估计23精选精选n例例 从有从有15786位老人的某地区按简单随机抽样的位老人的某地区按简单随机抽样的方法抽取方法抽取525位老人,调查每位老人的性别及生活位老人,调查每位老人的性别及生活能否自理,结果如下表:能否自理,结果如下表:(1)估计该地区男性老人的比例并估计标准差;)估计该地区男性老人的比例并估计标准差;(2)估计该地区生活不能

14、自理的老人的比例并估计)估计该地区生活不能自理的老人的比例并估计标准差;标准差;(3)估计该地区生活不能自理的女性老人的人数,)估计该地区生活不能自理的女性老人的人数,并以并以95%的置信度对其作区间估计。的置信度对其作区间估计。性别性别能否自理能否自理男男女女能能211263不能不能312024精选精选n习题习题2.4n补充题:补充题:有一份共有有一份共有3042个人名和地址的名册中抽选个人名和地址的名册中抽选了一个包含了一个包含200个人名的简单随机样本,查个人名的简单随机样本,查出有出有38个错误地址,试估计这份名册中需要个错误地址,试估计这份名册中需要校正的地址的数目,并求出这个估计的

15、标准校正的地址的数目,并求出这个估计的标准差。差。作作 业业25精选精选2.4 总体比率的估计总体比率的估计n总体比率总体比率是总体中两个指标的均值或总值之是总体中两个指标的均值或总值之比,记为比,记为注:总体比例和总体比率都具有比的形式,但总体比注:总体比例和总体比率都具有比的形式,但总体比例中分母是已知的,分子是分母的一部分;而总体例中分母是已知的,分子是分母的一部分;而总体比率中的分母可以是未知的,并且分子和分母之间比率中的分母可以是未知的,并且分子和分母之间可以没有部分和总体的关系可以没有部分和总体的关系26精选精选n设每个单元都具有两个指标设每个单元都具有两个指标Y和和X,在简单随机

16、抽样中,把在简单随机抽样中,把 作为总体比作为总体比 率率 的估计量的估计量n定理定理2.4.1 在简单随机抽样中,在简单随机抽样中,是是 的近似的近似无偏估计量,即当无偏估计量,即当n足够大时,足够大时,27精选精选n定理定理2.4.2 在简单随机抽样中,当在简单随机抽样中,当n足够大时,足够大时,n 的估计量为:的估计量为:28精选精选注:注:都是有偏的,但它们的偏倚都随都是有偏的,但它们的偏倚都随着着n的增大而减少并趋向于零;此外,当的增大而减少并趋向于零;此外,当 已知时,已知时,之间哪个偏倚更小并没有之间哪个偏倚更小并没有一定的结论,对不同的总体可能会有不同的一定的结论,对不同的总体

17、可能会有不同的结果结果n 的估计量为:的估计量为:29精选精选n 当当 ,且,且 时,时,的置信度为的置信度为 的的近似置信区间近似置信区间的两个端的两个端点为:点为:可用可用 估计估计30精选精选2.5 总体均值与总体总值的比估计总体均值与总体总值的比估计n通常,把需要估计的指标称为通常,把需要估计的指标称为主要指标主要指标,把,把用来帮助主要指标估计的其它指标称为用来帮助主要指标估计的其它指标称为辅助辅助指标指标n在一定条件下,利用辅助指标的信息可以提在一定条件下,利用辅助指标的信息可以提高对主要指标的估计的精度高对主要指标的估计的精度n一般地,辅助指标可以是主要指标的前期资一般地,辅助指

18、标可以是主要指标的前期资料,也可以是表示单元规模的量,或者是单料,也可以是表示单元规模的量,或者是单元的某个易测指标,等等元的某个易测指标,等等31精选精选n如果主要指标如果主要指标Y与辅助指标与辅助指标X之间有正相关关之间有正相关关系,就可以构造比估计量系,就可以构造比估计量n在简单随机抽样中,称在简单随机抽样中,称 为为总体均总体均值值 的比估计量的比估计量,称,称 为为总体总总体总值值 的比估计量的比估计量,其中,其中 必须已知必须已知n定理定理2.5.1 在简单随机抽样中,在简单随机抽样中,是是 的近似的近似无偏估计量,无偏估计量,是是 的近似无偏估计量,即的近似无偏估计量,即当当n足

19、够大时,足够大时,32精选精选n定理定理2.5.2 在简单随机抽样中,当在简单随机抽样中,当n足够大时,足够大时,33精选精选n 的估计量分别为:的估计量分别为:34精选精选n 当当 ,且,且 时,时,总体均值总体均值 的置信度为的置信度为 的的近似置信区间近似置信区间的两个端点为:的两个端点为:总体总值总体总值 的置信度为的置信度为 的的近似置信区间近似置信区间的两个端点为:的两个端点为:分别可以用分别可以用 来估计来估计35精选精选n定理定理2.5.3 在简单随机抽样中,当在简单随机抽样中,当n足够大时,足够大时,若若 则有:则有:其中其中36精选精选n注:如果要使得比估计量的精度高于简单

20、估计量的注:如果要使得比估计量的精度高于简单估计量的精度,那么指标精度,那么指标Y与与X至少应该要正相关,因此比估至少应该要正相关,因此比估计量一般用于主要指标与辅助指标正相关的情形;计量一般用于主要指标与辅助指标正相关的情形;一般来说,可以先作一个试点调查,利用试点调查一般来说,可以先作一个试点调查,利用试点调查的数据,算出的数据,算出 的估计:的估计:判断判断 是否成立,再决定是采用比估计量还是否成立,再决定是采用比估计量还 是简单估计量是简单估计量37精选精选n书上书上P42例例2-4n例例1 某单位共有职工某单位共有职工1000人,人,2003年初有关部门年初有关部门按简单随机抽样的方

21、法抽取按简单随机抽样的方法抽取100人,经调查得:人,经调查得:其中其中 分别为第分别为第i个职工个职工2001年、年、2002年的医疗费年的医疗费(1)估计)估计2002年与年与2001年总医疗费的比率;年总医疗费的比率;(2)已知)已知2001年职工总医疗费为年职工总医疗费为125000元,对元,对2002年职工的平均医疗费作点估计和置信度为年职工的平均医疗费作点估计和置信度为95%的区的区间估计。间估计。38精选精选n例例2 对对21户的一个试点给出如下的数据:户的一个试点给出如下的数据:其中其中 为人数,为人数,为孩子数,为孩子数,为汽车数,为汽车数,为电为电视机数,假定总体总值视机数

22、假定总体总值X是已知的,你是否建议用是已知的,你是否建议用比估计量代替简单估计量来估计孩子的总数、汽车比估计量代替简单估计量来估计孩子的总数、汽车的总数及电视机的总数?的总数及电视机的总数?5 2 4 4 6 3 5 2 3 2 6 3 4 5 6 4 4 3 2 4 33 0 1 2 4 1 3 0 1 0 4 1 2 3 3 2 2 1 0 2 11 1 2 1 1 1 1 0 1 2 2 0 1 1 2 1 1 0 2 1 13 1 0 1 1 2 1 1 1 0 1 0 1 1 0 1 1 1 1 1 139精选精选n习题习题2.8,2.9n补充题:补充题:一卡车桔子重一卡车桔子重1

23、800磅,从中随机抽了磅,从中随机抽了10个桔个桔子测量其含糖量和重量,得数据如下:子测量其含糖量和重量,得数据如下:试用比估计的方法估计含糖总量及其标准差试用比估计的方法估计含糖总量及其标准差(忽略(忽略fpc)。)。作作 业业含糖量(磅)含糖量(磅)0.021 0.030 0.025 0.022 0.0330.027 0.019 0.021 0.023 0.025 重量(磅)重量(磅)0.40 0.48 0.43 0.42 0.50 0.46 0.39 0.41 0.42 0.4440精选精选n设每个单元都具有两个指标设每个单元都具有两个指标Y和和X,在简单随,在简单随机抽样中,称机抽样中

24、称 为为总体均值总体均值 的回归估计量的回归估计量,称,称 为为总体总值总体总值 的回的回归估计量归估计量,其中,其中 已知,已知,b为参数,可以是事为参数,可以是事先设定的常数,也可以是某个特定的统计量先设定的常数,也可以是某个特定的统计量注:参数注:参数b一旦确定,回归估计量的形式也就确定了;一旦确定,回归估计量的形式也就确定了;特别地,取特别地,取 ,可得,可得 ,取,取 ,又可得,又可得 ,即在简单随机抽样中,简单估计量和比估计量可,即在简单随机抽样中,简单估计量和比估计量可看成是回归估计量的特殊情况看成是回归估计量的特殊情况2.6 总体均值与总体总值的回归估计总体均值与总体总值的回

25、归估计41精选精选n设设b为事先设定的常数为事先设定的常数n定理定理2.6.1 在简单随机抽样中,若在简单随机抽样中,若 为确为确定的常数,则定的常数,则 是总体均值是总体均值 的无偏估计量,的无偏估计量,其方差为其方差为 且且 是是 的无偏估计量的无偏估计量42精选精选n定理定理2.6.2 在简单随机抽样中,当在简单随机抽样中,当 时,时,达到最小值,且其最小值为达到最小值,且其最小值为 其中其中 为指标为指标Y关于指标关于指标X的(有限)总体回归系数的(有限)总体回归系数43精选精选n推论推论2.6.1 在简单随机抽样中,若在简单随机抽样中,若 为确为确定的常数,则定的常数,则 是总体总值

26、是总体总值 的无偏估计量,的无偏估计量,其方差为其方差为 且且 是是 的无偏估计量的无偏估计量44精选精选n推论推论2.6.2 在简单随机抽样中,当在简单随机抽样中,当 时,时,达到最小值,且其最小值为达到最小值,且其最小值为 其中其中 为指标为指标Y关于指标关于指标X的(有限)总体回归系数的(有限)总体回归系数45精选精选n当当b为某个统计量时,当然希望它能使回归为某个统计量时,当然希望它能使回归估计量的精度比较高,也即方差比较小;由估计量的精度比较高,也即方差比较小;由定理定理2.6.2,故令,故令b为指标为指标Y关于指标关于指标X的样本的样本回归系数(记为回归系数(记为 ),即:),即:

27、46精选精选n此时,可以证明在简单随机抽样中,当此时,可以证明在简单随机抽样中,当n足足够大时,回归估计量够大时,回归估计量 有以下性质:有以下性质:(1)是总体均值是总体均值 的近似无偏估计量,的近似无偏估计量,是是总体总值总体总值 的近似无偏估计量的近似无偏估计量(2)47精选精选(3)可以分别用可以分别用 来近来近似估计:似估计:48精选精选n注注1:选:选 的合理性的合理性n注注2:为总体残差方差,标准的回归理论中总体残为总体残差方差,标准的回归理论中总体残差方差的无偏估计量正是差方差的无偏估计量正是49精选精选n对于简单随机抽样,在大样本情况下,回归对于简单随机抽样,在大样本情况下,

28、回归估计量的精度既不会低于简单估计量的精度,估计量的精度既不会低于简单估计量的精度,也不会低于比估计量的精度也不会低于比估计量的精度n对于大样本的简单随机抽样,可以考虑使用对于大样本的简单随机抽样,可以考虑使用回归估计量回归估计量50精选精选n例例 在一个有在一个有200棵桃树的果园中,一个有经验的农棵桃树的果园中,一个有经验的农民对每棵树上桃子的重量作了一个目测,他得到总民对每棵树上桃子的重量作了一个目测,他得到总的重量的重量X=11600磅,按简单随机抽样的方法抽磅,按简单随机抽样的方法抽10棵棵树,采集到的桃子称得重量如下:树,采集到的桃子称得重量如下:(1)用)用 作为总的实际重量作为

29、总的实际重量Y的估计的估计量,试计算估计值及其标准差;量,试计算估计值及其标准差;(2)若用样本回归系数)若用样本回归系数 给出的线性回归估计量,给出的线性回归估计量,精度是否更高?具体说明。精度是否更高?具体说明。实际重量实际重量61 42 50 58 67 45 39 57 71 53目测重量目测重量59 47 52 60 67 48 44 58 76 5851精选精选n习题习题2.10n补充题:补充题:对对100只兔子进行营养学研究,先称了每只兔子的只兔子进行营养学研究,先称了每只兔子的重量得平均值重量得平均值3.1磅;两个月后,实验者为了粗略磅;两个月后,实验者为了粗略地了解这群兔子的

30、体重,随机地挑选了地了解这群兔子的体重,随机地挑选了10只兔子分只兔子分别称它们的体重,得数据如下:别称它们的体重,得数据如下:试分别用回归估计法和比估计法来估计现在试分别用回归估计法和比估计法来估计现在100只只兔子的平均体重及其标准差。兔子的平均体重及其标准差。作作 业业两月前体重两月前体重3.2 3.0 2.9 2.8 2.8 3.1 3.0 3.2 2.9 2.8现在体重现在体重4.1 4.0 4.1 3.9 3.7 4.1 4.2 4.1 3.9 3.852精选精选n估计量的精度和调查费用是一对矛盾,样本估计量的精度和调查费用是一对矛盾,样本容量的确定需要在他们之间进行平衡容量的确定

31、需要在他们之间进行平衡n在简单随机抽样中,调查费用的构成比较简在简单随机抽样中,调查费用的构成比较简单,一般用函数单,一般用函数 进行表述,其中进行表述,其中 代表总的调查费用,代表总的调查费用,代表与样本容量无代表与样本容量无关的费用,关的费用,代表调查一个单元的平均费用,代表调查一个单元的平均费用,代表样本容量代表样本容量2.7 样本容量的确定样本容量的确定53精选精选n本节介绍在给定估计量精度(可以以方差、本节介绍在给定估计量精度(可以以方差、最大绝对误差、最大相对误差或变异系数中最大绝对误差、最大相对误差或变异系数中的任何一种形式提出)的条件下确定最小的的任何一种形式提出)的条件下确定

32、最小的样本容量的方法样本容量的方法n在实际工作中,如果同时对调查费用及估计在实际工作中,如果同时对调查费用及估计量的精度作出规定,而计算出来的样本容量量的精度作出规定,而计算出来的样本容量又不可能同时满足这两点的话,就必须作出又不可能同时满足这两点的话,就必须作出调整:调高调查费用以达到精度要求,或者调整:调高调查费用以达到精度要求,或者降低精度要求以保证费用不超支降低精度要求以保证费用不超支54精选精选n给定给定 的精度时的精度时n的确定的确定若给定若给定 的最大方差的最大方差V,则由,则由 可得:可得:令令 ,则,则55精选精选n给定给定 的精度时的精度时n的确定的确定若以置信度若以置信度

33、 给定给定 的最大绝对误差的最大绝对误差d,则由,则由可得:可得:令令 ,则,则56精选精选n给定给定 的精度时的精度时n的确定的确定若以置信度若以置信度 给定给定 的最大相对误差的最大相对误差r,则由,则由可得:可得:令令 ,则,则57精选精选n给定给定 的精度时的精度时n的确定的确定若给定若给定 的最大变异系数的最大变异系数C,则由,则由 ,即,即可得:可得:令令 ,则,则58精选精选n给定给定 的精度时的精度时n的确定的确定 不管以何种形式给出不管以何种形式给出 的精度,通常都是先计算出的精度,通常都是先计算出n的近似值的近似值 (比比n大,因此是大,因此是n的一个保守的近的一个保守的近

34、似值);如果似值);如果 远远小于远远小于N(记为(记为 ),则可),则可以取以取 ,否则按,否则按 进行修正进行修正59精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C60精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度

35、以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C61精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C62精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大

36、相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C63精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C64精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给

37、定 的最大变异系数的最大变异系数C65精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C66精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异

38、系数C67精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C68精选精选n给定给定 的精度时的精度时n的确定的确定对对 的精度的要求的精度的要求最小的最小的n给定给定 的最大方差的最大方差V以置信度以置信度 给定给定 的的最大绝对误差最大绝对误差d以置信度以置信度 给定给定 的的最大相对误差最大相对误差r给定给定 的最大变异系数的最大变异系数C69精选精选n注注1:

39、在上述确定:在上述确定n的公式中,包含与总体有的公式中,包含与总体有关的量,如:关的量,如:等,都需要等,都需要进行估计,而后才能把进行估计,而后才能把n确定下来确定下来,而估计,而估计这些量的方法,一般有以下四种:这些量的方法,一般有以下四种:(1)两步抽样)两步抽样(2)采用试点调查的结果,对有关总体量进行估计)采用试点调查的结果,对有关总体量进行估计(3)利用以前同一总体或同类总体的抽样结果并进)利用以前同一总体或同类总体的抽样结果并进行一定的调整,作为有关总体量的估计值行一定的调整,作为有关总体量的估计值(4)根据总体的结构,应用数学的方法对有关总体)根据总体的结构,应用数学的方法对有

40、关总体量进行预测量进行预测70精选精选n注注2:在确定:在确定n时,若必须先对总体比例时,若必须先对总体比例P进进行估计,而又已知行估计,而又已知P的取值范围为的取值范围为 时,时,则则P的估计值可如下取得:的估计值可如下取得:(1)当对)当对p的精度的要求为给定最大方差或最大绝对的精度的要求为给定最大方差或最大绝对误差时,可将误差时,可将 中最接近中最接近0.5的值作为的值作为P的估计的估计值值(2)当对)当对p的精度的要求为给定最大相对误差或最大的精度的要求为给定最大相对误差或最大变异系数时,可将变异系数时,可将 中最小的值中最小的值 作为作为P的估计的估计值值71精选精选n例例 在一个有

41、在一个有4000户的地区进行简单随机抽样,要户的地区进行简单随机抽样,要求估计拥有电炊具的户所占的百分比(在求估计拥有电炊具的户所占的百分比(在50%到到70%之间),使估计量的标准差不超过之间),使估计量的标准差不超过2%;并要求;并要求估计拥有脱排油烟机的户所占的百分比(在估计拥有脱排油烟机的户所占的百分比(在10%到到30%之间),使估计量的标准差不超过之间),使估计量的标准差不超过1%;问样本;问样本容量要多大才能同时满足两方面的要求?容量要多大才能同时满足两方面的要求?72精选精选n习题习题2.3,2.7n补充题:补充题:要用简单随机抽样的方法估计某街道要用简单随机抽样的方法估计某街

42、道25127户家庭中拥有电话机的户数,要求以置信度户家庭中拥有电话机的户数,要求以置信度95%使估计量的最大绝对误差为使估计量的最大绝对误差为500户,应户,应选多少户?(估计拥有电话机的家庭约占选多少户?(估计拥有电话机的家庭约占12%)作作 业业73精选精选n从容量为从容量为N的总体中如下抽取一个容量为的总体中如下抽取一个容量为n的的样本:每一次都是从样本:每一次都是从N个总体单元中等概率个总体单元中等概率地抽取一个单元,观测并记录其指标值后将地抽取一个单元,观测并记录其指标值后将其放回总体中去,接着进行下一次,一共进其放回总体中去,接着进行下一次,一共进行行n次,则这种抽样方法就称为次,

43、则这种抽样方法就称为有放回的简有放回的简单随机抽样单随机抽样,所得的样本(考虑样本不同单,所得的样本(考虑样本不同单元之间的抽取次序)就称为元之间的抽取次序)就称为有放回的简单随有放回的简单随机样本机样本2.8 有放回的简单随机抽样及设计效应有放回的简单随机抽样及设计效应74精选精选n注注1:在一个有放回的简单随机抽样(样本:在一个有放回的简单随机抽样(样本容量为容量为n)进行的)进行的n次抽取中,每次抽取时总次抽取中,每次抽取时总体的结构是不变的,因此不同次的抽取是相体的结构是不变的,因此不同次的抽取是相互独立的互独立的n注注2:在有放回的简单随机抽样中,所有可:在有放回的简单随机抽样中,所

44、有可能的样本有能的样本有 个,且它们中间的每一个被抽个,且它们中间的每一个被抽中的概率都相等,均为中的概率都相等,均为75精选精选n引理引理2.8.1 从容量为从容量为N的总体中抽取一个容量的总体中抽取一个容量为为n的有放回的简单随机样本,对总体中每的有放回的简单随机样本,对总体中每个单元均引入一个随机变量:个单元均引入一个随机变量:为第为第i个总体个总体单元在样本中出现的次数,单元在样本中出现的次数,则有:,则有:76精选精选n定理定理2.8.1 在有放回的简单随机抽样中,样在有放回的简单随机抽样中,样本均值本均值 是总体均值是总体均值 的无偏估计量,其方的无偏估计量,其方差为:差为:其中其

45、中77精选精选n定理定理2.8.2 在有放回的简单随机抽样中,在有放回的简单随机抽样中,是是 的无偏估计量的无偏估计量n推论推论2.8.1 在有放回的简单随机抽样中,在有放回的简单随机抽样中,是是 的无偏估计量的无偏估计量n注:与数理统计中简单随机子样的样本均值注:与数理统计中简单随机子样的样本均值的性质是一致的;事实上,对第的性质是一致的;事实上,对第i次抽取到的次抽取到的结果结果 ,有:,有:78精选精选nKish于于1965年提出了一个量,用以衡量某个年提出了一个量,用以衡量某个抽样方案(包括抽样方法和估计方法)的效抽样方案(包括抽样方法和估计方法)的效率,并把这个量称为率,并把这个量称为设计效应设计效应,记为,记为deff,具体的定义为:具体的定义为:79精选精选n设计效应的作用设计效应的作用(1)评估某个较复杂的抽样方案的效率:)评估某个较复杂的抽样方案的效率:如果如果deff1,则说明前者,则说明前者的效率低于后者的效率的效率低于后者的效率(2)确定样本容量:)确定样本容量:某个抽样方案要达到与(不放回)简单随机抽样同某个抽样方案要达到与(不放回)简单随机抽样同样的精度,它的样本容量就是它的设计效应乘以相样的精度,它的样本容量就是它的设计效应乘以相应的(不放回)简单随机抽样的样本容量应的(不放回)简单随机抽样的样本容量80精选精选

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服