ImageVerifierCode 换一换
格式:PPT , 页数:79 ,大小:961.50KB ,
资源ID:6191217      下载积分:16 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/6191217.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(市场调查-估计幻灯片.ppt)为本站上传会员【w****g】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

市场调查-估计幻灯片.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第八章 估计和样本容量的确定,Chapter 8 Estimation and Sample size determination,本章研究概率抽样的估计问题,不涉及非概率抽样的估计问题。,概率抽样估计原理是每个样本单元不仅代表自己,而且还代表被凋查总体中那些没有进入样本的单元。,估计就是根据从样本中收集的信息,对总体未知量进行推断的过程。它可以帮助我们依据样本信息推断总体。,本章还介绍了样本容量的确定。,1,本章包括以下四个部分:,一是如何计算样本中每个回答单元的权数,(,包括权数的调整值,),;,二是

2、如何计算不同数据类型,(,定性数据和定量数据,),各种统计量,(,总量、均值和比例,),的估计值,(,实际是点估计,),;,三是如何计算抽样误差和区间估计。,四是如何确定样本容量。,2,How to compute the weigh of each responding unit,How to produce estimates of different statistics for different types of data,How to evaluate the sampling error for each estimate based on the elected sample,

3、3,一、加权,weighing,估计的第一步,就是给每个样本单元或样本中的每个回答单元赋予一个权数。,设计权数是每个样本单元所代表的调查总体的单元数,,它由抽样设计所决定,,其实就是样本单元的入样概率的倒数。,4,等概率抽样的加权,Weighting for equal probability sample designs,自加权设计的概念。,自加权就是所有样本单元的设计权数相同。,如简单随机抽样、系统抽样。,对于分层抽样,如果按各层的大小等比例分配样本而且各个层内都使用简单随机抽样,那么它也是自加权设计。,5,举例说明自加权设计。,例,7.1,:,一个由,N,=1000,个人构成的总体被划分

4、为两个层:第一层由,N,1,=400,名男性组成,第二层由,N,2,=600,名女性组成。从中抽取样本量为,n,=250,的一个样本,将样本等比例地分配给各层,使得两层的抽样比都等于,n/N=1/4,。,6,此时,设计权数是多少?,对于男性层,入样概率,p,1,为,:,7,对于女性层,入样概率,p,2,为,:,8,这样,每个人都有相同的入样概率,1/4,,设计权数,w,皆等于,4。,9,不等概率抽样设计的加权,Weighting for unequal probability sample designs,当采用的抽样方法不是等概率抽样时,正确地使用设计权数就显得尤为重要。,举例说明不等概率抽

5、样设计的加权。,10,例,7.2,对于一项公共交通系统调查,总体由,1100,人组成,并按城乡分为两个层。城市层,N,1,=1000,,农村层,N,2,=100。,抽取一个,n=250,的样本:城市层,n,1,=200,,农村层,n,2,=50。,层 总体大小 样本量,城市,N,1,=1000,n,1,=200,农村,N,2,=100,n,2,=50,11,各层的权数是层单元入样概率的倒数:,城市层:,农村层:,12,对无回答的权数调整,Weigh adjustment for nonresponse,(1),无问答主要有两种类型:,项目无回答:指被调查者虽然接受调查,但是仅仅回答了问卷的一部

6、分。因而不能得到某些项目的信息。在这种情况下,最常用的处理方法就是对缺失数据作插补。插补就是在审核过程中用于解决辨别出来的数据缺失、无效与不一致等问题的过程。,13,All survey suffers from non-response.This refers to the situation where information from sampled units is unavailable for some reason.It may be that the units selected in the sample did not provide all of the requeste

7、d information or that some of the provided information was unusable,14,单元无回答:是指一个样本单元所有或几乎所有的数据都缺失。,单元无回答的产生,可能是由于被调查者拒绝参加,或者无法联系,或者无法找到被调查者的住所,或者调查效果无效。,这里主要研究单元无回答。,15,(2),无回答的处理办法,处理无回答的最简单的办法是忽略它。,The easiest way to deal with nonresponse is to ignore it.,如果发现忽略单元无回答是不适当的,最常用的办法是对权数进行调整。,无回答者的设计权

8、数需要在回答者间进行重新分配,通常的做法是用一个,无回答调整因子乘以设计权数,,由此得到无回答的调整权数。,16,(3),无回答调整因子,Nonresponse weight adjustment factor,无回答调整因子是原样本单元的权数和与给出回答的单元的权数和的比值。,17,(4),举例说明无回答调整权数的计算,对于自加权设计,这个比值也可以用原样本的单元数与回答单元数的比值(回答率的倒数)来表示。,18,例,7.3,从一个,N,=100,人的总体中抽取一个,n,=25,人的简单随机样本。,结果,只有,20个人提供了所需的信息。求无回答的调整权数?,19,步骤1:计算设计权数:,入样

9、概率,p,为:,每个样本单元的设计权数为,4,。,20,步骤,2,:对无回答的设计权数进行调整。,由于在,n,=25,人中只有,n,r,=20,人提供了所需的信息此时无回答调整因子为:,21,步骤3:计算无回答的调整权数。,无回答的调整权数,w,nr,等于设计权数与无回答调整因子的乘积:,22,于是,对数据文件中的每一条记录应赋予,权数,5,。,不同子总体往往具有不同的回答率,应对这些子总体分别进行无回答调整。,23,例7.2(续),如果在例,7.2,中回答情况如下:,城市层中,n,r,1,=150,,,农村层,n,r,2,=40,层 总体大小 样本量 回答数量,城 市,N,1,=1000,n

10、1,=200,n,r,1,=150,农 村,N,2,=100,n,2,=50,n,r,2,=40,24,步骤1:各层的设计权数为:,城市层,w,d,1,=5 ,,农村层,w,d,2,=2,步骤2:各层的无回答调整因子计算如下:,城市层:,农村层:,25,步骤3:无回答的调整权数等于设计权数与无回答调整因子的乘积:,城市层:,农村层:,26,辅助信息的使用,Use of auxiliary information,(1),使用辅助信息的两个原因:,一是使调查的估计值与已知的总体的真值,或者与从另一调查所得的估计值相匹配;,二是为了提高估计值的精度。,27,(2),如何使用辅助信息改进估计量。,

11、1),事后分层:在数据收集后,可以利用数据收集的结果,选用其中合适的变量对收集到的样本进行分层,从而对样本的权数进行调整。,举例说明如何应用事后分层改进估计量。,28,例,7.4,为得到某公司职员是否有吸烟习惯的信息,进行了一项调查。从,N,=78,人的名录中抽出了一个,n,=25,人的简单随机样本。在设计阶段,没有可用于分层的辅助信息。在收集关于吸烟习惯的信息的同时,收集了每个回答者的年龄和性别情况。总共有,n,r,=15,个人作了回答,样本数据的分布为:,回答者数量 男性 女性 总计,吸烟的人数 1 7 8,总,人数 3 12,n,r,=15,29,1.,每个回答者的权数以及对无回答的调整

12、计算如下:,设计权数是入样概率的倒数:,30,假定样本中每个被调查者作出回答的概率都是相同的,用调查的总人数除以回答者的总人数,得无回答调整因子:,31,无回答调整权数,w,nr,即为设计权数与无回答调整因子的乘积:,32,2.,利用无回答的调整权数,可得到如下估计值:,调查的估计值 男性 女性 总计,吸烟人数 5.23 6.44 1.6,总人数 15.66 2.47 8.0,吸烟者的比例 0.33 0.59 0.53,33,通过无回答调整权数,,我们,估计,出该公司,约有,16名男性职员和62名女性职员,,而且男女的吸烟比例不同。,假定调查完成后,我们得到了如下辅助信息:,该公司共有42名男

13、性职员和36名女性职员,。,那么,通过调查所得的估计值(16名男性职员和62名女性职员)与真值之间就存在着明显的差异。,34,3.,对样本进行抽样后分层,计算事后分层权数。,事后分层权数,w,pst,是(,事后)层的辅助变量总和除以该层的回答单元的数量所得的商。在本例中,,男性的事后分层权数为:,女性的事后分层权数为:,35,当使用新权数时,估计值为:,事后分层估计值 男性 女性 总计,吸烟人数 14 21 35,总人数 42 36 78,吸烟者的比例 0.33 0.59 0.45,36,此时,男性和女性人数的估计值与该公司男性和女性的实际人数一致。注意在每个事后分层的层中吸烟者的比例并没有改

14、变,但总体吸烟者比例的估计发生了改变。,在实际中,对每个事后层都计算一个因无回答引起的调整因子,这个因子即,总体中各事后层的单元数量,N,与其事后分层所得的估计值,之比,(后者用无回答的调整权数进行估计)。,37,本例事后,分,层调整因子为:,男性:,女性:,38,将这个调整因子应用到无回答调整权数时,就可以,得到与前面相同的最终事后分层权数:,男性:,女性:,39,等概率抽样设计的比例、平均数与总量的估计,Estimating proportions,averages,and totals for equal probability sample designs,对自加权抽样设计,所有样本单

15、元的最终权数是相等的。因此,计算比例或均值的估计值时,就可以将权数忽略。,对总体总量的估计,只需要用同一个设计权数将样本总值放大即可。,但是在实际中通常需要根据无回答或,事后,分,层,进行调整。,40,例,7.5a,下面所列的样本数据,中,所有回答单元都有相同的最终权数5。数据中有一个定量变量(年龄)和两个定性变量(性别和婚姻状况),对两个定性变量取值的编码如下:,性别:婚姻状况:,1=男性1=已婚,2=女性2=单身,回答者的各项样本记录如下:,41,回答者 年龄 性别 婚姻状况 权数,1 29 1 1 5,2 32 1 1 5,3 45 2 2 5,4 16 1 2 5,5 30 2 2 5

16、6 38 2 1 5,7 43 1 1 5,8 15 2 1 5,9 22 1 2 5,10 49 1 2 5,11 39 2 2 5,12 42 2 2 5,13 53 2 1 5,14 18 1 1 5,15 26 2 1 5,16 76 2 1 5,17 48 1 1 5,18 15 2 1 5,19 24 2 1 5,20 65 2 1 5,42,1)对总体或总体中某个域的,总量,估计:,Estimates of totals for the whole population or for specified subgroup of the population,总体中男性总数的估计

17、值为样本中,男性的,总数,乘以公共的无回答调整权数,w,nr,:,总体中单身女性总数的估计值为样本中,单身女性的,总数,乘以公共的无回答调整权数,w,nr,:,43,2),如果忽略权数,对总体的,比例,和,平均数,的估计如下:,Estimates of proportions and averages for the whole population,总体中男性所占,比例,的估计值即是样本中男性所占的比例:,总体中,平均,年龄的估计值即是样本的平均年龄:,44,3)对总体中的域的,比例和均值,的估计:,Estimates of proportions and averages for doma

18、ins of the population,总体中单身女性所占比例的估计值,即样本中婚姻状况回答为,“,单身,”,的女性在所有女性样本中所占的比例为:,45,总体中男性平均年龄的估计值即为样本中男性的平均年龄:,46,不等概率抽样设计的比例、平均数与总量的估计,Estimating proportions,averages,and totals for unequal probability sample designs,在估计过程中,正确使用最终权数不仅对计算不等概率抽样设计的估计值非常重要,而且对于当最终(经调整后的)权数不全相等时,计算自加权设计的估计值也非常重要。,47,例,7.6,:

19、使用分层抽样从总体中抽取了一个,n,=10,个农场的样本,所有,10,个农场都给出了回答,因此无需对无回答作调整,。,已经计算出最终权数,现在需要依据下面的数据计算估计值(农场类型中的,C,表示作物农场,,L,表示家畜农场)。,48,层 权数 农场类型 收入(元),1 5.67,C 75000,1 5.67 L 15000,1 5.67 C 125000,1 5.67 C 67000,1 5.67 L 80000,1 5.67 C 40000,2 16.50 C 30000,2 16.50 C 14000,2 16.50 L 48000,2 16.50 C 22000,49,总体农场总数的估

20、计值为:,家畜农场总数的估计值为:,50,家畜农场所占比例的估计值为:,总体中所有农场总收入的估计值为:,51,总体中所有农场的平均收入的估计值为:,家畜农场总收入的估计值为:,52,家畜农场平均收入的估计值为:,53,主要介绍了两方面内容:,一是如何计算某一概率样本的样本量;,二是如何在分层抽样中对各层样本单元数进行分配。,四、样本量的确定,Sample size determination,54,一、样本量的确定,由计算误差范围(极限误差)的公式:,55,可推出计算样本量的公式:,56,影响调查样本量大小的因素主要有两个:,一是调查估计值所希望达到的精度,也就是调查估计值所能允许的误差;,

21、二是调查实际操作的限制条件,如经费、时间等。,The sample size determination involves balancing the precision requirements of the estimates with various operational constrains such as available budget,resources and time.,57,2,影响精度的因素,Factors affecting precision there fore affect the sample size,and include the following:,(

22、1),总体的变异程度大;,(2),总体的大小;,(3),样本设计方式和所用的估计量;,(4),调查的回答率的高低。,The variability of the characteristic of interest in the population,The size of the population,The sample design and estimator used,The response rate,58,总体大小,在样本量确定过程中,总体所起的作用因它的大小而有所差异。对于小规模总体,它起着重要作用;对于中等规模的总体,其作用中等;而大总体对样本量影响的作用很小。,59,例如:用

23、简单随机抽样估计,P,,要求在置信度为,95%,下误差限为,0.05,所需的样本量(,p=0.05,),总体大小,N,所需的样本量,n,50,44,100,80,500,222,1000,286,5000,370,10000,385,100000,398,1000000,400,10000000,400,60,样本设计和估计量,Sample design and estimator,一般来说,当样本量采用简单随机抽样的计算公式,而实际使用的是更复杂的抽样方式时,为达到给定精度所需的样本量,应该在此基础上乘以一个称为,设计效应,因子。,61,设计效应,是,对于相等的样本量,给定样本设计估计量的抽

24、样方差对简单随机抽样估计量的抽样方差的比率,。,The design effect is the ratio of the sampling variance of the estimate under a given design to the sampling variance of the estimate under an SRS design of the same sample size.,62,简单随机抽样设计,设计效应等于1;,分层抽样设计,设计效应一般小于等于1;,整群或多阶抽样设计,设计效应一般大于等于1。,The design effect=1 for simple ra

25、ndom sample design and usually the design effect=1 for a cluster sample design,若过去相同或相似主题的调查所用的抽样设计与我们计划实施的抽样设计相同或相似,就能得到当前调查主要变量设计效应的估计值。我们也可以从试调查中得到设计效应的估计值。,63,调查的回答率,Survey response rate,需要根据预计的回答率调整样本量的大小,根据预计的回答率确定一个较大的样本才可能达到精度要求。,64,样本量的计算步骤,Sample size formulae,1,)对于简单随机抽样,对平均值估计的样本量计算:,第1步

26、计算初始样本量,65,第,2,步:对总体大小进行调整:,第3步:如果抽样设计不是简单随机抽样,则用下面公式对样本量进行调整:,其中,,B,是设计效应。,66,第,4,步:根据无回答再次进行调整,以确定最终的样本量:,其中,,r,为预计的回答率。,67,对于简单随机抽样,对比例估计,的样本量的计算步骤:,因为在比例估计中,样本的方差变为:,于是第一步计算公式变为:,68,若在以往调查中可得总体比例的一个较好估计,那么直接将它代入上面的公式就可以得到所需的样本量;否则可以用,p=0.5,,因为这时总体的方差最大。,69,从第二步到第四步,与前面对平均值估计的步骤完全一样。,70,例 准备实施一项

27、民意调查,以测定赞成建立一个省级公园的居民的比例。,总体由所有在两个城市和一个农村地区居住的成年人组成。通过从每个城市及农村中各抽取一个简单随机样本,得到一个分层随机样本。问每一层需要多大的样本量?,71,总体大小即总人口数为,657500,人,总体在各层的分布情况如下:,层,人口数,1,城市,1,400000,2,城市,2,250000,3,农村地区,7500,合计,657500,72,所需要的样本量取决于调查对数据的具体要求,为此考虑以下两个方案:。,方案一:,假设不需要得到各层的精确估计,对整个地区的估计值在,95,的置信度下,,0.05,的误差限,就认为估计值足够可靠了。由于没有整个地

28、区赞成建立省级公园居民比例可靠估计,所以假设,P=0.5,,预计回答率为,50,。,73,第,1,步:计算初始样本量,:,第,2,步:计算初步修正的样本量,74,第,3,步:根据设计效应,再次进行调整:对于分层随机抽样,通常,B1,。但由于没有可利用的,B,的估计值,因此取,B=1,,以得到保守,即比需要的样本量更大,的样本量。,第,4,步:对无回答进行调整,确定最终的样本量:,75,方案二:,假设对每一层,都要求户在置信度为,95,下误差限为,0,05,的估计结果,那么就需要单独计算各层的样本量,(,即将每一层作为一个总体,估计调查所需的样本量,),。,计算之前,考虑到城市,1,和城市,2,

29、是大总体,因而可以认为,总体大小对样本量的确定没有影响。由此,第,1,、,2,层中户的取值与方案,1,相同,这两层需要的样本量都应是,768,。,76,然而,对于农村地区,由于总体较小,因此总体大小对该层样本量的确定会产生一定的影响。,农村地区需要的样本量计算为:,77,因此,方案,2,所需的总样本量为,768(,城市,1)+768(,城市,2)+732(,农村,)=2268,。,方案,2,的总样本量为,2268,,几乎是方案,1,的样本量,768,的,3,倍。,换句话说,如果仅仅需要得到包含所有层的整个总体的估计值,那么要求的样本量将大大小于对各层分别进行估计时所需的样本量。,因为对各层分别进行估计时,需要确保使每一层的样本量都足够大。,78,这个例子清楚地说明了对每一不同子总体审查精度要求的重要性。,但如果调查涉及到许多研究域,这一要求可能会使总样本量显著增大,并可能导致样本量超出客户的预算和现有资源的承受能力。,一般来说,要求估计的域越多,需要的样本量就越大。,79,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服