收藏 分销(赏)

社会调查方法课件5.ppt

上传人:仙人****88 文档编号:13877772 上传时间:2026-04-29 格式:PPT 页数:45 大小:735.50KB 下载积分:10 金币
下载 相关 举报
社会调查方法课件5.ppt_第1页
第1页 / 共45页
社会调查方法课件5.ppt_第2页
第2页 / 共45页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,主讲:重庆工商大学 田奇恒,社会调查研究方法,第五章 抽 样,抽样与抽样调查,抽样的术语与程序,概率抽样,非概率抽样,样本大小,第一节 抽样与抽样调查,抽样,是一种选择调查对象的程序和方法;即由总体中选取一部分代表的过程。,选取样本的方法分为两大类:,一类是非概率抽样。,另一类概率抽样。,抽样调查的,成功,首先要求所选取的样本能够代表总体。,所谓代表,也就是抽取出来的样本从调查所要研究的总体特征来看,能够再现总体的结构。,概率抽样最具科学性。,第二节 抽样的术语与程序,一、抽样的术语,1.总体,是指调查研究对象全体所构成的集合;,2.样本,是指按照一定方法从总体中抽取出来进行调查的那部分对象的集合;,3.抽样,指的是从某个总体的集合中,按一定的方式选择或抽取一部分元素的过程。,4.抽样单位,是指抽样过程中使用的基本单位。,5.样本框,是指抽样过程中抽取样本的所有抽样单位的名单。,6.参数值,也称总体值,是关于总体中某一变量的综合描述。,7.统计值,也称样本值,样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。,8.抽样误差,在用样本的统计值去推论总体的参数值时,总会存在着偏差,这种偏差就是抽样误差。,9.,置信水平,是指总体参数值落在样本统计值某一正负区间内的概率;,10.,置信区间,是指在某一置信水平下,样本统计值与总体参数值间的误差范围。,二、抽样的基本程序,1.界定总体,是对从中抽取样本的总体范围和界限作明确的界定。,2.制定抽样框,在确定了总体范围和抽样单位以后,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。,3.设计和抽取样本,4.对样本进行评估。,就是对样本的质量、代表性、偏差等进行初步的检验和衡量。,第三节 概率抽样,一、简单随机抽样,二、等距抽样,三、分层随机抽样,四、整群抽样,五、多阶段抽样,一、简单随机抽样,按等概率原则直接从含有,N,个元素的总体中随机抽取,n,个元素组成样本,(Nn),。,1,、抽签法,2,、随机数码法,概率抽样的最基本形式。,具体步骤,(1),先取得 抽样框;,(2),将总体中所有元素按顺序编号;,(3),确定随机数表中选取得数码位数;,(4),用随机方法抽取第一个号码;,(5),按照任意规则逐个抽取与样本单位顺序号码相符的号码与个数;,(6),依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。,例:在某个,5000,人的企业中抽取,1000,人进行问卷调查,如何操作?,如果是,10,人如何抽取?,优点:简单易行,缺点:只适用于总体数量不大,而且抽样框,容易定位的调查;,样本代表性差,误差大。,二、系统抽样,把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。,1,、具体步骤,(1),制定出抽样框。,(2),计算抽样间距,K=N/n,(3),在最前面的,K,个个体中,采用简单随机抽样的方法抽取一个个体,记下个体编号,(A),。,(4),在抽样框中,自,A,开始,每隔,K,个个体抽取一个个体,编号分别为,A,,,A+K,,,A+2K,,,,,A+(n,1)K,。,(5),将这,n,个个体合起来,就构成一个样本。,2,、课堂作业,要在某大学总共,3 000,名学生中,抽取一个容量为,100,的大学生样本。,我们先将,3 000,名学生的名单依次编上号码;,然后按上述公式可求得抽样间距为:,30,;,在,1,30,的数码中,采用简单随机抽样的方法抽取一个数字,假如抽到,12,,就以,12,为第一个号码;,每隔,30,名再抽一个。这样,我们便可得到,12,,,42,,,72,,,,,2972,总共,100,个号码。,再根据这,100,个号码,从总体中对应地找出,100,名学生,这,100,名学生就构成本次的一个样本。,3,、注意两种情况,一是总体名单中,个体的排列具有某种次序上的先后、等级上的高低情况。,二是总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况。,4,、评价,优点:样本的分布比较均匀,抽样误差小于简单随机抽样。,缺点:总体不能太多,要有完整的登记册;,三、分层抽样,分层抽样:将总体按某种特征划分成,若干类型,,然后再根据,各类型所包含的抽样单位数与总体单位数的比例,,确定从各类型中抽取样本单位的数量。然后按照,简单随机和等距抽样,的方法抽取样本。,例如:,了解某市,800,个企业的生产经营,第一产业,80,个,第二产业,320,个,第三产业,400,个,需选择,100,个调查,如何做?,计算比率:第一产业:,10%,,第二产业:,40%,,第三产业:,50%,;下一步是多少,?,相应的个数:第一产业:,10,,第二产业:,40,,第三产业:,50,然后抽取具体的样本,2,分层抽样的优点,总体单位数量较多,单位之间差异较大的对象。样本代表性大,误差较小。,缺点:必须充分了解总体,否则无法分类;,3,分层抽样的运用,(1),分层的标准。,第一,以所要分析和研究的主要变量或相关的变量作为分层的标准。,第二,以保证各层内部同质性强、各层之间异质性强的变量作为分层变量。,第三,以那些已有明显层次区分的变量作为分层变量;,(2),分层的比例问题。,按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取样本。,例:某地区有百货商店,1000,个,其中大型百货商店,100,个,中型百货商店,300,个,小型百货商店,600,个。如果总样本数定为,20,个,则各层应抽取的样本数为多少?,四、,整群抽样,先将总体各单位按一定标准分成,若干群体,,并将,每一个群体看作一个抽样单位,,然后按照随机原则从这些群体中抽取,若干群体,作为样本。,例如,某大学共有,100,个班级,每班都是,30,名学生,总共有,3000,名学生,抽,300,名学生作为样本,如何抽取?,从全校,100,个班级中,采取简单随机抽样的方法(或是系统抽样,分层抽样的方法,),抽取,10,个班级,然后由这,10,个班级的全部学生,(300,名,),构成样本;,优点:抽样单位集中,它可以降低收集资料的费用,。,缺点:样本的分布面不均匀、样本对总体的代表性相对较差等。,和以上几种相比较,在样本数量相同的情况下抽样误差较大,课堂练习,假设总体是全国所有城市的集合(,600,),我们要抽取一个规模为,40,的样本,按照前面所介绍的方法如何抽取?,1,、简单随机抽样或系统抽样?,2,、分层抽样(特大、大、中等、小城市),3,、整群抽样(以省为抽样单位),五、多段抽样,多段抽样是按抽样元素的隶属关系或层次关系,把抽样过程分为两个或以上阶段进行。,在社会研究中,当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多段抽样的方法来抽取样本。,具体步骤,先从总体中随机抽取若干大群,(,组,),,再从这几个大群,(,组,),内抽取几个小群,(,组,),,这样一层层抽下来,直至抽到最基本的抽样元素为止。,例如:某市共有,6,万名员工,他们分布在全国,20,个城市的,400,个单位中。现在要抽取一个由,1200,名员工组成样本。,如果按照三阶段抽样的方法,我们就可以有下列各种不同的抽样选择,(,见表,),。,要在类别和个体之间保持合适的比例,。,第一阶段,第二阶段,第三阶段,方案,1,抽,20,个市,每个市抽,4,个单位,每单位抽,15,名员工,方案,2,抽,16,个市,每个市抽,5,个单位,每单位抽,15,名员工,方案,3,抽,10,个市,每个市抽,20,个单位,每单位抽,60,名员工,方案,4,抽,8,个市,每个市抽,15,个单位,每单位抽,10,名员工,方案,5,抽,5,个市,每个市抽,12,个单位,每单位抽,20,名员工,方案,6,抽,4,个市,每个市抽,10,个单位,每单位抽,30,名员工,方案,7,抽,3,个市,每个市抽,10,个单位,每单位抽,40,名员工,方案,8,抽,2,个市,每个市抽,10,个单位,每单位抽,60,名员工,方案,9,抽,6,个市,每个市抽,5,个单位,每单位抽,40,名员工,如何选择方案?,2,、研究者所拥有的人力和财力,同质性越高,子总体规模越小,大的类别较少,每一类别的个体较多,1,、各抽样阶段的子,总体同质性程度。,总则:大的类别抽取单元较多,每一单元抽取个体较少,考,虑,因,素,课堂练习:,例如,假定某山区县有,20,个乡镇(该县,20,个乡镇经济发展状况较好的、一般的和较差的,3,类分别为,4,个、,12,个和,4,个),平均每个乡镇有,10,个行政村,每个行政村有,10,个自然村,每个自然村有,50,户。这样,全县共有,200,个行政村、,2000,个自然村、,10,万户。现决定采用多段随机抽样方法对该县计划生育状况按户做,5,的抽样调查,共抽取样本,500,户,.,其具体做法如下:首先,确定抽样单位。根据该县社会组织的,4,个层次,即乡镇、行政村、自然村和户,应采取,4,段随机抽样方法抽取样本,并确定乡镇为第,1,级单位,行政村为第,2,级单位,自然村为第,3,级单位,户为第,4,级单位然后,采取不同抽样方法,分,4,段逐步抽取样本:,一段抽样,从县抽到乡镇。由于该县乡镇之间经济发展状况差异较大,因而应采用宜于这类抽样单位的类型,分层抽样,。,其具体做法是:首先,编制抽样框。以经济发展状况为标准,将该县,20,个乡镇分为经济发展状况较好的、一般的和较差的,3,类,(,即,3,个群体,),,它们分别为,4,个、,12,个和,4,个。,其次,确定样本数量。假定在第,1,级单位中抽取,25,的单位即,5,个乡镇作为样本。,再次,简单随机抽取和上述比例,在经济发展状况较好的,4,个乡镇中抽,1,个乡镇,一般的几个乡镇中抽,3,个乡镇,较差的,4,个乡镇中抽,1,个乡镇,共,5,个乡镇组成第,1,级样本。,二段抽样,从乡镇抽到行政村。为了使样本分布比较均匀,可考虑采用,等距抽样,。具体做法是:,首先,编制抽样框。把第,1,级样本,5,个乡镇的,50,个行政村编号,l,50,。,其次,计算抽样间隔。假定从第,2,级单位中抽取,20,的单位即,10,个行政村作为第,2,级样本,这样抽样间隔就应该是,5010=5,。,再次,抽取第,2,级样本。就是先在第,1,抽样问隔内随机抽取第,1,个样本,假定是编号为,2,的行政村,然后按照抽样间隔就可确定编号为,2,,,7,,,12,,,17,,,22,,,27,,,32,,,37,,,42,,,47,的,10,个行政村为第,2,级样本。,三段抽样,从行政村抽到自然村。为了便于集中调查,节约人财物力和时间,可考虑采取,整群抽样方法,。其具体做法是:,首先,划分群体,即将第,2,级样本,10,个行政村所属的,100,个自然村,按照地理位置把每两个相近自然村划为一个群体,共分为,50,个群体。,其次,抽取第,3,级样本,即按照随机原则从,50,个群体中抽出,10,个群体作为第,3,级样本。,四段抽样,从自然村抽到户。为了简便易行,可采取,简单随机抽样方法,。其具体做法是:,首先,编制抽样框,就是编制第,3,级样本,10,个群体、,20,个自然村、,1000,户的名单,并按照一定标准确定每户的编号。,其次,抽取第,4,级样本,即按照简单随机抽样方法从每个群体,(,即相近的两个自然村,100,户,),中抽取,50,户、,10,个群体中抽出,500,户作为第,4,级样本即最后实施调查的具体对象。,从上例可以看出,多段随机抽样方法的优点:,把各种抽样方法的优点综合起来,达到以最小的人财物力消耗和最短时间获得最佳效果的目的。,特别适合于调查总体范围大、单位多、情况复杂的调查对象。,主要缺点:抽样误差较大,是各阶段抽样误差之和。,第四节 户内抽样与,PPS,抽样,一、户内抽样,采取一种被称做,“,Kish,选择法,”,方式。具体做法:,先将,调查表,分为,(,编号为,)A,、,B1,、,B2,、,C,、,D,、,E1,、,,E2,、,F,八种,每种表的数目分别占调查表总数的,1/6,、,1,12,、,1,12,、,1/6,、,1,6,、,1,12,、,1,12,、,1,6,。,其次,印制若干套,(,一套八种,),“,选择卡,”,发给调查员,每人一套。,“,选择卡,”,的形式如表,A,式选择表,如果家庭中,18,岁以上人口数,被抽中,的序号,1,1,2,1,3,1,4,1,5,1,6,或以上,1,B1,式选择表,如果家庭中,18,岁以上人口数,被抽中,的序号,1,1,2,1,3,1,4,1,5,2,6,或以上,2,综合,如果家,庭中,18,岁以上,人口数,被抽中的序号,A,B1,B2,C,D,E1,E2,F,1,1,1,1,1,1,1,1,1,2,1,1,1,1,2,2,2,2,3,1,1,1,2,2,3,2,3,4,1,1,2,2,3,3,4,4,5,1,2,2,3,4,3,5,5,6,或以上,1,2,2,3,4,5,5,6,调查员首先对家庭中的成年人排序,序号,年龄和性别特征,1,2,n,n+1,n+2,n+m,最年长的男性,次年长的男性,最年幼的男性,最年长的女性,次年长的女性,最年幼的女性,然后,调查员按照调查表上的编号找出相同的“选,择表”,确定该选的个体序号,最后对之进行访谈。,问题:,当分子公司的规模大小不一时,比如说,甲分子公司比较大,有,1000,员工,乙分子公司比较小,只有,200,员工。那么,当它们在第一阶段都被抽中后,第二阶段分别从它们中抽取,50,员工。,甲分子公司中员工被抽中的概率为,(20,80),(50,1000)=1,80,。,乙分子公司中员工被抽中的概率为,(20,80),(50,200)=1,16,。,多段抽样中,假定:即每一个阶段,抽样时,其元素的规模是相同的。,二、,PPS,抽样,不等概率抽样方法,叫,“,概率与元素的规模大小成比例抽样,”,(Sampling with Probability Proportional to Size),,简称,PPS,抽样。,步骤:,第一阶段,每个群按照其规模被给予大小不等的抽取概率。大群具有比小群更大一些的概率。,第二阶段,从每个抽中群中都抽取同样多元素。,公式说明:,每个,元素,被抽,中的,概率,应用,这个公司中员工最终被抽中的概率是:,20,(1,40),(1,20)=1,40,。,甲,公,司,第一阶段被抽中的概率是:,1000,40000=1,40,;,第二阶段群中每一员工被抽中的概率是:,50,1000,1,20,;,所选择的分子公司数目,乙子公司中员工最终的被抽中的概率是:,20,(1,200),(1,4),1,40,。,乙,公,司,乙分子公司第一阶段被抽中的概率是:,200,40000=1,200,;,第二阶段群中每一员工被抽中的概率是:,50,200=1,4,;,所选择的分子公司数目,课堂作业,从某市,10,家企业、总共,55000,名职工中,抽取,1 000,名职工进行调查。设计一种,PPS,抽样方案。,名称 人数,企业,1 3000,企业,2 7000,企业,3 6000,企业,4 4000,企业,5 5000,企业,6 10000,企业,7 1000,企业,8 8000,企业,9 2000,企业,10 9000,第五节 非概率抽样方法,一、偶遇抽样:研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象。,基本理论依据:调查总体的每个单位都是相同的。,第四节 非概率抽样,一、偶遇抽样,二、主观抽样,1.判断抽样或立意抽样,2.目的抽样,三、定额抽样,四、滚雪球抽样,第五节 样本大小,样本规模一般取决于:,第一,抽样的精确度。,第二,总体的规模。,第三,总体的异质性程度。,第四,研究者所拥有的经费、人力、时间。,经验确定样本数的范围,总体规模,100以下,100-1000,1000-5000,50001万,1万10万,10万以上,样本所占比重,50以上,5020,3010,153,51,1以下,谢谢观赏,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服