收藏 分销(赏)

社会调查方法第四讲.pptx

上传人:天**** 文档编号:4221219 上传时间:2024-08-26 格式:PPTX 页数:73 大小:1.20MB
下载 相关 举报
社会调查方法第四讲.pptx_第1页
第1页 / 共73页
社会调查方法第四讲.pptx_第2页
第2页 / 共73页
社会调查方法第四讲.pptx_第3页
第3页 / 共73页
社会调查方法第四讲.pptx_第4页
第4页 / 共73页
社会调查方法第四讲.pptx_第5页
第5页 / 共73页
点击查看更多>>
资源描述

1、社会调查方法(4)宋月萍新闻周刊6月22日公布的民调显示,在受访的1010名注册选民中,奥巴马获得了51的支持率,高出麦凯恩36的支持率15个百分点。10月16日,有关美国总统大选的民意调查和民调分析机构指出,民主党候选人巴拉克奥巴马(Barack Obama)的支持率处于遥遥领先的地位,领先优势多达30个百分点。第四讲抽样原理与类型第一节抽样的基本问题一、抽样及其相关的概念(一)总体与元素总体(population):理论上要研究要素的特定合体。构成它的所有元素的集合。元素(element):构成总体的最基本单位。社会调查中,总体由社会中的某些个人组成,这些个人便是构成总体的元素。元素的同质

2、性与异质性目标总体vs调查总体调查总体:从目标总体中去掉一部分无法接触的元素后的总体。(二)样本(Sample)从总体中按一定方式抽取出的一部分元素的集合。(三)抽样(Sampling)从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。(四)抽样单位(Sampling Unit)一次直接的抽样所使用的基本单位。抽样单位有时与构成总体的元素相同,有时不同。(五)抽样框(Sampling Frame)抽样框又称做抽样范围,指一次直接抽样时总体中所有抽样单位的名单。因抽样单位发生变化一份合格的抽样框中元素必须与号码一一对应穷尽性与互斥性总体抽样框样本(六)参数值与统计值参数值

3、(Parameter):又称总体值,关于总体中某一变量的综合描述,总体中所有元素的某种特征的综合数量表现。统计值(Statistic):又称样本值,关于样本中某一变量的综合描述,是样本中所有元素的某种特征的综合数量表现。二、抽样的作用产品的销售量产品的销售量就业状况就业状况电视台的收视率电视台的收视率我国土地沙漠化问题非常严重我国土地沙漠化问题非常严重,全国沙漠化土地面积已超全国沙漠化土地面积已超过过174000174000平方公里平方公里,并以每年并以每年34003400平方公里的速度扩张。平方公里的速度扩张。你知道这些数据是怎么来的吗?你知道这些数据是怎么来的吗?通过调查获得的。通过调查获

4、得的。怎么调查?怎么调查?是对考察对象进行全面调查还是抽样调查?是对考察对象进行全面调查还是抽样调查?妈妈妈妈:“儿子,帮妈妈买盒火柴去。儿子,帮妈妈买盒火柴去。”妈妈妈妈:“这次注意点,上次你买的火柴好多划不着。这次注意点,上次你买的火柴好多划不着。”儿子高兴地跑回来。儿子高兴地跑回来。孩子:孩子:“妈妈,这次的火柴全划得着,我妈妈,这次的火柴全划得着,我每根每根都试过了。都试过了。”这个调查具有破坏性,不可能这个调查具有破坏性,不可能每根每根试过试过,不能展开全面不能展开全面调查。调查。通过对样本统计值的描述来准确的勾画出总体的面貌l抽样的优点抽样的优点低成本,较不费时w比起研究整个总体而

5、言,更便宜、方便低误差w较好的结果避免元素的灭绝w例如:火柴第二节抽样的类型与抽样程序一、抽样类型抽样方法概率抽样概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样非概率抽样偶遇抽样判断抽样定额抽样雪球抽样概率抽样(probability sampling):总体中每一个个体都有一个已知不为零的被选机会进入样本。(基于概率)非概率抽样(nonprobability sampling):不按照概率均等原则,而是根据人们的主观经验或其他条件来抽取样本。(基于研究主观条件)二、抽样的一般程序1.界定总体:对从中抽取样本的总体范围与界限作明确的界定。2.制定抽样框:依据已经明确界定的总体范围,收集总

6、体中所有全部抽样单位的名单3.决定抽样方案:依据研究的目的和要求,具体决定采用哪种抽样方法。4.实际抽取样本:5.评估样本质量:对样本的代表性、偏差等进行初步的检验和衡量。三、抽样设计的原则目的性原则:为调查服务可行性原则:是否切实可行,易于执行高效性原则:在调查结果的精确性和调查所需的费用之间寻求平衡,在规定的费用之内达到尽可能高的精确度。第三节抽样原理要精确地描述大型总体时,需要进行概率抽样。一、概率抽样原理(一)代表性与选择概率代表性(representativeness):样本具有跟所从中挑选出来的总体相同的特征。通过对样本的分析所得出来的描述和解释也同样适用于总体。代表性给概化和推论

7、统计提供了可能性。在概率抽样下,代表性会更好。如果总体中的每一个元素被抽取为样本的概率相同,那么从这个总体中抽取的样本,就具有对该总体的代表性。概率抽样的优点:可避免偏见能够估计样本的精确度及代表性(二)抽样分布抽样分布:根据概率的原则而成立的理性分布,显示出从一个总体中不断抽取样本时,各种可能可能出现的样本统计值的分布情况。以平均数抽样分布为例:总体分布:掷一次骰子出现的点数样本均值抽样分布:掷两次骰子的平均值的分布(样本扩大到2)抽样分布:掷两次骰子的平均样本均值中心极限定理:在一个含有N个元素,且平均数为,标准差为的总体中,抽取所有可能n个元素的样本,若用X1,X2 Xm分别表示这m个样

8、本的平均数,那么样本平均数Xi的分布将是一个随n增大而越来越趋于具有平均数和标准差 的正态分布。当n足够大时(通常假定大于30),无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。总体总体分布分布骰子骰子平均数的抽样分布是正态分布,因此样本平均数次数所占比例是可以求得的。68.26%的样本平均数落在SE之间 SE为标准误 90%的样本平均数落在1.65SE之间95%的样本平均数落在1.96SE之间98%的样本平均数落在2.33SE之间99%的样本平均数落在2.58SE之间根据样本平均数对总体平均数进行推论置信度(Confidence Level)置信水平,指总体参数值落在样本统计值某

9、一区间内的概率。反映的是抽样的可靠性程度。置信度为95%,指总体参数值落在样本统计值的某一区间的概率。置信区间(Confidence Interval)指在一定的置信度下,样本统计值与总体参数值之间的相近程度,根据样本统计值,推算出总体参数可能存在的区间。反映抽样的精确性程度。=X+KSE l置信度与置信区间相互关系置信度与置信区间相互关系置信度低而置信区间精确置信度高而置信区间宽泛二、样本规模与抽样误差(一)样本规模及其计算样本规模(Sample Size)样本容量,指样本中所含元素的多少。统计学中,30以上为大样本,30以下为小样本。社会调查中,至少不能少于100个元素与要分析的变量有关,

10、每个层次不得少于30样本规模计算公式(简单随机抽样推论总体平均数):t置信度所对应的临界值总体的标准差e 抽样误差(即标准误)简单随机抽样推论平均数(age income)推论比例(gender crime)Generally在95%的置信度条件下所需的样本规模(二)影响样本规模确定的因素总体的规模抽样的精确性要求总体的异质性程度调查者所拥有的经费、人力和时间总体规模总体越大时,要保证一定的精确度,样本也要增大。样本规模的增加与总体规模不保持同等的增长速度。在有关因素一定时,样本规模速度大大低于总体规模的增加抽样的精确性要求在其它条件一定的情况下,置信度要求越高,所要的样本规模越大在其他条件一

11、定的情况下,置信区间越小(精确性越高),则要求的样本规模越大总体的异质性程度在同质程度高的总体中抽样时,的样本规模小一些在异质程度高的总体中抽样时,样本规模要大一些异质的分布情况,对于AB两个选项,选择AB选项的样本各为50%,与分别为70%与30%时,所需要样本量不同,前者需样本量更大。调查者所拥有的经费、人力和时间从实际出发,要求样本量越小越好从样本的代表必、抽样精确性考虑,要求样本量越大越好要在两者之间进行权衡,达到最高效(三)样本规模与抽样误差(无意识)抽样误差(Sampling Error,即标准误):随机误差,用样本统计值去估计总体参数值时所出现的误差,是由于抽样本身的随机性所引起

12、的误差。无论采用何种抽样方式,这种误差都不可避免。取决总体的分布方差和抽样规模非抽样误差(度量误差):指在整个调查过程中所产生的,在调查访问、回答、记录、填写、汇总、录入等工作中所出现的各种误差。随着样本的增大而增大抽样误差非抽样误差调查总误差第四节 抽样方法抽样方法概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样非概率抽样偶遇抽样判断抽样定额抽样雪球抽样一、非概率抽样方法抽样方法概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样非概率抽样偶遇抽样判断抽样定额抽样雪球抽样一、偶遇抽样(Accidental or Convenience Sampling)方便抽样、自然抽样指研究者根据现实

13、情况,以自己方便的形式抽取偶然遇到的人作为调查对象仅仅选择那些离得最近的、最容易找到的人作为调查对象街头拦访等无法保证总体中每一个成员都具有同等被抽中的概率推论总体时存在危险思考:调查人大学生使用图书馆的习惯,在图书馆进行拦访,该抽样方式可能对结果产生什么影响?对老年人主观幸福感进行调查,请居委会主任帮助联系,可能存在什么问题?二、判断抽样(Judgemental of Purposive Sampling)立意抽样、目的抽样根据研究目的和自己的主观分析来选择和确定调查对象。典型调查 如无家可归者、街头行乞人员、染发者可发挥研究人员主观能动作用对研究人员要求较高对研究的总体情况比较熟悉分析判断

14、能力较强研究方法与技术十分熟练研究经验比较丰富仍然无法做总体推论,但可以进行类别比较三、定额抽样(Quota Sampling)配额抽样尽可能地依据有可能影响研究变量的各种因素对总体分层,并找出具有各种不同特征的成员在总体中所占的比例依据这种划分以及种类成员的比例去选择调查对象,使样本中的成员在上述各种因素、特征的构成和在样本中的比例尽量接近总体情形。总体:2000人,男生60%,女生40%,文科理科各50%,一至四年级各占40%、30%、20和10%定额抽取规模为100的样本 目的在于抽选出一个总体的“模拟物”通过主观分析来确定和选择组成这种模拟特的成员 事先规定的条件,有目的地寻找含有“方

15、便”的成分,调查者无意中根据自己的需要进行选择四、雪球抽样(Snowball Sampling)从总体中的少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人,再去找那些人并再询问他们知道的人。经常用于实地研究每个被访问的人都可能被要求介绍其他的人来参与调查如同性恋调查、“小姐”生活状态调查容易找到相同性质的群体成员容易接近饱和状况偏误大,代表性受到质疑小结:在某些场合,非概率抽样是一种有用和便于进行抽样的方法。在代表总体的准确性和精确度上存在危险不能直接进行推广需要进行概率抽样二、概率抽样方法抽样方法概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样非概率抽样偶遇抽样判断抽样定额

16、抽样雪球抽样概率抽样:按照概率原理进行,要求样本的抽取具有随机性。总体中每一个成员都具有同等的被抽中的可能性。简单随机抽样(Simple random sampling)给抽样框内每一个抽样单位进行编号准备号码库随机抽取所需要数量的号码借用随机数表比较麻烦,费时随机数表构成:随机组成的5位数以随机顺序排列N行N列随机数表的使用对总体中的所有元素编码确定随机数需要几位数字(由总体规模决定,所抽取的随机数要求有可能涵盖所有元素,如总体为2000,共要4位数字)随机选定一个五位数为起点随意确定选择顺序:上、下、左、右、对角在所选 出的五位数中确定其中N位作为抽中元素号码系统抽样(Systematic

17、 sampling)系统化地选择完整名单中每第K个元素组成样本。对抽样框内每一个抽样单位进行编号确定抽样间距(如1000个人中抽取100人,每隔10抽一人)=总体大小/样本大小确定抽样起点,在间隔单位中随机选取一个起点注意:元素排列不得具有周期性全楼80户,抽取10户进行调查抽样间隔为8起始点为1 101,102,103108201,202,203208301,302,3033081001,1008分层抽样(stratified sampling)对简单随机抽样和系统抽样的一种修正 减少抽样误差的因素:大样本比小样本抽样误差小同质总体比异质总体抽样误差小把异质总体根据一定原则分为若干相对同质的

18、次级总体在次级总体中进行简单随机抽样或系统抽样分层变量:性别、专业、年龄、地区分层抽样需要注意的问题一、分层标准:以所要分析和研究的主要变量或相关变量作为分层标准;以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量;以那些已经有明显层次区分的变量作为分层变量。分层需要注意的问题二、分层的比例问题 按比例分层:按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。可得到一个与总体结构完全一样的样本。不按比例分层:主要用于对不同层次的子总体进行专门研究或比较,如用于推断总体,需要进行加权处理。整群抽样(cluster sampling)以整群作为抽样单位(

19、一个城市、一个社区)只要该群(丛)被选中,则该群中的所有成员都进入随后的子样本。适用于群内异质性较大、群间异质性较小的情况。多级整群抽样:总体-次级总体-再次级总体注意效率高,受抽样框影响小产生抽样误差的机会增多尽量的多抽群,减少群内元素多阶段抽样(Multistage Sampling)按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。从总体到获得最终样本元素经过多个阶段抽样适用于范围大、总体对象多的社会调查误差较大,应相对增加开头阶段样本数,而适当减少最后阶段的样本数。概率比例抽样(probability proportionate to size,PPS)在整群抽样当中,规模不

20、同的群体当中,每个元素被抽中的概率不一样。一种多级整群抽样,其中的群被选取的概率并不相等,其被选中的概率和其规模大小成比例。目的:保证样本中每个元素被的概率相等目的:保证样本中每个元素被的概率相等使整群被抽取的概率与其规模成比例本例中,假设三个街道,每个街道抽一个人。在第一阶段街道抽样中,对A街道编4个码,B编2个码,C编1个码,则A被抽中的机会是B的2倍在第二阶段个体抽样中,每个被抽中的街道中抽取相等数量的样本100个。A:(4/7)*100/2000=1/35B:(2/7)*100/1000=1/35C:(1/7)*100/500=1/35AN=2000BN=1000CN=500户内抽样在多阶段抽样中,进入到户后的抽样方式Kish选择法材料准备:把调查表分为A,B1,B2,C,D,E1,E2,F八种,分别占1/6,1/12,1/12,1/6,1/6,1/12,1/12,1/6;对应的“选择卡”步骤对每户家庭中符合调查条件的对象分男女按年龄进行排序根据调查表类型及家庭人口数,在选择卡中查询调查对象生日法:随机确定一年中某一天为标准日期计算每个符合条件的人距离标准日期的天数,以最近或最远的人为调查对象

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服