证明方式的选择.ppt_咨信网zixin.com.cn

资源描述

*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,证明方式的选择,内容,证明的基本原理和概念,证明方式的类型：实验和观察,实验设计,1,证明的基本原理和概念,1-1,日常推理中的一致性方法（,the method of agreement),。,一致性方法（,the method of agreement),。,用肯定性语气来描述,这个方法就是：当某一给定的现象的两个或更多的个案,(cases),有且仅有一个条件相同，那么这个共同的条件可以看着是这个现象的原因,cause,（或者结果,effect,）。,简单地说就是，如果我们对每一个个案都进行观察,Z,，发现了条件,C,，那么我们可以下结论，,Z,和,C,是因果相关的。,A,B,C,C,D,E,情景,X,下的要素,（,elements of situation X,）,情景,Y,下的要素,（,elements of situation Y,）,Z,Z,产生（,produce,）,产生（,produce,）,因而,Z,C,产生（,produce,）,图,1,一致性准则的否定性陈述,可以表述为：当非,C,与观察非,Z,联系在一起时，我们可能会断言,C,和,Z,之间存在一种因果关系。,A,B,非,C,非,C,D,E,情景,X,下的要素,（,elements of situation X,）,情景,Y,下的要素,（,elements of situation Y,）,非,Z,非,Z,产生（,produce,）,产生（,produce,）,因而,Z,C,产生（,produce,）,图,1,Mill,的,差异法（,method of difference,）,A,B,C,非,C,D,E,情景,X,下的要素,情景,Y,下的要素,Z,非,Z,产生（,produce,）,产生（,produce,）,因而,Z,C,产生,图,2,1-2,研究设计的比较原则,对于检验因果模型而言，比较的逻辑是根本性的。,研究设计的核心任务就是设计一个可比较的参考框架，以让我们能够对因果结论进行合理的推断。,研究设计的基本比较模型,前测,后测,前测,后测,干,预,实验组,控制组,比较的维度,（,1,）组间比较：从没有比较组到多个比较组。,（,2,）时间点比较：“前测”阶段数（没有前测,一系列前测）；“后测”阶段数（一个后测,一系列后测）,（,3,）个案分配方式：随机分组、配对、统计控制；,（,4,）干预的性质：没有干预，主动干预和自然干预,（,5,）干预的数量：一个干预,多个干预,1-3,常见的证明方式,实验设计,(experiment),调查（观察）研究设计,(survey),纵向设计,截面设计,2,实验设计,Experimental designs,内容,实验设计基本术语和符号,经典实验设计,简单实验设计,单控制组后测设计,复杂实验设计,多重后测实验设计,多组后测实验设计,所罗门四组设计,因子设计,实验设计中的问题,2-1,实验设计基本术语和符号,实验设计包含了三个主要的成分，分别为：,1.,独立变量、因变量和控制变量,2.,前测与后测,3.,实验组,(experimental group),与控制组,(control group),被观察个体称为,实验单位,(experimental unit),，人则称为,被实验者,(subject),施行于实验单位的特定的实验条件称为,处理,(treatment),实验设计中的解释变量称为,因子,(factor),每一特定的实验条件称为,水平,(level),例如我们要研究：加入群体的难度,对归属某个群体的,渴望程度,组别（分组方法）,前测（,T1,）,干预（,X,）,后测（,T2,）,变化,实验组,EG,（,R/M,）,O1,渴望度的前测得分,X,高难度的加入程序,O2,渴望度的后测得分,O2-O1,控制组,CG,（,R/M,）,O3,渴望度的前测得分,没有进入程序,O4,渴望度的后测得分,O4-O3,实验设计常用记号,1.O,：表示在实验中，对因变量所作的正式的,观察或者衡量,。如果实验中有两次观察或衡量，则用符号,O1,、,O2,来表示。,2.X,：表示在研究中对测试单位,(test units),所作的,处理、干预或刺激,。例如当测试单位受到两次或两次以上的实验处理时，则以符号,X1,、,X2,来表示。,3.EG,：表示在实验中测试单位的,实验组,，实验组的成员在实验中将受到实验处理。,4.CG,：表示在实验中测试单位的,控制组,，控制组的成员并不用接受实验处理。,5.R,：表示将被试者,随机分派,到实验组和控制组。随机能确保控制其他的额外变量，且增加实验的效度。,6.M(matching),：表示通过,配对方式,将被试者分配到实验组和控制组中，而这种,配对,可以减少由于选样的偏差而产生的实验误差。,2-2,经典实验设计,前测,后测加控制组设计,(,pretest-posttest control group design),EG,：,R,O1,X,O2,CG,：,R,O3,O4,2-3,简单实验设计,单控制组后测设计,(posttest-only control group design),EG,：,R,X,O1,CG,：,R,O2,适用条件：,(1),小组比较大；（,2,）随机分配,Loftus and Burns(1982),实验目的：考察暴力场面对人的记忆的影响。,被试：,226,名,University of Washington,的自愿参加者；随机分配到以下两组。,组一：看带有暴力场面的电影,组二：看非暴力场面的电影,看完电影之后，要求两组被试回答,25,道关于电影中事件的问题。其中一道题非常关键：问被试在银行外面露天停车场踢球的男孩穿的足球衫上的号码是多少。,因变量是正确回忆出男孩运动衫号码的人数的百分数。,结果：组一，,4%,；组二，,28%,。,用符号表示,组别（分组方法）,前测（,T1,）,干预（,X,）,后测（,T2,）,变化,实验组,EG,（,R/M,）,无,X,暴力型电影,O2,记忆力得分,没法分析,控制组,CG,（,R/M,）,无,非暴力型电影,O4,记忆力得分,没法分析,Melanie B.Marks;Rachel T.A.Croson(1999),研究问题：不完全信息对公共品供给水平的影响。,被试：,25,名,Longwood College,的本科生，随机分成,5,组。每个组做三场，每一场,25,节的实验。,实验规则：每一节的得分规则相同：每个人有,55,元代币，以及一个随机分配得到的公共账户收益权（,20,、,30,、,55,、,65,、,80,几种）；每个人决定,55,元代币在私人账户和公共账户分配数量；,每个人的收益,=,私人账户,+,个人公共账户收益。个人公共账户收益,=,如果公共账户总额,=125,，则为分配到的收益权；,125,，分配收益权，多的不分配）,处理：完全信息（知道收益权分布状况,+,收益权总和）；不完全信息（知道收益权总额）；不完全信息（分布不知道，总额不知道，只知道收益权各不相同）。,结果（公共品成功提供率）：完全信息（,48%,）；不完全信息（,56%,）；不完全信息（,54%,）,EGa1 X1 O1,EGa2 X1 O2,EGa3 X1 O3,EGa4 X1 O4,EGa5 X1 O5,-,EGb1 X2 O6,EGb2 X2 O7,EGb3 X2 O8,EGb4 X2 O9,EGb5 X2 O10,-,CG1 X3 O11,CG2 X3 O12,CG3 X3 O13,CG4 X3 O14,CG5 X3 O15,2-4,复杂实验设计,多重后测实验设计,EG R O1 X O2 O3 O4,CG R O5 O6 O7 O8,例如：研究某项政策或法规的影响,多组前、后测实验设计,EG1 R O1 X1 O2,EG2 R O3 X2 O4,CG R O5 O6,例如：研究强制投票对选举出席人数率的影响。,把强制投票划分为,：（,1,）完全自愿投票；（,2,）强制、警告初犯；（,3,）强制、轻微罚款（,50,元）；（,4,）强制、严厉罚款（,200,元）,所罗门四组设计,EG1 R O1 X O2,EG2 R X O3,（无前测）,CG1 R O4 O5,CG2 R O6,（无前测）,因子设计（当存在多个自变量的时候）,例如：研究：,工作自主性（高、低）,性别（男、女）,工作满意度（,Y,）,2-5,实验场景,实验室（,laboratory),试验,田野,(field),实验：在真实世界开展的实验设计。这在社会科学中应用较多。例如：,20#70,年代丹佛收入支持实验。,自然,(natural),实验：以实验者没法操控的、自然发生的干预为实验背景。例如研究某项政策法案通过的影响。,2.6,实验设计中的问题,解释范围的问题：,实验设计可以让我们识别出一个变量对另一个变量的直接因果关系；而不能识别出间接因果关系。,但是很难识别出一个变量对另一变量的影响机制，也就是说没法对这种因果关系提供解释。,研究设计的内部效度与外部效度问题,如果研究设计能够支持根据这一设计提出的因果结论，我们就称该研究设计具有良好的内部效度。,如果某个研究设计能够排除掉的替代性解释越多，其内部效度就越高。,外部效度是指根据某一研究设计的得到的研究结论能被推广到特定研究以外的程度。,外部效度的威胁常常是使用了不具有代表性的样本。,内部效度问题,历史因素：前测与后测之间的时间间隔发生的历史事件。,成熟因素：一些变化是由于时间的流逝引起的，而非干预引起。,测试效应：多次参与测试会影响实验的有效性（控制组可以消除测试的影响，所罗门四组设计可以消除测试与干预之间的交互效应）,测量器具的变化：前测和后测方式的改变会导致误差，例如用句、提问顺序等。,回归趋势效应。,选择：当两组成员有差异的时候存在。,被试者退出的影响,外部效度问题,前测的影响,样本的非代表性,人为性。实验太精致了，太具有人为性了，让我们对于真实情景下的真实的人的情况一无所知。,3,纵向设计,Longitudinal designs,3-1,纵向设计的目标,共同目标：通过收集至少时间点上的数据，来测量变量的时间变化趋势。,具体而言：,描述变化模式,建立事件发生的时间顺序（,temporal order,）,个体随着年龄的变化所表现出来的差异,验证个体成长（年龄）效应（,developmental,（,age,）,effects,）,1980,保守倾向得分,1990,保守倾向得分,2000,保守倾向得分,1920-9,51-60,50,61-70,60,71-80,70,1930-9,41-50,40,51-60,50,61-70,60,1940-9,31-40,30,41-50,40,51-60,50,1950-9,21-30,20,31-40,30,41-50,40,1960-9,11-20,10,21-30,20,31-40,30,验证代际（群组）效应（,cohort effects,）：出生在同一年或时间段的群体在成长过程中经历了类似的社会环境，进而产生的不同代际之间的差异就是代际效应,1980,保守倾向得分,1990,保守倾向得分,2000,保守倾向得分,1920-9,51-60,50,61-70,60,71-80,70,1930-9,41-50,40,51-60,50,61-70,60,1940-9,31-40,30,41-50,40,51-60,50,1950-9,21-30,20,31-40,30,41-50,40,1960-9,11-20,10,21-30,20,31-40,30,验证历史（时期）效应（,historical,（,period,）,effects,）：由于周期性或趋势性的政治、经济、社会因素所引起的影响，它对同一年会时期内的所有的群组、都有类似的影响。,同期群,出生年月,1980,时的,年龄群,保守倾向得分,1990,时的,年龄群,保守倾向得分,2000,时的,年龄群,保守倾向得分,1920-9,51-60,50,61-70,50,71-80,50,1930-9,41-50,40,51-60,40,61-70,40,1940-9,31-40,30,41-50,30,51-60,30,1950-9,21-30,20,31-40,20,41-50,20,1960-9,11-20,10,21-30,10,31-40,10,3-2,纵向设计的类型及控制原理,按照数据收集的时点不同可以划分为：,前瞻性纵向设计（,Prospective longitudinal designs,）：在不同时点上收集数据,回溯性纵向设计（,Retrospective longitudinal designs),：在同一个时点上，利用受访者的回忆来收集数据,按照是否追踪调查同一个个案，可以划分为：,趋势研究设计：也就是重复的截面设计，在不同的时间点上收集可以进行比较的样本的信息，但不是针对同一个样本。,追踪调查（,panel survey),：对同一个样本进行重复调查。,纵向设计没有控制组。其控制是建立在统计控制基础之上的。,3-3,前瞻性纵向设计,1,）简单前瞻性追踪设计（,simple prospective panel design),T,1,T,2,测量变量,(O1),干预或者自然发生的事件,(X),测量变量,(O2),缺少随机控制组，无法知道前后变量究竟是研究者的干预、还是时间流逝、还是其他因素引起的。,但是通过使用一个足够大、多样化的样本，这一问题可以在一定程度上缓解。,2,）多重时间点前瞻性追踪设计,(Multi point,）,T1,X1,T2,X2,T3,X3,T4,X4,T5,3,）无替换单个追踪设计,(Single panel design without replacement),T1,T2,T3,T4,T5,T6,缺点：,1,）样本的流失让最终样本规模太小无法接受；,2,）由于样本的流失，让最终样本缺乏代表性。因为很可能流失掉的样本与保留下的样本存在系统性的差异,4,）有替换单个追踪设计,(Single panel design with replacement),T1,T2,T3,T4,T5,T6,缺点：,1,）样本的代表性问题。,2,）随着个体的替换，我们很难对个体层次的变迁加以分析，而只能对整体层次发展趋势方面的结论加以验证,5,）轮转式追踪设计（,Rotating panel design),主要适用于解决样本流失问题。,T,1,T,2,T,3,T,4,T,5,T,6,T,7,T,8,T,9,T,10,T,11,T,12,T,13,T,14,T,15,T,16,T,17,P,1,P,2,P,3,P,4,P,5,P,6,P,7,P,8,P,9,P,10,P,11,P,12,要求：,P,1,P,2,-,要是相同样本组。,优点：,可以系统的、随机的处理样本流失问题。同时降低了研究费用,每一个样本组都有一个调查时间限制，参与者不会感到疲劳。同时可以减小测试效应的影响。,可以在每一个试点,T,i,上，集合该时点上所有的样本组进行截面分析。,可以把几个样本组的短期追踪数据集合成一个,近似的,长时间的最终数据，进而研究发展趋势。,可以针对样本组中的一个特定的个体进行短期的追踪，研究个体的发展趋势，以及不同个体之间发展趋势的差异。,缺点：,仍然是一种近似。,6,）群组序列设计（,Cohort sequential design,）。又称之为加速设计（,Accelerated design,）,有的群组经过一段时间后就推出研究，同时用一个新的、较为年轻的群组来代替他。,2000,2005,2010,2015,2020,2025,25,50,30,50,55,35,50,55,60,40,50,55,60,65,45,50,55,60,65,70,50,50,55,60,65,70,75,55,55,60,65,70,75,60,60,65,70,75,65,65,70,75,70,70,75,75,75,优点：,（,1,）可以在每一个数据收集时间点上进行截面研究。（列数据）,（,2,）可以为一个特定的群组，建立时间序列数据，进行该群体中的个体发展趋势分析，以及同一群中个体之间的发展趋势差异分析（成长效应，行数据）。,（,3,）可以对不同群组的发展趋势进行比较分析（代际效应，不同行数据比较）,（,4,）对所有年份具有相同年龄的群组放在一起，例如都是,50,岁的群组，可以分析历史效应或年代效应。（列数据、对角线比较）,缺点：,有的群体延续时间比较短。,3-4,回溯性设计（,retrospective design,）,3-5,纵向设计的方法论议题,内部效度问题,缺乏可比较的随机分配的控制组。（统计控制可以一定程度上避免）,发生在测量间隔之间的历史事件。,测试或追踪调查的“条件作用”。调查多了，某个个体具有一定程度的“经验”。（轮转式可以避免）,退出者。两个群组之间的差异很可能是由于测量间隔内的退出者造成的。,外部效度问题,样本损耗。,调查的条件作用。,迁入与迁出。在测量间隔，群组总体中某些个体迁出，同时又有某些个体迁入。导致总体性质发生了变化。,4,截面设计（,cross sectional designs,）,4-1,截面设计的三大特点,无时间维度。故只能用来测量组间的差异，不能用来测量前后变化。,着眼于既存差异。,截面设计中的各组是根据样本的既存差异来构建的。,截面设计的优点,可以让研究者先对快捷的获得研究结果。,也比较经济，花费少。,所以大量的研究都使用截面设计。,截面设计的方法论议题,内部效度。由于没有历时性，只有一次测量，历史事件、成长效应、测量工具效应、回归效应、样本损耗和测试影响，这些内部效度威胁对于截面设计来说都不存在。内部效度威胁：,缺乏时间维度，很难确定因果关系。（理论分析非常重要）,很多干扰变量是通过统计控制，难以完全控制。（理论分析和文献阅读非常重要）,

展开阅读全文