资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,高级心理统计讲义,SPSS,复习,第一节 建立,SPSS,数据文件,第二节 几种典型实验设计的数据录入,第三节 数据变换,第四节 数据的清洁,第一节 建立,SPSS,数据文件,1.,用,SPSS Data Editor,建立数据文件,变量命名,(,Variable Name,),以字母开头,可包括字母,数字,,#,_,$,或,period.,长度不超过,8,字符,Period,不可在最后,同样的变量命名不可在一个文件中多次使用,不区别大小写(,not case sensitive,),定义变量,定义变量类型:数值型,/,字符型,定义变量测度:命名,/,等级,/,比例,变量定义,变量格式:小数点,列宽等,变量标号,值的标号,变量类型,(,Variable Type,),默认(,default,),Numeric8.2,变量标号,(,Variable Label,),输入变量值,值标号,(,Value Labels,),SPSS,的值是,大小写区别,的,(,case sensitive,),缺失值,(,Missing Values,),字符型变量无,system missing value,,所以必须用,user-defined missing value,使用,copy paste,插入,变量或记录,表,1.,增加学费态度研究,Codebook,名称 格式 变量标号,/,值标号,ID F3.0,被试编号,人口学变量(,Demographic variables,),BIRTHY F4.0,出生年份,GENDER A1,性别,/,“,F,”,“,女,”,“,M,”,“,男,“,CLASS F1.0,年级,/1,一年级,2,二年级,3,三年级,4,四年级,INCOME F6.2,月收入,自变量,(Independent Variables),ESSAY F1.0,文章论题,/1,“,增加学费,”,2,“,增加税收,“,个体差异,变量,CONS F2.0 Conscientiousness,因,变量(,Dependent V,variables,),SHOCK F1.0,心理学实验中应禁止使用电击,/1 Strongly Disagree 2,“,Disagree,”,3,“,Slightly Disagree,”,4,“,Slightly Agree,”,5,“,Agree,”,6,“,Strongly Agree,”,9,“,No Opinion on This Issue,”,TUITION F1.0,学费应该增加,/same value labels as SHOCK,COURSE F1.0,课业负担应该减少,/,same value labels as SHOCK,存储数据文件,SPSS,系统文件,ASCII,spreadsheet formats,SPSS,portable,format,可用于,SPSS Unix,Vax,IBM mainframe version,SPSS/PC+,and SPSS version 7.0,用表格文件建立,ASCII,数据文件,SPSS9.0,或以下版本可读,Excel worksheets,,,SPSS10.0,或以上可读,workbook,SPSS9.0,或以上可读取,xls4.0,文件,SPSS9.0,或以上系统文件可存储成,xls4.0,文件,用,Excel,读取。,SPSS Options,Edit-Options,General,Variable list -display,Data,Display formats for new variables,Set century range,Viewer,Display command in the log,第二节,几种典型实验设计的数据录入,组间设计,组内设计,列联表,组间设计的录入,一个变量在一列,另设分组变量,组内设计的录入,变量的每次测量使用一列,,n,次测量就是,n,列,列联表的数据录入,下列是各类心血管疾病与,A,,,B,型人格分布的列联表,Weight cases,命令,Weight by count,第三节 数据变换,(Data Transformation),Compute,由题目变量生成量表变量,将变量转换以满足分布的某种特点,Recode,为方便起见,将连续型变量分组,compute,compute,目标变量,=,数值型表达式,.,Execute.,IF(,条件,),目标变量,=,数值型表达式,.,对话框,TransformCompute,少量可以用对话框,大量生成新变量则必须用,syntax,注意!,每次做数据变换时,在,codebook,或,variable label,中记录变量的表达式,每次做数据变换时,开列一个原变量与新变量的对照表(包含少量但足够的,cases,),检查,SPSS,是否做的是所期望的,compute,运算的顺序,(),函数,*,,/,+,,,-,缺失值的处理,对算术运算和算术函数,原变量任一值缺失,生成的目标变量该记录则为缺失值,算术运算和算术函数,算术运算,算术函数,SQRT,(,square root,),-,平方根,RND,(,round,),-,四舍五入,TRUNC,(,truncate,),-,取整,统计函数,function.n(variable list),SUM,MEAN,SD,MIN and MAX,.n,表示记录中至少有,n,个有效数据才计算,否则结果将输出为缺失值。,.n,的,default,为,1,或,2,(对离差函数如,SD,),变量间用,间隔,“,TO”,表达一系列变量,量表的分数计算应该用统计函数,不要用算术函数,缺失值函数,SYSMIS,:变量有系统,缺失值,=1,;否则,=0,。,MISSING,:变量有,缺失值,=1,;否则,=0,。,NMISS,:点算所列变量,缺失值的数目,NVALID,:点算所列变量有效,值的数目,VALUE,:忽略,user-defined,缺失值,将其视为有效值。,例:,求均值的几种不同方法,条件表达式,If,表达式,compute,只有符合条件时,才会生成新的变量,用途:在不同条件时,变量有不同的操作方式,recode,将已有变量重新编码为同一变量或新变量,常见用途:,将反题倒计分,将数据按某一变量大小分为高,中,低组,R,ecode,命令,T,ransform,R,ecodeInto,S,ame Variables.Into,D,ifferent Variables.,可选择条件性重,编码,IF,RECODE atti01 atti04(1=5)(2=4)(4=2)(5=1),未提及的值不变,注意,每次做,recode,时,在,codebook,或,variable label,中作相应的记录,才可,save,防止重复,recode,!,建议总是,recode,成不同变量,RECODEatti01 atti04(1=5)(2=4)(3=3)(4=2)(5=1)INTO atti01r atti04r,R,ecodeInto,D,ifferent Variables,重新定义,value label,,,missing value,(,user-defined,),未提及的值会成为系统缺失值,第四节 数据的清洁,Explore:Statistics,新的统计量,5%trimmed mean,适用于,有极端值或奇异值(,outlier,),分布的偏度大,interquartile range,75th percentile-25th percentile,M-estimates:,给予中央位置以大的权重,Explore:Charts,直方图(,Histograms,),与,Fre,相同,但不带有正态曲线,tests for normality,茎和叶图(,Stem-and-Leaf Plots,),stem width,显示分布形状,箱图,(,Boxplots,),Outlier,:从矩形框始,在,1.5,倍箱距的点之外,Extreme,:。,3,。,箱图的组成,处理,outliers,的原则,1.5,倍箱距的点之外的,Outlier,需要给予注意,如果是多于,3,个点位置很近,多数情况考虑保留,3,倍箱距的点之外的,Extreme value,需要给予特别注意,如果是孤立的点,多数情况考虑可以作为缺失值计算一次,作为有效值计算一次。,数据中不合理取值的认定,涉及对于数据中所有变量取值范围的理解和确定,如性别只能取值男和女,有些心理量表要求答“是”“否”,只能取值,0,和,1,如作一个跨文化的大学生被试的研究,在中国样本中年龄变量中的,52,取值已经可以认定为不合理取值,而在美国样本中就应视为有效值。,不合理取值可以定义为缺失值,在遇到这些不合理取值时,如果条件容许,可以回到原始数据中去更正录入的错误。,一般的情况下,在一个被试中,缺失值超过,1/3,时,该记录应该被视为无效而删去。,如何识别,outliers,综合几项信息确定,univariate outliers,箱图,Outliers,表列,Z,分数,与其他变量结合考虑,multivariate outliers,Outliers,的原因,输入错误,数据不属于同一总体,个别差异,Outliers,处理方法,设为缺失数据,转换,保留,Tabachnick(1990),推荐了一套处理非常值的步骤,包括非常值进行统计分析;,先暂时将非常值定义为缺失值;,重复作同样的统计分析,看定性的结果能否得到重复;,如果定性的结果能得到重复,即可得出结论非常值并没有歪曲结果。报告第一次统计分析的结果,并注名把非常值去掉不会显著地影响结果。,如果定性的结果是不同的,准确的解释需要更多的数据。同时报告两次统计分析的结果,说明对数据解释的不确定性。非常值可能代表一个在被研究变量上效应不同的子群体。这一子群体可能需要特别的识别和处理。,参考书,方差分析介绍,方差分析(,1,),Oneway,单因素,(,Single-factor,):,只有一个自变量,Oneway,只用于组间设计,(between-subjects designs),计划比较,Planned Comparisons,适用条件:预先有特定的假设,设定,contrast,的规则,为某一因素设定,计划比较 时,必须为这一,因素的所有水平设定,系数,至少两个系数不能是 0,所有系数的代数和必须为0。,所有系数可同时乘以一个常数,所得,contrast,是同样的,事后检验,Post Hoc Tests,Equal Variances Assumed,敏感:,HSD,保守:,Scheffe,Equal Variances Not Assumed,Dunnetts T3,选择适宜的事后检验,成对比较,(,pairwise),:,所有可能的两两组合,全距检验(,range tests,):,将所有组分成若干个,subsets;subsets,间的均值有显著差异,,subsets,内的均值无显著差异。,均值图(,mean plot,),HSD pairwise test,HSD range test,Oneway,不能提供的信息,Oneway,不能用于处理重复指标的设计,(,repeated measures designs,),.,Oneway,不包含每个单元格是否符合正态前提的检验因此 必须用,explore,来验证正态前提,.,如果不符合正态前提,,Oneway,不能提供其他的解决方法处理数据,方差分析(,2,),General Linear Model(GLM):,多元(,N-way,),:,有两个或以上自变量,也叫因素设计,组间设计,(between-subjects designs),组内设计(,within-subjects designs),混合设计(,mixed designs),GLM,的优势,简单因素方差分析的局限,不能有效地处理非均衡样本,不能处理重复测量设计,(repeated measure design),一般线性模型,(GLM),的优势,可处理单变量和多变量设计,ANOVA:,一个因变量,MANOVA:,多个因变量,有效地处理非均衡样本和空单位格,最基本的,GLM,结果输出,表,1,:组间变量及其各水平表列,表,2,:方差分析表,sums of squares(,和方),F values(F,值),significance levels(,显著性水平),Effect size,observed power(,实际效力),Intercept,(截距):总均值是否与,0,有显著差异,Effect Size,;,效应大小,partial Eta squared(,h,2,),可归因于某个因素的总方差的部分,对于单变量,F,检验 和,t,检验,h,2,=(ssh)/(ssh+sse),ssh,是 假设的和方;,sse,是 误差的和方,如交互作用的效应:,h,2,=(144.00)/(144.00+330.00)=144.00/474.00=.304,30%,的总方差可归结为交互作用的方差,功效(,Observed Power),实际功效(,Observed Power):,是正确否定虚无假设的概率。,如:交互作用的,power,是,.630.,如何增加功效?,增加样本量,减少研究中的误差来源,在例中可增加奖赏葡萄的最多数目,解释显著的效应,解释顺序:先交互作用,后主效应,解释交互作用的方法,简单主效应,交互作用剖面图,交互作用表和图,/PLOT=PROFILE(reward*drive),/EMMEANS=TABLES(reward*drive),交互作用剖面图,比较哪个变量当作横轴能更好地解释结果,“对交互作用剖面图的考察表明:对于高驱力水平的动物,奖赏的数目对操作水平没有影响。而对于低驱力水平的动物,奖赏的数目越多,动物操作水平越高。”,交互作用的解释:简单主效应,显著交互作用的存在说明一个因素(,A,)的效应取决与另一个因素(,B,)的水平,即另一个因素(,B,)诸水平中自变量与因变量变化的模式不同,将二因素实验拆分成一系列单因素实验来检验,称为简单主效应,N,个简单主效应的总和方应当等于该因素(,A,)的和方加上交互作用的和方,处理不平衡设计的原则,GLM,提供最有效处理不平衡设计的方法,采用,Type III,类型,sums of squares,(,默认类型),报告未加权的边缘均值,.,Estimated Marginal Means option。unweighted means,事后检验都应在,Estimated Marginal Means option,中进行.,不可用,Post Hoc.,对话框,不可用简单因素设计,GLM,中和方的类型,Type I:,层次化分解,依据,design,子命令校正,用于均衡设计中,Type II:,将正检验的效应除外校正,用于均衡设计中,Type III:,将所有其他的效应除外校正,可用于非均衡设计,Type IV,:,为有空单位格的模型设计,重复测量设计,(,GLM Repeated-measures designs),两个水平称前后测(,pre-post design,),记录被试在处理前后的一系列反应,亦称,组内设计,,,匹配组,设计,混合设计,GLM Repeated Measures,的基本结果输出,Multivariate Tests,Within Subjects Factors,Mauchleys Test of Sphericity,Tests of Within-Subjects Effects,Tests of Within-Subjects Contrasts,Tests of Between-Subjects Effects,Mauchly test of sphericity,如果该检验不显著,那麽将,n,个单个自由度的估计量加在一起来代表,n,个自由度的总体估计就是恰当的,如果该检验显著,即,sphericity,前提不能满足,,averaged F-tests,就过高估计了联系的强度。有两个办法:,忽略,averaged F-tests,只报告,multivariate test of significance.,用,averaged F-tests,的校正公式,.,如,Huynh-Feldt Epsilon,解释显著的组内差异:列出均值,选择描述统计,Display Descriptives,在组间因素的检验中,缺失值按,casewise,方法处理,显示估计边缘均值,(,estimated marginal means,),Display Means for.,显示剖面图,Plots.,Horizontal Axis,解释显著的组内差异:事后检验,用比较主效应,Estimated Marginal Means,Compare main effects,。,注意所给出的比较是未校正过的,Post Hoc.,对话框对检验组内差异不可用,结果的报告,治疗对于改善,PTSD,的症状是有效的。症状分数的均值从治疗前的,18.57(,SD,=8.29),到结束治疗时的,6.00(,SD,=7.31,p,.0005),。疗效在治疗后,3,个月和,15,个月的追踪时仍然保持。结束治疗时与治疗后,3,个月,,15,个月追踪时的症状分数无显著差异,(,M,=5.27,SD,=6.88,p,=.422).15,个月追踪的症状分数,(,M,=3.97,SD,=5.93),与,15,个月追踪没有分别,(,p,=.114),但显著地低于结束治疗时的症状分数均值,(,p,=.001),。,混合设计,1,个组内因素(,2,水平),X 1,个 组间因素(,2,水平),Mauchley sphericity test,当组内变量只有两个水平,Mauchley W statistic=1.00,df=0,无显著性水平,所有,epsilons=1.00,校正后的,df,与原来相同,解释显著的交互作用:列出均值,Options.,Esimated Marginal Means,prepost,和,txcond,主效应,txcond*prepost,交互作用,剖面图,Plots.,horizontal axis,separate lines,结果的报告,重复测量的方差分析结果表明:,前后测之间有显著的主效应,F,(1,74)=73.11,p,.0005;,并且前后测与处理条件间有着显著的交互作用,F,(1,74)=41.45,p,.001.,对于接受治疗的被试,治疗结束时的症状分数,(,M,=6.64,SE,=1.426),显著低于治疗前的症状分数,(,M,=21.03,SE,=1.458),F,(1,74)=115.37,p,20 IV,慎推广,须交互验证,层次回归:,hierarchical,研究者根据理论假设确定次序,定义,block,因果顺序在前的,先进入方程,欲考察的重要变量或者放在前,或放在最后,应选择,statistics,R square change,3.,多元回归的数据要求,多元回归的数据要求(,1,),因变量应为等距,/,等比型变量。在实际操作中,如果有足够的水平,顺序型变量也可。如果因变量 是命名型,则须用判别分析或,logistic regression,。,自变量应为等距,/,等比型变量。在实际操作中,顺序型变量也可。命名型若为,2,水平,(dichotomies),可直接用。,命名型若为多水平,可先转换,为,dummy variables,。,因变量与自变量的关系应为线性。如果变量间关系是曲线的,但具单调性,(,递增或递减,),可通过,转换达成线性,。如果是,U,型线,需特殊转换处理。,尽管自变量间彼此可以有相关,其相关不可接近完全线性。否则称为,multicollinearity,。,多元回归的数据要求(,2,),被试数目与自变量数目的比率为,10:1,(,根据不同情况在,20:1,至,5:1,的范围中,);,被试数目,100,没有 非常值(,Outliers,),没有,Multicollinearity,多元回归的统计前提,3,个前提:,因变量残差正态分布,残差与 预测值呈线性关系,在因变量预测值的所有水平上,残差的方差相等,散点图:纵轴为因变量的预测值(,ZPRED,),横轴为残差(,ZRESID,),残差图,残差图告诉我们回归线在不同变量水平的拟合程度,残差图提供的重要信息,残差的系统分布提示有未被解释的系统性方差,自变量增大时,残差增大。,变量间的关系不是线性的,Multicollinearity,Statistics.,Collinearity diagnostics,任何两个自变量间的相关在,.70,以上,,Collinearity,就会出现。,Tolerance 75%,很好,;50-75%,不错,;25-50%,一般,;25%,不够,所有自变量总共与因变量有无显著关联,?-,F,虚无假设是 所有自变量与因变量均无关联。,.,当其他自变量保持恒定时,每一自变量与因变量有什么样的关系,?-B,回归系数,。,哪个自变量对因变量的影响最大?,-,beta,标准化回归系数(,beta weights,),回归分析前,将因变量和自变量都转换成,Z,分数。,将所有自变量考虑在内后,每一自变量与因变量关系是否显著,?-,t,值,报告回归分析的结果,用同时多元回归的方法对数据进行了分析,性别,年龄,种族,教育年限作为预测变量。回归模型的拟合度满意,(,R,2,adj,=50.1%),模型的总效应,(,F,4,466,=159.2,p,0.0005),。当其他变量保持恒定时,教育年限与薪水有正相关,beta=.56,,其效应是显著的,(,t,466,=15.59,p,0.0005),。男员工的薪水高于女员工,,beta=,(,-,),.26,,其效应是显著的,(,t,466,=7.51,p,0.0005),。非少数民族员工的薪水高于少数民族员工,,beta=.12,,其效应是显著的,(,t,466,=3.75,p,0.0005),。年龄对薪水的影响不显著,描述统计在前,.,推论统计在后。先报告实际情况,后报告显著性检验:,R,2,adj,在,F,考验前,,beta,在,t,检验前,F,和,t,值 的自由度必须报告。,增益,R,2,的意义:研究举例,一位研究者欲说明预测管理人员的绩效,除能力倾向,学历,经验外,人格还起额外的作用。他作层次回归来解决这个问题,第一层:能力倾向,学历,经验,-,R,2,=51%,第二层:人格,-,R,2,change=6%,6.,一个探索性路径分析的研究实例,根据研究结果,大学生精神症状与自尊,社会支持和年级有关,而自尊水平可由社会支持和年级预测。,计算社会支持和年级对大学生精神症状的效应,自尊水平作为一个中介变量,回归分析的结果,调节变量和中介变量,自变量,因变量,中介变量,自变量,因变量,调节变量,280 articles,76(27%),tested for,mediation,99(35%),tested for,moderation,19,mentioned the moderator,implied a mediator,.Incidence of tests of mediation and moderation in the,Journal of Applied Psychology,(volumes 84-86).,调节变量的定义,(moderating effect),如果变量,Y,和变量,X,之间的关系是变量,M,的函数,则,M,称为调节变量,调节变量可以是定性的,(,如性别,种族等,),也可以是定量的,(,如年龄,刺激次数等,),它影响因变量和自变量关系的方向和强弱,.,研究情境,也称为边际条件,“,boundary condition,.,”,基于上述发现,:,不一致的发现,.,阻碍的条件,.,促进的条件,.,调节变量的例子(,1,),上级支持,绩效,高亲和需要员工,低亲和需要员工,调节变量的例子(,2,),Job satisfaction,proactive,High Harmony,Low Harmony,调节变量的例子(,3,),Job,Sat,Job,Sat,Salary,Salary,Police,Stock Brokers,调节变量亦即交互作用,在模型中有特殊的表达方法,X,1,Y,M,od,如何检验调节效应:,取决于变量的类型,如果自变量是二分变量,调节变量也是二分变量,2x2 ANOVA,二分变量的调节效应,例,:,奖励食物数量影响动物的作业水平,内驱力是调节变量,自变量或调节变量是连续变量,比较复杂,必须假定没有测量误差,效力较低,必须有较大的样本容量,不要将连续变量分成二分变量,有些做法从均值或中数分成,2,组,这样作降低了检验的效力,连续变量的调节效应,中心化或标准化自变量和调节变量,中心化为了降低共线性,标准化容易用,SPSS,程序计算,连续变量的调节效应,用两变量的乘积作为交互作用项,在,SPSS,中建立一个新变量,进行层次化多元回归,第一层,:,主效应,第二层,:,加入交互作用项,解释结果,因为作了中心化,所以主效应是另一个变量在平均水平时的主效应,解释显著的交互作用,交互作用是否显著看加入交互作用项后的,R-squared change,如果交互作用显著,接下来做什么?,绘制高低组的回归图,1 SD,高于和低于均值,一个例子,Social support,Job,Sat,High Aff,Low Aff,连续变量的调节效应的完整程序,标准化自变量和调节变量,建立交互作用变量,层次化多元回归,绘制和解释交互作用项,中介变量的定义,(mediating effect),考虑自变量,X,对因变量,Y,的影响,如果,X,通过影响变量,M,来影响,Y,则称,M,为中介变量。,中介变量的意义是解释自变量对因变量的影响机制,在模型中有特殊的表达方法,X,1,M,ed,Y,研究情境,当,X,和,Y,的关系给定后,目的是了解,”,为什么,”,的机制,.,递进的因果关系,Y,M,X,a,b,c,Y,X,c,c:X,和,Y,的直接关系,a:X,和中介变量的关系,b:,中介变量和,Y,的关系,c:,当,中介变量在方程中时,X,和,Y,的关系,分析过程,要注意的问题,整个模型的效力,中介变量的信度,这些问题都可以通过结构方程模型有效地解决,传统方法如何检验中介作用,考察自变量和因变量间的关系,相关或回归,求出,“,c,”,将自变量,(IV),向中介变量,(DV),回归,标准化系数,B,就是,“,a,”,如何检验中介作用,进行层次化回归,第一层,:,放入,X,第二层,:,放入中介变量,(,得到,b),变量,X,的,降低的数量,(c,),就是中介作用的大小,完全中介,变为,0(n.s.),部分中介,显著减小,完全中介,如果变量,X,对,Y,的作用完全被中介变量,M,引起的,a,和,b,路径所分解,则称如果变量,X,对,Y,的作用被变量,M,完全中介,.,c0,c,=0,部分中介,如果变量,X,对,Y,的作用完全被中介变量,M,引起的,a,和,b,路径显著,而,X,至,Y,的路径仍显著,则称如果变量,X,对,Y,的作用被变量,M,部分中介,.,c0,c,0,测量间接效应,间接效应即中介作用的大小,完全中介或部分中介 间接效应,=(c-c),理论上,c-c=a*b,但是,这些对于证实中介作用是不够的,需要有一个统计检验,.,测量间接效应,X,Y,M,X,Y,c,a,b,c,间接效应,=a b,如果,a b=c,完全中介模型,如果,a b c,抑制,模型,中介作用的,Sobel,检验,MacKinnon et al(2002),Sobel,的计算:,of Personality and Social Psychology,“,Attitudes and Social Cognition,”板块的主编,Smith,(,2012,)在今年第一期的主编评论(,Editorial,)中指出,基于旧有的,Baron,和,Kenny,(,1986,)的中介分析方法已经过时,建议投稿者使用新的更准确的、具有更强检验力的方法。,依次检验方法的局限,总体作用显著并不是中介作用显著的必要条件;我们只要直接检验间接作用即可发现是否有中介作用。研究者按照,Baron,和,Kenny,因果步骤,会因为总体作用,c,不显著而停止余下的检验,可能错失发现间接作用,显著的机会,Baron,和,Kenny,的方法需要,a,和,b,都要显著,而直接检验间接作用,的中介分析(比如,Sobel,检验)却只需,a,和,b,的乘积显著即可。显然,拒绝两个虚无假设要比拒绝一个要困难。,虽然,Sobel,检验直接检验间接作用,a,和,b,的乘积,但是这种方法建立在,a,和,b,乘积正态分布的假设基础上,而这种假设一般是不成立的。并且与重复取样的自抽样程序相比,,Sobel,检验的效力要低,基于自抽样程序的中介效应检验,所谓自抽样程序(,bootsrap,),是以样本(如,样本大小,n=100,)来代表总体,在此样本中进行放回抽样(已被抽取的个体允许被再度抽取),直至抽取,n,个(如,100,个),组成一个样本。,这样的程序反复进行多次(,k,次),亦即产生多个样本,每个样本都可以算出一个间接作用估计值,由此可以算出,k,个值,形成一个实际的分布。这个分布近似于从原始总体中取样的分布。,一般建议最少抽样,1000,次(亦即,k=1000,),推荐抽样,5000,次,(,Preacher&Hayes,2008,)。,中介作用真值的统计推论根据这,k,个估计值产生的,ci%,置信区间得到。,如果置信区间不包括,0,,那么中介作用显著,支持中介作用的假设;如果包括,0,,则不显著,不支持中介作用的假设,一个中介变量的研究实例,根据研究结果,大学生抑郁症状与消极应对有关,而消极应对可由应激源预测。,计算应激源对大学生抑郁症状的效应,消极应对作为一个中介变量,中介模型,DEP,COP,STR,0.22,0.280,0.296,DEP,STR,.358,调节变量和中介变量的比较,更复杂的模型,(1),有中介的调节模型,:,A moderating effect is transmitted through a mediator variable(Baron&Kenny,1986),X,1,M,ed,Y,M,od,X,1,M,ed,Y,M,od,X,1,M,ed,Y,Group 1 High M,od,X,1,M,ed,Y,Group 2 Low M,od,自变量,X,调节变量,U,交互项,UX,中介变量,M,因变量,Y,Y=c+X+M+U+UX+,M=c+X+U+UX+,自变量,X,因变量,Y,中介变量,M,调节变量,U,带中介的调节模型,更复杂的模型,(2),有调节的中介模型,:,A mediating effect is through to be moderated by some variable(Baron&Kenny,1986),X,1,M,ed,Y,M,od,自变量,X,调节变量,U,交互项,UM,中介变量,M,因变量,Y,Y=c+X+M+U+UX+,M=c+X+,自变量,X,因变量,Y,中介变量,M,调节变量,U,带调节的中介模型,MANOVA and ANCOVA,(Multivariate Analysis Of Variance and Analysis of Covariance),142,ANOVA,的复习,143,CBT,No treatment,Anxiety Assessment,Drugs,课程目标,介绍,MANOVA,模型,ANOVA,加上更多的,DV,介绍,ANCOVA,模型,-ANOVA,加上协变量,介绍,MANCOVA,的前提,144,Multivariate Analysis of Variance(MANOVA),145,ANOVA vs MANOVA,在所有的情况中,ANOVA,只有,1,个,DV(ANOVA,也称为单变量检验,(univariate tests),当我们有多于,1,个,相关的,因变量时,我们就需要做,MANOVA,MANOVA,可以是,one-way,two-way,between-groups,repeated measures,或,mixed,146,研究情境,一位研究者想比较奥运的志愿者和非志愿者大学生及献血与未献血的大学生有什么区别,.,他想就以下方面进行比较,:,对志愿者的态度,对志愿者的情感,作志愿者的倾向性,这,3,个变量概念上是相关的,.,147,如何寻找适宜的检验方法,?,我们可以用分别用每一个因变量作,3,个,ANOVA(,或,independent t-test),这意味着作,3,次检验,但是,每一次作检验我们都冒,I,类错误的风险,148,解决的方法,作,1,次显著性检验评价各组在所有因变量上的差异,这就是,multivariate test,MANOVA,则是考察类目型自变量在多个等距因变量的某种线性组合,(centroid),的组均值差异,其组合原则是使组的差异或交互作用最大,第一个组合是使志愿者和非志愿者的差别最大,第二个组合是使献血与未献血者的差别最大,第三个组合是使志愿者组与献血组交互作用单元格的区分最大,149,例子,一位研究者想比较奥运的志愿者和非志愿者大学生有什么区别及献血与未献血的大学生有什么区别,他想就以下方面进行比较,:,对志愿者的态度,对志愿者的情感,作志愿者的倾向性,这,3,个变量概念上是相关的,.,150,151,Two-Way Between-Groups MANOVA,Pillais Trace=0.024;F(3,594)=4.801,p=.003,解释,MANOVA,结果显示奥运的志愿者和非志愿者大学生在以上,3,方面的因变量组合上有显著区别,献血与未献血的大学生没有显著差异,二者也没有交互作用,在哪些因变量上有差别,?,Univariate tests,153,Univariate Tests,解释,在对志愿者的态度,对志愿者的情感奥运的志愿者和非志愿者大学生有显著区别,但是,以前志愿者的倾向性对大学生作奥运志愿者无显著影响,.,影响的性质如何,?,155,Plot,Post Hoc Tests,如果,IV,有,2,个以上水平,需要作事后检验,用,univariate ANOVA,作事后检验,157,用哪一个统计量,?,158,Wilks(W);Hotellings(H);Pillais(P);Roys(R),转换成,F statistic,当,df=1,时,F,值都相同,当,df1,通常显著性相同,W,H,R,比,P,通常更有效力,而,P,更有耐受性,(robust),交互作用,一个自变量在复合因变量上的变化依赖于另一个自变量吗,?,例,:,给定,3,种治疗方
展开阅读全文