资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,结构方程模型,罗东霞,验证性因子分析,(CFA),验证性因子分析可以通过结构方程模型(,Structure Equation Modeling,SEM,)来实现,它是以研究者最初构建的模型为基础,通过对数据的,迭代计算,来验证模型对数据的支持程度。(从一个初始估计出发寻找一系列近似解来解决问题),研究者可以根据理论和数据调整模型。如果模型拟合程度较高,则表明结构效度良好。,验证性因子分析通过因子载荷来判断聚合效度,通过信赖区间检定法(,Confidence Interval Test,)和变异数抽取估值法(,Variance Extracted Estimate,)来验证区分效度。,信赖区间检验法就是考察两个因子之间的相关系数加减标准误的两倍是否包含,1,,如果不包含,1,,则表明数据有较高的区别效度(,Anderson&Gerbing,1988,)。,GFI,t-,2,EFA,和,CFA,的区别,迭代,数值分析中通过从一个初始估计出发寻找一系列近似解来解决问题的过程,为实现这一过程所使用的方法统称为,迭代法,。,与迭代法相对应的是直接法(一次解法),即一次性解决问题。,当遇到复杂问题时,特别是在未知量很多,无法找到直接解法,此时就通过迭代法来解决。,迭代是解决问题的一种基本方法,适合做重复性操作,可以对一定步骤进行重复执行,在每次执行这些步骤时,都从变量的原值推出它的一个新值。,变异数抽取检定法,Variance extracted test,如果因子的变异数抽取估计值(,Variance Extracted Estimates,)该因子与其他因子的共同变异抽取值(相关系数的平方),则表明数据具有较高的辨别有效性(,Fornell&Larcker,1981,)。,变异数抽取估计值:计算各因子非测量误差的变异数占变异数的比值。,R,2,(判定系数,coefficient of determination,):已解释变异占总变异的百分比,判定系数,R,2,(Coefficient of Determination),为何要学,SEMSEM:Structural Equation Modeling,结构方程建模:是基于变量的协方差矩阵(或相关系数矩阵)来分析变量之间关系的一种统计方法,亦称为协方差结构分析我们只学习线性结构方程模型,LISREL,lI,near,S,tructural,REL,ationship,协方差和相关系数,协方差的大小依赖于随机变量,X,和,Y,的单位。,相关系数的取值范围,-1,,,1,科学的最高目标,1,)把握因(,cause,)果(,effect,)关系,2,)把握因果关系的最有力手段,3,)科学也探索用相关方法考察因果关系,4,)统计分析技术按因果探索而发展。,5,),SEM,是探索因果关系的一种相关研究方法,为何要用,SEM,1,)回归的预测应用不要,SEM,2,)回归的解释应用需要,SEM,3,),潜在变量,的问题需要,SEM,潜在变量,很多心理研究中涉及的变量,,都不能准确、直接地测量,,这种变量称为潜变量(,latent variable,),例:智力、学习动机、家庭社会经济地位,所以,我们退而求其次,用一些外显指标(,observable indicators,),去间接测量这些潜变量,例:测量学生的家庭社会经济地位(潜变量),用学生父母教育程度、父母职业、父母收入等(外显指标)来测量。,传统的统计分析方法不能妥善处理这些潜变量,而结构方程模型能同时处理潜变量及其指标。,潜在变量,简言之,结构方程模型是一个包含面很广的数学模型,可用以分析一些涉及潜变量的复杂关系。,许多流行的传统方法(如回归分析),虽然容许因变量含测量误差,但需要假设自变量没有误差。,例:用回归方法以生长时间预测某植物的高度(生长时间是自变量,高度是因变量),假设生长时间的测量不含测量误差,但高度容许测量误差。,因果问题,1,),SEM,以相关数据评价假定的因果关系。,2,)何时能说,X,引起,Y,?,3,),SEM,探究概率的而非确定论的因果。,何时能说,X,引起,Y,?,X,时间在先。(纵向设计),明确说明因果方向,比如不可逆,或者循环。(同时测量设计),常识、理论、经验研究的成果都可以成为说明的,线索,。,难以说明,怎么办?,X,与,Y,之间的关系不因引进第三变量而消失,(统计控制)。,结构方程模型的结构,结构方程模型可以分为测量方程(,measurement,)和结构方程(,structural equation,)两部分,测量方程描述潜变量与指标之间的关系,如家庭收入等指标与社会经济地位的关系,结构模型描述潜变量之间的关系,如社会经济地位与学业成就的关系,x1,x2,1,2,1,1,2,y1,y2,1,2,1,1,2,矩阵形式的方程式,矩阵形式的方程式,而且,与,无相关存在,而且,与,无相关存在,转成向量形式,测量模型,LISREL,应用示例,PRELIS,主要用于对数据进行前期处理和初步分析,处理连续性数据,探索性因子分析,多元回归分析,结构模型,又称为潜在变量模型(,latent variable models,)或线性结构关系(,linear structural relationships,),结构模型主要是建立潜在变量与潜在变量之间的关系,相当类似于路径分析模型,,惟独不同的是路径分析模型使用观察变量,而结构模型使用潜在变量,。,在结构模型中除了涉及外因潜在变量(,)、内因潜在变量(,),也涉及潜在干扰,以,表示。,与,之间的协方差矩阵以,(,psi,)表示。内因潜在变量与内因潜在变量间的协方矩阵以,表示,其结构系数矩阵为,。外因潜在变量与内因潜在变量间的回归系数以,(,gamma,)表示,其结构系数矩阵为,处理连续性数据,如何用菜单对连续性变量进行处理?,读取,EXCEL,数据,定义数据类型,定义整体缺失值,插入,读入其它格式数据文件,选择,File,菜单:,Import Data in Free Format,Import External Data in other Formats,打开,PSF,窗口,定义变量类型,软件将,.sav,或,.xls,格式的数据文件读入并生成,PSF,文件时,变量默认为有序变量,你可以重新定义变量类别(例如,定义某变量为名义变量),点击,PSF,窗口中,Data,菜单的,Define Variables,选项激活,Define Variables,对话框,从变量列表中选择变量以激活,Define Variables,对话框上的所有键,点击,Variable Type,键打开,Variable Types for,对话框,激活,ordinal,(也可选择其它按钮),选中,Apply to all,复选框,点,OK,,回到,Define Variables,对话框,再点击,Define Variables,对话框上,OK,键回到,PSF,窗口,点击,File,菜单上的,Save,选项保存修改后的数据文件*,.psf,插入新变量,点击,Data,菜单,Insert Variables,选项,打开对话框,点击,OK,键,在光标的左边,一个新变量就被插入到数据文件中,点击,Data,菜单,Define Variables,选项激活,Define Variables,对话框,选中刚才插入的变量,点击,Rename,键,键入新的变量名,点击,OK,键回到,Define Variables,对话框,点击,Define Variables,对话框中的,OK,键得到,PSF,窗口,点击,File,菜单上,Save as,选项,在“文件名”字符区键入新的文件名,这样,一个新变量被插入到原有的数据集中并存储为新的文件名。,但是,这个变量的所有值都是,0,为新变量赋值,例:使这个新变量代表变量,A,和变量,B,的和,点击,Transformation,菜单上的,Compute,选项打开,Compute,对话框,选中并用鼠标将新变量拖入,Compute,对话框中的灰色字符区,点击“,=”,键,选中并用鼠标将变量,A,拖入,Compute,对话框中的灰色字符区,点击“,+”,键,选中并用鼠标将变量,B,拖入,Compute,对话框中的灰色字符区,点,OK,看到,PSF,窗口,点击,File,菜单上,save,选项保存,处理缺失值,删除含缺失值的观测对象,或者填充缺失值。,如何删除含缺失值的对象?,Listwise deletion,(成列删除,即删除所有含缺失值的观测对象),Pairwise deletion,(成对删除,即计算两个变量的相关系数时,只使用两个变量都有数据的那些样本),处理缺失值,删除含缺失值的观测对象,或者填充缺失值。,如何填补缺失值?,匹配计算,impute by matching,多元计算,multiple imputation,如何删除含缺失值的对象?,成列删除,定义整体缺失值,并成列删除,打开,PSF,窗口,点,Data,菜单上,Define Variables,选项,在变量列表中选择变量,Group,激活,Define Variables,对话框上的所有键,点击,Missing Values,键打开,Missing Values for Group,对话框,在,Global missing value,对应的字符区键入,9,激活,Deletion methods,中的,Listwise,选项按钮,点,Ok,,回,Define Variables,对话框,点,Ok,,回,PSF,对话框,探索性因子分析,复习:因子分析的主要功能是将具有错综复杂关系的观测变量综合为少数几个因子,以再现原始变量与因子之间的相互关系,同时还可以根据不同因子对变量进行分类。,因此,因子分析本质上是一种用来检测潜在结构是怎样影响观测变量的方法。,因子分析主要有两种基本形式:探索性因子分析(,EFA,E,xploratory,F,actor,A,nalysis,)和验证性因子分析(,CFA,C,onfirmatory,F,actor,A,nalysis,),EFA,和,CFA,当我们手中有原始数据资料,但纷繁复杂的表面关系让我们难以理清头绪的时候,,EFA,可以帮助我们找出事物内在的本质结构;,而当我们头脑中已经有了明确的关系结构、清晰的思路,但仍对这一结构的正确与否有些怀疑,这时,CFA,可以帮助检验已知的特定结构是否按照预期的方式产生作用。,探索性因子分析,是在事先不知道影响因素的基础上,完全依据资料数据,利用统计软件以一定的原则进行因子分析,最后得出因子的过程。(因子结构未知),因此探索性主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度。,验证性因子分析,验证性因子分析充分利用了先验信息,是在已知因子结构的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。,验证性因子分析的主要目的是检验事先定义因子的模型拟合实际数据的能力。,进行验证性因子分析之前要求事先假设因子结构,我们要做的是检验它是否与观测数据一致。,探索性因子分析的基本步骤,收集观,察变量,获得协方差阵,确定因,子个数,提取公,共因子,进行因,子旋转,解释因,子结构,获得因,子得分,用得到的因子解释原始变量,Factor Loading,三个因子与各变量之间的相关系数,称为因子载荷量(,loading,),系数绝对值越大,与相应因子的相关强度越强。,因子旋转,因子旋转:用一个正交阵右乘已经得到的因子载荷阵(由线性代数可知,一次正交变化对应坐标系的一次旋转),使旋转后的因子载荷阵结构简化。,旋转的目的:清晰的负载矩阵,以便研究者进行因子解释及命名。,1.,方差最大化正交旋转,(Varimax),:,使负载的方差在因子内最大,因子与因子之间没有相关,因子轴之间的夹角等于,90,度,2.,直接斜交转轴法,(Direct Oblimin),:使因子负载的差积(,cross-products,)最小化。,3.Promax,转轴法:将直交转轴,(varimax),的结果再进行有相关的斜交转轴。因子负荷量取,2,,,4,,,6,次方以产生接近,0,但不为,0,的值,藉以找出因子间的相关,但仍保有最简化因素的特性。,2.3.,与,1.,不同,因子与因子之间彼此有某种程度的相关,因素轴之间的夹角不是,90,度,优缺点,正交转轴的优点:,因子之间提供的信息不会重叠,被试在某一个因子的分数与在其它因子的分数,彼此独立互不相关,正交转轴的缺点:,研究迫使因子之间不相关,但这种情况在实际的情境中往往并不常存在,所以,有时会采用非正交转轴的方法。,探索性因子分析小结,一般来说,如果没有坚实的理论基础支撑,有关观测变量内部结构,一般用探索性因子分析。,先用探索性因子分析产生一个内部结构的理论,再在此基础上用验证性因子分析,,但必须用分开的数据集来做,。,如果直接把探索性因子分析的结果放到同一数据的验证性因子分析中,就仅仅是拟合数据,而不是检验理论结构。,合理的做法:用一半数据做探索性因子分析,然后把析取的因子用在剩下的一半数据中做验证性因子分析。,验证性因子分析,定义因,子模型,收集观测值,获得相关,系数矩阵,根据数据,拟合模型,评价模型,是否恰当,与其它,模型比较,检验原始假设是否成立,验证性因子分析,如何编程,如何阅读结果,拟合指数的介绍,Factor Analysis,先有方,块,才有圈圈,EFA,先有圈圈才有方,块,CFA,人文,语文,数学,英,语,物理,化学,社会,科学,Using statistical methods to identify the basic underlying variables(factors)that account for the correlation among test scores,To explain why two tests are correlated,To explain how the entire scale is organization,验证性因子分析,例,:,用,17,个题目测量,350,名学生的学习态度及取向,理论假设学习态度及取向分为,5,个维度,(1-4,为,A,,,5-8,为,B,,,9-11,为,C,,,12-14,为,D,,,15-17,为,E),,且,5,个维度都分别相关,请问这假设是否符合实际数据?,思路,1),首先根据理论假设,(,模型,MA),画出路径图,;,(,见图,3-1),2),求得,17,题的相关矩阵;,3),根据路径图写出,LISREL,的程序;,4)RUN,程序;,5),看各种,拟合指数,是否理想;,6),对模型进行修正;,7),得到各种参数值。,结构方程模型的结构,1.,测量模型,x=,x,+,y=,y,+,其中,,:外源潜变量,:,内生潜变量,x,:外源指标,:,x,的误差项,y,:内生指标,:,y,的误差项,x,:外源指标与外源潜变量的关系,y,:内生指标与内生潜变量的关系,结构方程模型的结构,2.,结构模型,对于潜变量间的关系,可用结构方程,表示:,=B+,:内生潜变量。,:外源潜变量。,B,:内生潜变量间的关系。,:外源潜变量对内生潜变量的影响。,:结构方程的残差项。,x1,x2,1,2,1,1,2,y1,y2,1,2,1,1,2,矩阵形式的方程式,矩阵形式的方程式,而且,与,无相关存在,而且,与,无相关存在,转成向量形式,测量模式,x1,x3,1,3,1,11,31,x2,2,21,x4,x6,4,6,1,42,62,x5,5,52,矩阵形式的方程式,用协方差矩阵表示:,转成向量形式:,:,与,之间的协方差矩阵,:,之间的协方差矩阵,:外因观察变量的测量误差,测量模式,路径图的图标规则,1.,路径图的概念,在结构方程模型中用直观的图形表达各变量之间的关系,这种图形称为路径图。,2.,图标规则,1),用圆或椭圆表示潜变量或因子,2),用正方形或长方形表示观测变量或指标,3),单向箭头表示单向影响或效应,4),双向弧形箭头表示相关,5),单向箭头且无起始图形表示测量误差或未,被解释部分,LISREL,数学方程常用符号的表示法及含义,(1-E1)(2-E2),1,2,3,4,5,1,2,3,4,5,(1-E1)(2-E2),(1-E1)(2-E2),结构方程模型的路径图,TD,X,LX,PH GA BE LY Y TE PS,结构方程模型的优点,1.,同时处理多个因变量,2.,允许自变量与因变量含测量误差,3.,同时估计因子结构和因子关系,4.,允许更大弹性的测量模型,5.,估计整个模型的拟合程度,图,3-1,学习态度及其取向模型,M,A,验证性因素分析程序的写法,-1,1),数据输入:,DA NI=17 NO=350 MA=KM,KM SY,DA,为数据输入的命令,,NI,为观测变量数,,NO,为被试人数,,MA,为矩阵类型,,KM,为相关矩阵,,SY,为对称的。,2),模型建构:,MO NX=17 NK=5 LX=FU,FI PH=ST TD=DI,FR,PA LX,4(10000)4(01000)3(00100)3(00010)3(00001),MO,模型,,NX,观测变量,X,数目,,NK,潜变量,数,,LX,为,X,与,的关系矩阵,,FU,为完整,,FI,为固定,,PH,为,之间的关系矩阵,,ST,为对称,对角线为,1,,对角线外自由估计,,TD,为,X,的误差矩阵,,MO,从,MO,开始,是对模型的建构和参数,(parameter,PA),的设定,其中描述了数个矩阵,(,LX-,因子负荷矩阵,NXNK,PH-,因子间的协方差矩阵,NKNK,TD-,指标误差间的协方差矩阵,NXNX),TD:Thelta-Delta,MO,设定某些元素(参数)为固定(,FI,,,fixed,);某些元素自由估计(,FR,,,free,),代替路径图,去表达变量及因子间关系,简单模型而言,在两种情况下要将元素固定。,第一种情况:希望某两个变量(指标或因子)间没有关系,将代表该关系的矩阵元素固定为,0,例:,x1,不从属,,,将该因子负荷()固定为,0,第二种情况:需要设定因子的度量单位。因为观察变量(指标)所隐含的因子本身没有单位,不设定其单位无法计算。做法有二:,一:将所有因子的方差固定为,1,(或其它常数),固定方差法。,二:在每个因子中选择一个负荷固定为,1,(或其它常数),固定负荷法。,一般来说,模型中除了因设定因子的度量单位而固定的路径外,所有需要估计的参数(因子负荷、指标的误差方差、因子之间的相关系数等),都设定为自由,让,LISREL,去估计。,验证性因素分析程序的写法,-2,DI,FR,为对角线元素为自由,非对角线元素固定为,0,。,PA LX,为矩阵,LX,的模式,4(10000),表示连续,4,行格式相同,,1,为需要估计的参数,(,自由,),,,0,为固定,即参数值为,0,。,3),结果输出,OU MI SS SC,OU,为结果输出命令,,MI,为要求输出修正指数,,SS,表示要求输出参数的标准化解,,SC,表示输出参数的完全标准化解。,DA NI=17 NO=350 MA=KM,KM SY,MO NX=17 NK=5 LX=FU,FI PH=ST TD=DI,FR,PA LX,4(10000),4(01000),3(00100),3(00010),3(00001),OU MI SS SC,验证性因素分析程序的写法,-4,4),验证性因素模型设定规则小结,验证性因素模型涉及,3,个矩阵,LX,、,PH,、,TD,。,LX,中凡是表示,X,与,有从属关系的,均设定为自由,无从属关系的,均设定为固定,两种表达方法:,LX=FU,FI,然后列出要自由的元素,,FR LX 1 1 LX 2 1 LX 3 1 ,或用,PA LX,表达,凡自由的元素用,1,表示,凡固定的用,0,表示。,PH,若因子间允许相关,用,PH=ST,;若部分因子间允许相关,用,PH=SY,,,FI,;,VA 1 PH1,1 PH2,2 PH3,3,再在,FR,后列出有相关的元素。,TD=DI,FR,结果输出和解释,1),输入的变量与被试等数据,2),参数设定,3),迭代次数,4),参数估计,5),平方复相关系数,6),拟合指数,7),修正指数,8),完全标准化解,9),模型分析结果解释,(,见图,3-2),操作入门,1.,新建一个命令文件,点击菜单“,File”,下的“,New”,,打开一个小窗口,点击“,Syntax Only”,并按“确定”。然后编写程序。,2.,打开一个命令文件,点击菜单“,File”,下的“,Open”,,然后找到要打开的文件。,图,3-2,模型,MA,的参数估计值,模型修正,-1,1),模型修正:删去,Q4,,将,Q8,归入,1,,新模型为,M,B,。,2),按,M,B,来修改程序,DELETE Q4,Move Q8 to Factor A,SE,;,1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/,MO NX=16 NK=5 PH=ST TD=DI,FR,PA LX,3(10000)3(01000)1(10000)3(00100),3(00010)3(00001),OU MI SS SC,Confirmatory Factor Analysis Example 1,Delete Q4,Move Q8 to Factor B,DA NI=17 NO=350,KM SY,SE;1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17/,MO NX=16 NK=5 PH=ST TD=DI,FR,PA LX,3(1 0 0 0 0),3(0 1 0 0 0),1(1 0 0 0 0),3(0 0 1 0 0),3(0 0 0 1 0),3(0 0 0 0 1),OU MI SS SC,模型修正,-2,3),模型,M,B,的输出结果,4),模型,M,B,输出结果的解释,(,见图,3-3),*,模型,M,B,的,Q8,归属,1,后,因子负荷很高,(0.49),,,2,(94)=149.51,2,/df=1.5,RMSEA=0.040,,,NNFI=0.96,,,CFI=0.97,。,以上结果说明模型,M,B,较,M,A,理想。,模型修正,-3,5),对,M,B,作修正:即,Q8,改为同时归属,A,与,B,。新模型为,Mc,。其它程序不变,只改变,PA LX Mc,输出结果:,Q8,在因子,A,的负荷为,3(10000)0.54,在因子,B,的负荷为,-0.08,。拟合,3(01000),指数与,M,B,基本相同,综合考虑我,1(11000),们选择,M,B,。,(,见图,3-4),3(00100),3(00010),3(00001),结构方程模型的一些概念,1.,潜变量,(latent variable),:不能直接测量的变量,如智力、学业成就、动机、家庭社会经济地位等等。,2.,内生变量(因变量),与,外源变量(自变量),:在一组变量系统中,受其它变量影响的变量称内生变量,即因变量;而引起其它变量变化且自身变化是由系统外其它因素决定的变量称为外源变量,即自变量。如学业成就属于内生潜变量,而家庭社会经济地位则是外源潜变量。,3.,外显指标,(observable indicators),:间接测量潜变量的指标,如用语文、数学、英语三科成绩作为学业成就的指标。,拟合指数,一、拟合指数概述,二、绝对拟合指数,三、相对拟合指数,四、简约拟合指数,五、一般需要报告的拟合指数,一、拟合指数概述,1.,拟合指数的概念,拟合指数是检查理论模型与实际数据是否拟合的指标,是表示再生协方差矩阵,与样本协方差矩阵,S,的差异,(,S),的统计量。,2.,理想的拟合指数的特征:,(1),与样本容量无关,(2),惩罚复杂模型,(3),对误设模型敏感,3.,拟合指数的分类,(1),绝对指数,(2),相对指数,(3),简约指数,二、绝对拟合指数,1.,绝对拟合指数的概念,绝对拟合指数是将理论模型,M,t,和饱和模型,M,s,比较得到的一个统计量。它是检查理论模型与样本数据的拟合程度。它包含基于拟合函数的指数、基于离中参数的指数、近似误差指数、拟合优度指标等。,2.,基于拟合函数的指数:,2,、,2,/df,3.,基于离中参数的指数:,Dk=(,2,-df)/(n-1),4.,近似误差指数:,RMSEA(,近似误差均方根,),5.,拟合优度指标:,GFI,GFI*,AGFI,AGFI*,三、相对拟合指数,1.,相对拟合指数的概念,相对拟合指数是将理论模型,M,t,与虚模型,M,n,比较得到的统计量。,虚模型是指限制最多、拟合最不好的模型。,2.,常用的相对拟合指数,1),非范拟合指数,NNFI(non-normed fit index),以虚模型为基准来衡量模型的拟合改进程度的指数,叫非范拟合指标。会超出,0-1,范围。,2).,赋范拟合指数,NFI(normed fit index),在,0-1,范围内,但易受样本容量大小影响。,3),比较拟合指数,CFI(comparative fit index),取值,0-1,,有估计偏低,没有对复杂模型进行惩罚。,四、简约拟合指数,1.,简约拟合指数设置的目的,为惩罚复杂模型而设置。,2.,简约拟合指数的指标,简约拟合指数用简约比乘以原拟合指数而得。,简约比为,df,t,/df,n,df,t,、,df,n,分别为理论模型,M,t,和虚模型,M,n,的自由度。虚模型自由度最大,理论模型若简单,则简约比,df,t,/df,n,就较大,反之则较小。,五、一般常用的拟合指数,1.,2,值 :越小越好,,P0.05,2.,2,/df,:越小越好,小于,2,或,5,3.RMSEA(,近似误差均方根,),:越小越好,小于,0.05,或,0.08,4.AGFI*,或,GFI*(,拟合优度指数,),:越大越好,一般应大于,0.9,5.NNFI(,非范拟合指数,),:越大越好,一般应大于,0.9,6.CFI(,比较拟合指数,),:越大越好,一般应大于,0.9,
展开阅读全文