1、资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。纵向研究专题我感觉, 把我用黑体标注的内容背下来, 这样会节省一点记忆空间, 大家看着办吧。缺陷是纵向设计的实验范式没有办法用表格呈现给大家, SORRY, 自行理解一下吧。专题一: 概述一基本概念1. 追踪数据: 指一被试群体在一个或多个变量上、 多个时间点测量的结果。主要关心两个方面的问题, 描述个体的发展趋势和个体间发展趋势的差异; 对被试的发展趋势及原因进行解释。预测变量能够使随时间变化的因素, 也能够是不随时间变化的个体特征因素, 如性别。与横断研究相比, 其最大的优点是能够合理地推论变量间存在的因果关系。2. 因果关系的
2、条件: 1. 假设的原因变量和结果变量间存在相关; 2. 时间关系上, 原因变量在前, 结果变量在后; 3. 在所考虑的模型中, 其它原因变量对结果变量的影响能被排除。可见, 横断研究永远无法满足条件2.3. 与横断研究比较优劣: 劣势: 需要更多的时间投入( 测量多次) 和更大的成本( 必须测量相同被试) 优势: 能够就某一现象随时间的变化进行分析; 能够对变量间的因果关系进行合理的假设。二纵向研究的类型1. 同时性横断研究: 指对不同年龄组样本进行同时测量, 自变量是不同年龄群体, 目的是描述某个因变量随年龄的变化情况, 但并非真正意义的纵向研究。其优点是能够在很短时间( 一次测量) 对不
3、同年龄特征进行了解; 缺点, 无法区分年龄和组群两个效应, 无法回答差异产生的原因是年龄还是组群; 也无法回答个体内的发展趋势。2. 趋势研究: 又称重复横断研究, 共进行T次测量, 每次测量从同一个年龄群体抽取不同的被试进行, 实质也不是纵向研究, 其优劣同上。3. 时间序列研究: 相同的被试在多个时间点的多次测量, 此种设计能够分析个体内发展的问题, 也能够就被试间变化的差异进行分析。预期的追踪研究: 被观测个体真正是从T1时刻开始, 到Tt时刻, 那么其内部效度将是非常高的。但费时较长, 可是是真正意义上的追踪研究, 收集了相同被试在一段时间内对同一组问题的信息, 描述了个体真实的状态变
4、化。回溯研究, 实验从Tt开始, 要求被试对过去经历进行回顾, 省时省力, 但有以下缺陷: Tt被试的随机性无法保证, 尽管采用随机对Tt被试抽样, 但T1到Tt被试的变化不能保证是随机变化; 由于是回顾的结果, 变量间的因果关系假设的确定会很困难; 回顾数据信度往往很低。一般只是准追踪研究, 因为因果过程并不完整, 且不精确的记忆会带来结果的扭曲。4. 干预研究, 先将被试随机分为实验组和干预组, 分别对两组进行Tt次测量, 目的在于比较实验处理效应, 最常见的范式是实验前后测设计。干预研究不但关注发展趋势, 还关注不同组的平均水平和发展趋势的差异。5. 群组序列设计或加速设计, 是一种既能
5、体现追踪研究的优点又能客服其局限性的设计。经过对不同年龄群体有限的追踪数据进行连接, 从而对个体某一特征在较长时间内的发展趋势进行分析, 即经过同时对几个不同年龄群体进行短时间的追踪, 然后将几个群体的数据结合起来得到近似的长时间的追踪研究数据, 只需要相对短的时间的追踪测量, 就能够了解被试某一特征较长时间发展的变化趋势, 既能减小测试效应对实验结果带来的影响, 又能减小被试流失的机会, 降低实验费用。同时由于在不同群体间进行观测, 还能就重复测量的发展趋势是否在不同年龄群体中相同这一问题进行探讨。其缺点是没有解决重要事件及干预变量对发展过程影响的问题。三 缺失值及相关议题几乎所有的追踪研究
6、都会遇到被试流失问题, 不同的缺失数据类型要求研究者采用不同的处理缺失技术。1. 数据缺失类型: 1.被试由于遗漏或疏忽某一题或某一调查造成的缺失本质上是一种随机误差。2.被试不参与或没有测量, 是由于被试流失所导致, 此时缺失变量本身的特征有可能是导致后来测量数据缺失的原因。3. 设计本身带来的数据缺失, 即有计划的缺失, 如群组序列设计, 这类缺失是能够控制的, 能够视为完全随机缺失, 虽然会造成统计检验力降低, 但带来的统计推论的错误的可能性则是最小的。2.理解: 某调查含X、 Y两个变量, 只有Y变量含有缺失值。1. 完全随机缺失( CMAR) : Y值是否缺失独立于X与Y, 即缺失与
7、观察都是随机的, 那么有缺失值的数据和没有缺失值的数据能够被视为是从总体中随机抽取的两个样本, 此时从没有缺失值的完整数据分析得到的参数估计结果是无偏的, 因此缺失能够被忽略, 即能够采用列删除的方法, 只用完整数据进行分析。2. 随机缺失(MAR): 变量Y的缺失依赖于另一个不含缺失值的变量X, 而不系统地依赖于有缺失值的变量Y, 这是追踪数据一般会满足的情况, 缺失数据此时也能够被忽略, 能够用完整数据得到无偏的参数估计结果。3. 非随机缺失(MANR): Y的缺失值依赖于变量Y的值, 此时的缺失是不能被忽略的, 即使用不含缺失值的完整数据分析的结果是有偏的。3. 处理缺失值的常见方法:
8、1. 对完整数据进行分析: 删除含缺失值的样本, 仅对不含缺失值的样本进行分析, 简便且实用, 但在完全随机缺失假设不满足的前提下, 得到的估计结果可能是严重有偏甚至是无效的。2. 加权分析: 从样本到总体的推论往往需要考虑不同特征群体抽取的权重, 权重与样本被抽取的概率成反比, 实际应用中, 能够先对每一个子类抽取到的比例进行加权, 然后再对加权后每一个子类的均值替代缺失值, 这样能够使总体的均值保持不变, 但方差往往会发生变化。3. 设算( imputed) : 首先用设算值替代缺失数据, 然后用标准的处理完整数据的方法对数据进行分析, 常见的设算方法有Hot Deck法, 均值替代法,
9、回归设算。但为了保证推论的有效性, 实际分析中必须考虑实际值与设算值之间的差异。4. 基于模型的方法。经过对部分缺失数据定义模型, 用极大似然估计法对参数进行估计, 这一能够进行多重设算, 设算值是在特定的没有反应( Nonresponse) 模型的假设下, 重复的参数估计值, 其优点是校正了单一设算的不足, 能够保证结果推论有效地反应由于数据缺失带来的样本变异。四 追踪研究的效度问题纵向研究结果的稳定性和可推广性受到下面四个方面的影响: 1. 统计结论的有效性, 即研究设计检验出实际差异结果的敏感程度或检验力, 即观测样本间的差异是否有实际的意义。纵向研究中, 不同时间点的观测结果往往具有相
10、关性, 使得许多传统要求观测结果相互独立的统计方法失效, 即参数估计的无偏性、 有效性和一致性受变量间相关关系的影响。必须使用专门的分析相关样本的统计方法。2. 内部效度, 所发现的结果效应是由于所关心的原因所致, 而不是其它可能原因所致的确定程度( 所发现的这一差异有可能是由于其它原因造成的吗? ) 。纵向研究影响内部效度的因素有: 历史重大事件、 成熟、 测试效应、 工具、 被试缺失, 常见的提高内部效度的方法是设在实验组和控制组。3. 外部效度, 研究所发现的结论在理论、 被试群体及测量情景方面的推广程度, 而不是仅仅限于所研究的样本, 即经过样本研究的结论能否推广到更一般的总体。4.
11、结构效度, 研究中所假设的理论结构被正确操作化定义的程度, 即研究测量的变量是否正确表示了理论上所考察的问题。五 纵向研究的数据分析基本类型: 自回归与增长曲线标准: 一个合理的、 能描述增长变化趋势的模型应该不但能描述个体的发展趋势, 还能够描述变化趋势的个体差异。另外, 模型还应对个体发展趋势存在差异的原因进行预测和解释, 能对该组特征进行分析, 在组水平上对发展趋势进行分析。方法: 重复测量的方差分析( 将测量的多个时间点看做一个因变量) 和多元方差分析( 将测量的多个时间点看做多个因变量) ; 时间序列分析; 潜变量增长曲线模型; 多层线性模型。其中方差分析侧重解决总体平均发展趋势;
12、后两种方法则还注重个体发展趋势之间的差异。( 时间序列研究没有资料, 估计绝对不会考) 应试小结: 个人觉得, 重要性排序: 一、 二、 五、 三、 四。其中五在后面三个专题专门简述, 最近陈红老师的研究的热点是主观幸福感的纵向研究, 因此请结合黄老师的主观幸福感议题进行复习。专题二: 方差分析在纵向研究中的应用知识点回顾: 实验设计的两大基本目的: 消除系统偏差与减小误差方差( 组内变异) 。组内变异来源于被试间的个体差异, 因此即便被试接受相同的实验处理, 实验效果也会由于被试间的差异而不同。协方差分析经过控制协变量的影响减小误差方差, 区组设计则经过剔除区组变异减小误差方差。重复测量设计
13、是极端的区组设计方法, 即每个区组只有一个被试, 每个被试重复接受所有的实验处理, 即被试内设计, 其突出优点是将个体差异引起的变异完全从误差方差中剔除, 因此比完全随机设计有更强的检验力, 且要求较少的被试量。比较概念: 重复测量的方差分析, 一元方差分析, 将不同时间点的几次测量看作一个因变量进行分析。多元方差分析, 将不同时间点的几次测量看作几个不同的因变量同时分析。假设条件: 重复测量方差分析要求满足球形假设, 即方差齐性, 具体说, 即任意两对重复测量数据总体相关系数相等且每个重复测量变量总体方差相等, 追踪研究中很难满足, 因为相邻测量的相关往往强于不相邻测量间的相关, 间隔越长,
14、 相关越低。服从一元正态分布。多元方差分析, 满足多元正态分布即可, 不要求满足球形假设。评价: 在满足球形假设前提下, 重复测量方差分析有更强的检验力; 违反球形假设的后果比违反正态性假设的后果严重, 因此多元方差分析被更广泛的运用。第一类错误: 重复测量方差分析, 球形假设不成立时, 第一类错误的概率远大于指定的值, 即便是进行了校正, 也只是接近指定的值。多元方差分析, 假设条件满足时, 所犯第一类错误的概率等于指定的值。检验力: 重复测量方差分析, 在球形假设满足时, 强于多元方差分析。不满足球形假设时, 视样本量而定, 中等样本时, 多元方差分析的检验力时强时弱; 小样本多元方差分析
15、有时甚至无法进行。缺陷: 1. 较少关注个体间的水平差异及其原因, 而是对不同测量的均值差异进行检验; 关注总体平均发展趋势, 而较少关注个体间的发展趋势差异及对差异原因作出预测和解释。2. 传统的线性模型要求个体间独立观测, 即误差之间相互独立, 但追踪研究中往往很难满足( 同一班级, 同一家庭的被试具有相似性) , 此时需要更宽限制条件的分析技术, 如多层线性模型和潜在增长模型。3. 纵向数据难以避免缺失值, 方差分析法一般采用列删法, 只对完整数据个体进行分析, 但实际中很难保证数据是完全随机缺失的, 且即便满足完全随机缺失, 在缺失数据较多时, 也会造成统计检验力下降。实际研究中, 只
16、有缺失数据少于5%且满足完全随机缺失, 使用完整数据进行分析得到的结果才比较可靠。4. 不能很好分析随时间变化的变量对重复测量的影响, 也不能很好分析不同被试测量时间点不同的情形。应试建议: 既然方差分析是考试的保留曲目, 前几年都没有考过重复测量的方差分析; 而纵向研究是现在学院研究的热门, 建议重点理解这个部分, 能够结合陈红老师的相关研究看看, 至于相关研究的内容, 正在想办法去弄, 大家集思广益, 找她的学生。专题三 多层线性模型在纵向研究中的应用概念: 多层线性模型主要用来处理具有嵌套结构的数据, 如学生嵌套于班级, 班级嵌套于学校。在追踪研究中, 重复测量被视为嵌套在个体内。回顾:
17、 追踪研究的两个目的, 个体随时间变化的特征( 第一水平分析) 与个体发展特征之间的差异( 第二水平分析) 。对应的数据形态: 测量水平数据集, 包括四类变量, 个体编号, 描述时间的变量, 结果变量和预测变量( 预测变量能够是随时间变化而变化, 也能够是随时间不变的变量) 。优点: 1. 分别考虑测量水平和个体水平的差异, 能够明确表示出个体在第一水平( 不同测量点) 的变化情况, 考虑个体不同发展的方法更符合一般的理论假设。2. 将重复测量是做嵌套于个体观测数据的多层分析模型, 对数据资料的要求较低, 且不同个体能够有不同的测量次数, 测量与测量间的时间跨度也能够不同。3. 多层分析模型能
18、够定义重复观测之间的复杂协方差结构, 并对不同的协方差结构进行检验, 还能够经过定义第一水平和第二水平的随机变异来解释个体随时间变化的复杂情况。4. 当数据满足传统多变量分析技术时, 多层次模型的结果与传统方法结果相同。5. 采用多层次模型能够考虑更高层次的变量对个体增长的影响。6. 经过对不同预测变量的定义, 多层模型能够探讨不同组的平均发展和不同个体发展的问题。7. 在处理缺失数据时, 多层次模型也更为灵活, 但该缺失数据必须是因变量上的缺失而不能是预测变量上的缺失。专题四 潜变量增长曲线模型在纵向研究中的应用应试建议, 这个已经有点深了, 可是考虑到庆林大叔和每年统计对结构方程模型的偏爱
19、, 还是看看为妙。多层次模型需要分别考虑测量水平和个体水平, 而潜变量增长曲线模型则利用结构方程模型原理, 将测量水平分析和个体水平分析结合起来, 用类似于验证性因素分析的方法定义潜变量, 用时间的函数确定因素负荷, 从而用潜在变量描述具体的增长趋势。潜变量增长曲线模型能够直接处理变量间复杂的因果关系, 即不但能够对变量间直接的影响关系进行分析( 多层线性模型能够) , 而且能够对变量间间接地因果关系进行分析( 多层线性模型不能够) 。由于是基于协方差结构模型的理论, 不但能够分析观测变量间的关系, 还能够在考虑测量误差的基础上对潜在变量间的关系进行考察。同时还能够得到包括所有变量的模型整体拟
20、合情况, 并根据修正指数对模型进行修改, 不但就个体发展轨迹进行描述, 还能够分析个体间存在的差异及其原因, 也能够用多样本分析技术有效处理缺失值。其缺点在于由于是基于结构方程模型对变量间关系进行分析, 为了得到可靠的结果, 对样本量有一定要求; 同时要求所有个体测试时间间隔相同, 以及时间间隔间有明显的变化趋势。精华版: 重复测量的方差分析主要用来比较均值间的差异, 一般不对增长的变异情况进行分析, 即不关注个体增长曲线存在的差异, 有计算简单, 易于理解等优点。其主要缺陷是数据中的缺失值得不到精确的估计, 在缺失量较大时, 分析所用的数据信息损失较大; 不能对随时间变化的协变量进行分析,
21、也不能同时处理既含有预测变量又含义结果变量的潜变量结构模型。同时也不能处理分段间距不等或测量次数不等的数据。在多层结构中, 采用多层分析的方法处理重复测量的数据与时间变量之间的关系, 能够对非平衡测量数据得到的参数进行有效的估计, 因此不要求所有的观测个体有相同的观测次数, 也不要求不同个体观测间有相同的时间间隔, 这使得多层线性模型有传统的方差分析与潜变量增长模型所没有的无法比拟的优势。多层分析模型还能够定义重复观测变量之间复杂的协方差结构, 并对所定义的不同协方差结构进行显著性检验。其缺点是多层分析模型的估计方法较传统方法复杂, 因此需要专门的复杂软件, 且不能处理变量间间接地关系和处理复
22、杂的观测变量和潜变量之间的关系。潜变量增长曲线模型不但能够处理变量间直接的影响关系, 还能够处理间接的影响关系。由于是基于结构方程模型原理, 潜变量增长模型不但能够处理观测变量之间的关系, 还能够在考虑测量误差的基础上处理潜变量之间的关系。前变量增长模型能够用结构方程模型软件进行分析, 能够得到模型的整体拟合情况及利用修正指数进行模型修正。不但对个体间的发展轨迹进行描述, 还能够分析个体间存在的差异及差异的原因。不但能够对给定的趋势进行检验, 还能够对多于两点的未知趋势进行探索; 还能够分析随时间变化的预测变量对因变量的影响以及用类似于结构方程模型多样本分析技术的方法比较多个样本之间的差异及有效处理缺失值。其缺点是, 对样本容量有要求, 对个体观测的时间间隔要求相同, 且必须符合每个个体的增长变化与所经历的时间有一定关系的假设, 否则模型就没有意义。结语: 在实际应用中, 对于纵向数据的研究, 不急需要对个体增长的平均趋势进行研究, 还需要分析个体之间增长存在的差异, 作为综合分析法, 应该能同时解决上述两个问题, 能够帮助我们发现事物发展的更深一层的规律, 对个体间的发展变化进行进一步的分析和解释, 为理论研究提供更加有意义的实证研究成果。
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100