同等学力考试心理测量重点统计.doc

资源描述

第一章绪论 1. 记住几个人：实验心理学诞生于德国，代表人物是冯特；第一个直接推动心理测量运动的学者是英国生物学家高尔顿《人类才能及其发展研究》；比纳被认为是心理测量的鼻祖，他是发明智力测验常模量表的第一人； 2. 心理测量发展的新趋势：（4个）以解剖生理学为基础，逐步转向对心智活动的测量有测量简单的感知能力，发展到测量复杂的认知能力由笼统的单一量数评定个体间差异，转变为以多个量数兼顾个别差异和个体间差异心理测量学是随着实验心理学发展而产生的，二者在发展过程中由合到分，最后又走到一起来了。 3. 心理测验的分类（一）按测验的功能分类能力测验，学级测验，人格测验：：（二）按测验的对象分类个别测验，团体测验：（三）按测验材料分类文字测验，非文字测验：（四）按测验的目的分类描述性测验：诊断性测验：预测性测验：（五）按测验的难度和时限分类速度测验：难度测验（六）按测验的要求分类最高行为测验，典型行为测验：（七）按测验的性质分类结构性测验，透射性测验：（八）按测验的应用领域分类教育测验，职业测验，临床测验第二章心理测验的编制编制测验的一般程序（8个步骤要记住） 1．确定测验的目的（1）测量对象：被试（2）测量目标：是用来测量什么心理变量或行为特质的，测量目标必须具有操作定义，即目标要非常具体（3）测量目的：测验作什么用。 2. 制定编题计划编题计划通常是一张双向细目表，指出测验所包含的内容和要测定的各种技能，以及对每一个内容、技能的相对重视程度。 3.；编辑项目（题目）（1）收集有关资料：（2）选择项目形式：测验编制者必须明确题目的表现形式是纸笔测验还是操作测验；是受测者找出正确答案，还是要自己做出正确答案。在选择题目形式要注以下几点：测验目的和材料的性质、接受测验团体的特点、各种实际因素。（3）编写和修订题目制定测题的过程：写出、编辑、预试和修改等一系列过程。编写题目要注意以下几个问题： ² 题目的范围要与测验计划所列的内容技能双维表相一致。 ² 题目的数量要比最后所需数目多一倍至几倍，以备筛选和编制副本。 ² 题目的难度必须符合测验题目的需要。 ² 题目的说明必须清楚明白。 4. 项目的试测和分析（1）试测，进行预备测验，获得可观资料，应注意以下几点： ² 预测对象应取自将来主试测验准备应用的群体。取样是应注意代表性，不必太多，亦不可太少。 ² 预测实施过程与情境力求与将来正式测验时的情况相近似。 ² 预测的时限可以稍宽一些，最好使每个受试者都可以把题目做完，以收集较充分的反应资料，使统计分析的结果更可靠。 ² 在预测过程中，应对受试者的反应情形随时加以记录，如在不同时限内一般受试者所完成的题数、题意不清之处以及其他问题。（2）项目分析对项目的分析包括质的分析和量的分析两个方面。 5. 合成测验（1）项目的选择一般来说，题目的区分度越高越好，这是选择题目的一个重要标准。选择题目另一个指标是难度。难度多大合适并无绝对的标准，需要根据测验目的来确定。（2）项目的编排：对试题的总的编排原则是由易到难。（3）编制复本：要有等值的两份，所谓等值是要符合以下条件： ² 各份测验测量的是同一心理特性。 ² 各份测验具有相同的内容和形式。 ² 各份测验的题目不应有重复的地方。 ² 各份测验题目数量相等，并且有大体相同的难度和区分度。 ² 各份测验的分数分布（平均数和标准差）大致相等。 6. 将测验标准化对于测验的基本要求是准确、可靠。为了减少误差，就要控制无关因素对测验目的的影响，这个控制过程就是标准化。具体包括以下几个方面（1）内容：标准化的首要条件，是对所有受测者施策相同或等值的题目，内容不同，结果就无法比较。（2）施测：为了使测验条件相同，必须有统一的指导与和时间限制。（3）评分：评分必须客观，所谓客观性意味着两个或两个以上的受过训练的评分者之间的一致性达到90%以上。评分客观又三点要求： ² 及时并清楚的记录反应 ² 要有一张标准答案或正确反应的表格，即计分健。 ² 将受测者的反应和几分建比较，对反应进行分类。（4）常模对分数的解释也必须标准化，传统心理学中，个人所得分数与代表便一般人同类行为的分数相比较。这里所谓的“代表一般人同类行为的分数”即为“常模”。建立常模的方法是，在将来要使用测验的全体对象中，选择有代表性的一部分人（称标准化样本），对此样本施测并将所得的分数加以统计整理，得出一个具有代表性的分数分布。标准化样本的平均分，即为该测验的常模。 7. 对测验的鉴定（1）信度：指测验的一致性或稳定性。确定信度多采用相关法，以相关系数大小来表示信度高低。（2）效度：指得是测量的有效性和正确性，这是测量工具最基本的要求。效度确定的方法视测量的性质和目的而定，一般较效度分为三大类：实证效度、内容效度、构想效度。 8. 编写测验说明书（1）测验的目的和功用（2）编制测验的理论背景以及选择题目的依据（3）测验的事实方法、时限及注意事项（4）测验的标准大案和评分方法（5）常模资料，包括常模表、常模适用的团体及对分数如何解释（6）测验的信度效度资料，包括信度系数、效度系数以及这些数据在什么情境下得到的。第三章测验的实施和记分测验的误差（都是重点） 1．误差：是在测量中与目的无关的变异所引起的不准确或不一致的效应。即误差是由与测量目的无关的变异引起的，而且是不准确或不一致的测量结果。 2．误差有两种形式：随机误差和系统误差。 3．随机误差是由与测量目的无关的偶然因素引起而又不易控制的误差，它使多次测量产生不一致的结果。这种误差的方向和大小的变化完全是随机的，无规律可循。 4．系统误差是由与测量目的无关的变异引起的一种恒定而有规律的效应，稳定地存在于每一个测量中，此时测值虽然一致，但不正确。 5．系统误差只影响测值的准确性，而随机误差既影响准确性，又影响一致性。系统误差只与效度有关，而随机误差与效度和信度都有关系。 6．常见的误差来源有三个方面：测验内部，施策过程，受测者本身（1）测验内部引起的误差：主要来源于题目取样，当测验的题目较少或取样缺乏代表性时，被试的反应受机遇影响较大；当借个测验复本不等值时，接受不同的题目，就会获得不同的分数。（2）由施测过程引起的误差：物理环境、主试者方面、意外干扰、评分计分（3）由受测者本身引起的误差：测验的经验、练习因素、应试动机、测验焦虑、反应定势、生理因素反应定势：也称反应的方式或反应风格，是指独立于测验内容的反应倾向，即由于每个人回答问题的习惯不同，而使得有相同能力的被试获得不同的分数。第四章测验结果的解释第一节参照常模的分数解释 1. 常模团体是由具有某种共同特征的人所组成的一组群体，或是该群体的一个样本。常模团体的条件（1）群体必须明确（2）常模团体必须是所测群体的代表性样本（3）样本大小要适当：所谓大小适当，一般是从经济或实用的可能性和减少误差两个方面来考虑样本大小的。（4）主要常模的时间性：选择常模时要选择较为新近的常模，时间长的常模要进行修改。（5）注意一般常模与特殊常模的结合：测验手册所列常模通常为典型团体建立的，比较一般化，不一定适合使用者的具体情况，解决办法就是为每一个特定目的的测验建立特殊常模。 2.几种主要的常模参照分数 (1) 发展量表：智力年龄：年级当量：发展循序量表： (2) 商数：比率智商，教育商数 (3) 百分位：百分等级 (4) 标准分数参照标准的分数解释测验可以分为参照常模和参照标准两种。在常模参照测验中，一个人的分数是通过与其他人的分数进行比较来解释的，并能表示成在某个比较团体内的相对等级。在标准参照测验中，一个人在测验上的成绩不是和其他人比较，而是和某种特定的标准比较。一种标准是对测验所包含材料熟练或掌握程度，涉及的主要是测验内容，所以这种分数叫内容参照分数。另一种比较标准是外在效标，即用预期的效标成绩来解释测验分数，涉及的时候来的结果，叫结果参照分数。一、内容参照分数 1. 内容参照分数的定义：又叫范围参照，是看被试对指定范围中的内容和技能掌握的如何。 2. 几种主要的内容参照分数 (1) 掌握分数：代表最低熟练水平的分数。 (2) 正确百分数：掌握分数可能会失掉一些信息，有时需要以被试对内容的掌握的程度来报告分数，最简单的指标就是正确百分数。正确百分数=答对题目数/总题目数×100% (3) 等级评定量表：当需要衡量一个人完成某种过程或生产某种产品的能力时，可采用等级评定量表。 3. 内容参照分数的评价 (1) 优点在于它们用个人所掌握内容或技能的水平来描述行为，指示一个人知道什么和能做什么。 (2) 能够提供教学效果的反馈，适合于计算机辅助教学以及利用程序教材自我掌握进度的学习。 (3) 主要用于学绩测验以技能确定出可接受的最低标准的资格测验。 (4) 内容参照分数和常模参照分数指示看待一个人的行为的两种不同方式，两张并不互相排斥。二、结果参照测验 1. 结果参照分数的定义：将效度资料与常模资料结合起来，用效标行为的水准来表示的分数叫结果参照分数。 2. 呈现结果参照分数的方法五．测量的信度 1．信度的定义：指测量的一致性和可靠性程度，信度只考虑随即的、偶然的误差影响。在测量理论中，信度被定义为，一组测量分数的真变异数与总变异数（实得变异数）的比率。即： rxx=ST2/SX2 rxx代表测量的信度，ST2代表真分数的变异数，SX2代表实得分数的变异数，即总变异数。信度系数：大部分的相关指标都以相关系数表示，即用同一被试样本所得的两组资料的相关作为测量一致性的指标，称作信度系数。对信度系数要注意三点：(1)在不同情况下，对不同样本，采用不同方法会得到不同的信度系数，因此一个测验可能不止一个信度系数；(2)信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因；(3)获得较高的信度系数并不是心理测量追求的最终目的，他只是迈向目标的一部，是使测验有效的一个必要条件。 3. 信度的种类 1．重测信度：用同一种测验，对同一组受试者，前后施测两次，再根据受试者两次测验分数计算其相关系数，即得重测信度。这种信度能表示两次测验结果有无变动，反映测验分数的稳定程度，故又称稳定性系数。 2．复本信度：因为任何测验只是所有可能题目中的一份取样，所以可以编制许多平行的等值测验，叫做复本。如果一种测验有两个以上复本，根据一群受试者接受两个复本测验的得分计算相关系数，即得复本信度。 3．分半信度：在测验没有复本且只能实施一次的情况下，通称采用分半法估计信度。即将测验题目分成对等的两半，根据各人在这两半测验的分数，计算器相关系数，来作为信度指标。 4．同质信度：所谓同质性指的是测验内部所有题目间的一致性。这里讲的是分数的一致，而不是题目内容或形势的一致 4. 评分者信度：考察评分者新的方法：随机抽取相当份数的试卷，由两位评分者按计分规则分别给分。然后根据每份试卷的两个分数计算其相关系数，即得评分者信度。般要求在成对的、受过训练的评分者之间平均一致性达到0.90以上，才认为评分是客观的。各种信度系数相关误差变异的来源信度系数的类型误差变异的来源重测信度时间取样复本信度（连续施测）内容取样复本信度（间隔施测）时间与内容取样分半信度内容取样同质性信度内容的异质性评分者信度评分者间的差异 4.影响信度的因素有： ² 被试方面：身心健康状况、动机、注意力、持久性、求胜心、作答态度等 ² 主试者方面：不按规定实施测验、制造紧张气氛，给与特别协助，评分主观等 ² 测验内容方面：试题取样不当，内部一致性低，题数过少，题意模糊等 ² 测验情境方面：测验现场条件 ² 评分计分方面：被试样本团体的异质性，平均水平，测试题目的数量，难度，间隔时间等六．效度 1.效度的性质效度指的是测量的正确性，即一个测验或量具能够测量出其所要测量东西的程度在测量理论中，效度被定义为：在一组测量中，与测量目的有关的真实变异数（由所要测量的变因引起的有效变异）与总变异数（实得变异数）的比率，即：效度=SV2/SX2=RXY2 效度和信度关系信度和效度的差别在于所涉及的误差不同。信度考虑的是随机误差的影响，效度的误差则还包括由于测量了对测验目的来说无关的变量所引起的系统误差。信度高不一定效度高，但是如果一个测验的效度高的话，则信度必须高。换句话说，一个测验对某一个目的具有一定的信度，但并不一定是有效的，而一个测量工具如果对一个目的是有效的，那么它一定是可信的。 1．内容效度是指测验题目对有关内容或行为范围取样的适当性。这种测验效度主要与测验内容有关，所以叫内容效度。内容效度的评估方法主要应用于对学绩测验的评估。一个测验要有内容效度，必须具备两个条件：（1）要有定义的完好的内容范围（2）测验题目应是所界定的内容范围的代表性取样所谓代表性取样，指根据材料与技能的重要性来选题目，而不是随机取样，确定内容效度的方法：1.专家判断2.统计分析3.经验法 2. 构想效度：构想是心理学理论所涉及的抽象的、假设性的概念或特质，如智力、焦虑、内向、动机等，它们往往用某种操作来定义并且用测验来测量。构想效度指某一个测验对某种心理学理论所涉及的抽象概念或心理特质测量的如何。 3. 效标效度又叫实证效度是指一个测验对处于特定情景中的个体的行为进行预测时的有效性，也就是对研究者感兴趣的行为能预测到什么样。其中，被预测的行为是检验测验效度的标准，简称效标。由于这种效度是看测验对效标预测的如何。效标测量的条件：一个好的效标必须具备以下条件：有效性、可靠性和客观性、实用性效标的特性：多样性，复杂性，特殊性，时间性确定效标效度的方法：相关法，区分法，命中率，功利率影响效标效度的因素：（同影响信度，效度的因素）效度资料的概化:概化指在一定条件下得出的结论是否适用于其它情况七．项目分析 1.难度的定义难度的指标通常以通过率表示，即以答对或通过该题的人数的百分比来表示。 P=R/N×100% P代表难度，R代表答对或通过题目的人数，N代表全体被试人数 2.区分度的定义区分度是指测验项目对所测量的心理特性的区分程度或鉴别能力，也成项目的效度。 (1) 项目特征曲线项目反应与效标（或测验分数）的基本关系可以用项目特征曲线来表示。项目特征曲线描述了效标分数不同的受测者在该项目上的通过率。如果项目的通过率在效标分数的低端很低，在效标分数的高端很高，说明这个项目能将不同水平的受测者作出有效区分。一般来说，曲线坡度越陡，鉴别能力越好，预测误差越小，当坡度为90度时，区分度为1.00（最高），当坡度为0时，区分度为0。 (2) 鉴别指数（考过） ² 鉴别指数的计算：D=PH-PL D为鉴别指数，PH为高分组通过人数的百分比，PL为低分组通过人数的百分比。 3.区分度的相对性(4点) (1) 采用不同的计算方法区分度的值不同 (2) 用相关法计算的区分度值受样本大小的影响 (3) 用两个极端组通过率的差异作为区分度的指标，其值受分组标准的影响。 (4) 区分度值的大小与样本的同质性有关对于教育成就测验来说，一般要求项目与总分的相关达到0.20以上，高分组与低分组通过率之差达到0.15～0.20以上。 4.区分度与难度的关系一般来说，较难的项目对高水平的被试区分度高，较易的题目对水平低的被试区分度高，中等难度的项目对中等水平的被试区分度高。这与中等难度的项目区分度最高的说法并不矛盾，因为对被试总体较难或较易的题目，对于水平高或水平低的被试则成了中等难度

展开阅读全文