资源描述
体体 育育 测测 量量 的的 科学性科学性北北 京京 体体 育育 大大 学学统计测量教研室统计测量教研室任任 弘弘 博士、副教授博士、副教授本科程主要内容:本科程主要内容:1体育测量的科学性理论体育测量的科学性理论2评价理论与方法评价理论与方法3人体形态测量人体形态测量4、体质研究、体质研究 身体综合能力身体综合能力形态结构形态结构生理机能生理机能身体素质及基础运动能力身体素质及基础运动能力心理素质心理素质智力水平智力水平专项技术水平专项技术水平专项战术水平专项战术水平体体育育测测量量内内容容形态结构形态结构 是身体各种能力的基础是身体各种能力的基础体格体格:身体各环节的长度、宽度、围度和厚度:身体各环节的长度、宽度、围度和厚度体型体型:对人体某个阶段形态结构及组成成分的描述:对人体某个阶段形态结构及组成成分的描述身体成分身体成分:身体中的脂肪含量:身体中的脂肪含量体姿体姿:身体各部在空间的相对位置:身体各部在空间的相对位置骨龄骨龄:人体的生理年龄:人体的生理年龄生长发育成熟度生长发育成熟度:第二性征发育水平:第二性征发育水平生理机能:生理机能:是指人的整体及其组成的各器是指人的整体及其组成的各器官、系统所表现的生命活力官、系统所表现的生命活力呼吸机能呼吸机能:肺活量、最大摄氧量肺活量、最大摄氧量、循环机能循环机能:安静状态、定量负荷状态、最大负安静状态、定量负荷状态、最大负荷状态下心血管系统的机能反应荷状态下心血管系统的机能反应代谢机能:代谢机能:有氧代谢和无氧代谢有氧代谢和无氧代谢感觉机能感觉机能:肌肉用力感觉肌肉用力感觉平衡机能平衡机能:静态平衡和动态平衡静态平衡和动态平衡身体素质:身体素质:人体在运动中所表现出的速度、人体在运动中所表现出的速度、力量、耐力、灵敏及柔韧等方力量、耐力、灵敏及柔韧等方 面的机能能力面的机能能力速度:速度:位移速度、动作速度和反应速度位移速度、动作速度和反应速度力量:力量:等张性力量和等长性力量等张性力量和等长性力量耐力:耐力:一般耐力、速度耐力、力量耐力一般耐力、速度耐力、力量耐力 和静力性耐力和静力性耐力柔韧:柔韧:关节活动范围,受关节结构、跨过关节的肌肉、肌关节活动范围,受关节结构、跨过关节的肌肉、肌腱和韧带等因素的影响腱和韧带等因素的影响灵敏:灵敏:人体在各种复杂条件下快速、准确、协调地改变身人体在各种复杂条件下快速、准确、协调地改变身体姿势、运动方向和随机应变的能力体姿势、运动方向和随机应变的能力精神、心理因素精神、心理因素认识:认识:包括感觉、知觉、记忆、想象及思维;包括感觉、知觉、记忆、想象及思维;情感:情感:是满意、愉快、愤怒及烦恼等态度体验是满意、愉快、愤怒及烦恼等态度体验意志:意志:在认识和情感体验的基础上,人类为了满在认识和情感体验的基础上,人类为了满足某种需要,自觉地确定目的,指定计划,克服足某种需要,自觉地确定目的,指定计划,克服困难而努力达到目的,这是人类的意志过程困难而努力达到目的,这是人类的意志过程。智力智力智智力力是是各各种种认认识识能能力力的的总总和和。是是获得得知知识的的能能力力,是是认识、理理解解事事物物和和运运用用知知识与与经验解决解决问题的能力的能力。包包括括:观观察察力力、注注意意力力、记记忆忆力力、想想象象力力、思维力、创造力。思维力、创造力。运动技术 与专项密切结合与专项密切结合 运动技术测量内容:技术容量运动技术测量内容:技术容量运动技术测量内容:技术容量运动技术测量内容:技术容量 技术全面性技术全面性技术全面性技术全面性 技术效果技术效果技术效果技术效果运动技术测量方法:运动技术测量方法:运动技术测量方法:运动技术测量方法:技术测量(直观测量和仪器设备测量)技术测量(直观测量和仪器设备测量)技术测量(直观测量和仪器设备测量)技术测量(直观测量和仪器设备测量)理论测量理论测量理论测量理论测量战术水平战术水平理论测验理论测验教练员评定教练员评定比赛观察比赛观察数值数值数值数值记号记号记号记号身体综合身体综合身体综合身体综合能力能力能力能力结果结果结果结果测量测量测量测量评价评价评价评价收集信息收集信息收集信息收集信息处理信息处理信息处理信息处理信息解释与反馈解释与反馈解释与反馈解释与反馈测量与评价的关系测量与评价的关系测量的可能性测量的可能性只只有有当当某某种种特特征征能能够够清清楚楚地地加加以以确确定定,并并对对拟拟测测个个体体的的特特性性加加以以明明确确辨辨别别,以以至至足足以以观观测测出出其其间间差差异异时时,才才具具有有测测量量的的意意义义和和现实性。现实性。体育测量评价的发展趋势:体育测量评价的发展趋势:1、多学科、多部门协作;、多学科、多部门协作;2、与运动专项紧密结合;、与运动专项紧密结合;3、应用领域广泛、应用领域广泛运动员竞技能力评定运动员竞技能力评定运动员选材运动员选材体质研究体质研究测量的科学性测量的科学性可靠性、有效性、客观性可靠性、有效性、客观性(三性理论三性理论)测量值测量值测量值测量值指标真值指标真值指标真值指标真值属性真值属性真值属性真值属性真值客观性客观性客观性客观性信度:可靠性信度:可靠性信度:可靠性信度:可靠性效度:有效性效度:有效性效度:有效性效度:有效性测量三性的讲解内容测量三性的讲解内容定义定义分类分类估价方法估价方法影响因素影响因素测量的可靠性(信度测量的可靠性(信度ReliabilityReliability)一、可靠性的定义:一、可靠性的定义:1 1、狭义的操作定义:、狭义的操作定义:在相同条件下对同一批受在相同条件下对同一批受试对象使用相同的测量手段,重复测量结果的一试对象使用相同的测量手段,重复测量结果的一致程度。用可靠性系数致程度。用可靠性系数 r r 表示。(表示。(r r值越接近值越接近1 1,越可靠),越可靠)2 2、一般定义:、一般定义:测验结果的一贯性、一致性、再测验结果的一贯性、一致性、再现性、稳定性。(张力为)现性、稳定性。(张力为)r=2T 2X=2X-2E 2X=1-2E 2x3 3、理论定义:、理论定义:真实值方差与实测值方差的比值。真实值方差与实测值方差的比值。真实值方差与实测值方差的比值。真实值方差与实测值方差的比值。X=T+E X=T+E信度反映的是测量结果受到随机误差影响的信度反映的是测量结果受到随机误差影响的程度,是评价测量质量的最基本的指标。它程度,是评价测量质量的最基本的指标。它是一个相对概念,并非绝对的有无,而是一是一个相对概念,并非绝对的有无,而是一个程度上或多或少的问题。没有一个测量是个程度上或多或少的问题。没有一个测量是绝对可靠的,只有测量结果可信程度的高和绝对可靠的,只有测量结果可信程度的高和低。低。可靠与不可靠?可靠与不可靠?测量的信度测量的信度测量的信度测量的信度分半信度分半信度分半信度分半信度重测信度重测信度重测信度重测信度复本信度复本信度复本信度复本信度 可靠性(信度)分类可靠性(信度)分类可靠性(信度)分类可靠性(信度)分类同质性信度同质性信度同质性信度同质性信度评分者信度评分者信度评分者信度评分者信度内部一致性信度内部一致性信度1、稳定可靠性、稳定可靠性(重测信度重测信度):间隔一定时间,使:间隔一定时间,使用相同测量手段,对同一批受试者重复测量,结用相同测量手段,对同一批受试者重复测量,结果的一致性程度。是估价可靠性最简单的方法。果的一致性程度。是估价可靠性最简单的方法。注意事项注意事项(1)信度系数受测验间隔时间影响:)信度系数受测验间隔时间影响:(2)不适用于考察难度的测验)不适用于考察难度的测验(3)被试在第二次测试时容易觉得枯燥)被试在第二次测试时容易觉得枯燥(4)费时、费力)费时、费力二、可靠性的分类:二、可靠性的分类:当同一测验的一种形式不适合实施两次时,就需要采用该当同一测验的一种形式不适合实施两次时,就需要采用该测验的另一平行测验(复本)。复本在测量内容、难度、测验的另一平行测验(复本)。复本在测量内容、难度、平均数、标准差等方面应与原测验一样,否则估计的可靠平均数、标准差等方面应与原测验一样,否则估计的可靠性系数就会出现较大误差。性系数就会出现较大误差。注意事项注意事项(1)两次测验的题目要基本等值)两次测验的题目要基本等值同质测验同质测验(2)两次测验要尽可能在较短时间内进行)两次测验要尽可能在较短时间内进行(3)实际工作中,完全等值的测验很难找到)实际工作中,完全等值的测验很难找到2、等价可靠性、等价可靠性(复本信度复本信度):同质测验、复本(问卷调查)同质测验、复本(问卷调查)测验的目的相同测验的目的相同难度相似难度相似方式(题目)不同方式(题目)不同前两种信度都需要两次测验,较烦琐。根据前两种信度都需要两次测验,较烦琐。根据一次测验估价测验的信度称为内部一致信度。一次测验估价测验的信度称为内部一致信度。(1)裂半法)裂半法分半信度分半信度(2)克隆巴赫)克隆巴赫 系数法系数法同质性信度同质性信度3、内部一致可靠性、内部一致可靠性(内部一致信度内部一致信度):4、评分者信度、评分者信度客观性客观性定义:定义:多个评分者给同一批受试者评分多个评分者给同一批受试者评分时结果的一致程度。对于无法定量测量时结果的一致程度。对于无法定量测量只能定性评分的项目来说,评定结果的只能定性评分的项目来说,评定结果的信度受评价者主观因素的影响,故也称信度受评价者主观因素的影响,故也称测量的测量的客观性客观性。5、同质性信度、同质性信度定义:定义:测验内部所有测题之间的一致程度。测验内部所有测题之间的一致程度。并非所有的测验都要求有较高的同质性信度。并非所有的测验都要求有较高的同质性信度。分半信度分半信度与与同质性信度同质性信度有时也和称为有时也和称为内部一致性信度内部一致性信度三、可靠性的估价方法:三、可靠性的估价方法:积差相关法适用于:积差相关法适用于:(1)适用于两组变量可靠性的计算)适用于两组变量可靠性的计算(2)无系统误差)无系统误差1Pearson积差相关法积差相关法:重测信度重测信度和和复本信度复本信度的的2估价可以使用本方法。估价可以使用本方法。系统误差:系统误差:由于测量工具不准确,或测试人员由于测量工具不准确,或测试人员知识技术水平不同,致使测量结知识技术水平不同,致使测量结果呈果呈规律性规律性偏大或偏小。偏大或偏小。重复测量时任何一次测量中有系统误差,都会重复测量时任何一次测量中有系统误差,都会使估价出来的信度系数偏高。使估价出来的信度系数偏高。补充知识:补充知识:例例1:对:对10名学生实施间隔一周的两次跳高测量,名学生实施间隔一周的两次跳高测量,结果如下,试估价测量的可靠性。结果如下,试估价测量的可靠性。编号编号12345678910X11.491.411.601.401.421.511.581.431.531.48X21.511.481.641.391.471.551.611.411.571.54r=0.938可靠吗?可靠吗?如何判断两次测验中有无系统误差?如何判断两次测验中有无系统误差?成对数据成对数据T检验检验如果如果t t(n)则两组数据间无显著性差异则两组数据间无显著性差异无系统误差无系统误差计算信度系数计算信度系数2、裂半法(裂半法(分半信度)分半信度)将一个测验分成奇数题与偶数题两半,两将一个测验分成奇数题与偶数题两半,两部分结果的一致程度。部分结果的一致程度。适用于没有复本且只能进行一次测验的情适用于没有复本且只能进行一次测验的情况下。况下。受试者受试者测量题目测量题目成绩总和成绩总和N=41234奇数次奇数次偶数次偶数次A101212132225B121311102323C121312112424 D181213121922E161517153330例:对五名受试者进行四个问题的测验,例:对五名受试者进行四个问题的测验,估价测试数据可靠性。估价测试数据可靠性。分半后计算相关系数的测量次数(题目数)只有实分半后计算相关系数的测量次数(题目数)只有实际的一半,这就降低了信度,为了得到整个测验的际的一半,这就降低了信度,为了得到整个测验的信度系数,需要用斯皮尔曼信度系数,需要用斯皮尔曼-布朗公式修正。布朗公式修正。:两半测验之间的相关系数两半测验之间的相关系数:整个测验的信度系数整个测验的信度系数3、抽样复测法抽样复测法适用于大样本群体测量适用于大样本群体测量步骤:步骤:1、确定抽样比例及人数;、确定抽样比例及人数;2、随机抽样,做好标记;、随机抽样,做好标记;3、发给参加复测的受试对象测试卡片;、发给参加复测的受试对象测试卡片;4、请受试者返回原测地点,在相同条件下重测;、请受试者返回原测地点,在相同条件下重测;5、对比原测卡片和复测卡片,计算超出允许误差范围、对比原测卡片和复测卡片,计算超出允许误差范围的误差次数的误差次数N;6、计算误差发生率计算误差发生率P。P=N/测量次数测量次数 100%如果如果P 5%,可靠性较差可靠性较差4、方差分析法(评分者信度)方差分析法(评分者信度)MSB组间方差组间方差MSW组内方差组内方差例:例:2000年奥运会男子年奥运会男子10米跳台决米跳台决赛裁判员评分一致性检验赛裁判员评分一致性检验5、Spearman等级相关等级相关两组变量两组变量(重测信度、复本信度、评分者信度)(重测信度、复本信度、评分者信度)如果测量数据不精准,只是定性评分或排名,可使用等级如果测量数据不精准,只是定性评分或排名,可使用等级相关。相关。实际上等级相关对于定量测量的数据或定性评分的数据都实际上等级相关对于定量测量的数据或定性评分的数据都可以使用,但对于定量数据计算结果不如积差相关法准确。可以使用,但对于定量数据计算结果不如积差相关法准确。遗憾的是遗憾的是Excel中不能直接计算等级相关,需要用中不能直接计算等级相关,需要用Rank函函数先对数据进行排名,然后再用积差相关法计算数先对数据进行排名,然后再用积差相关法计算例:两名教师给例:两名教师给10名学生的考试卷进行名学生的考试卷进行评分,估价其评分者信度评分,估价其评分者信度6、肯德尔和谐系数法、肯德尔和谐系数法多人评分信度多人评分信度由多人进行评分时评分者信度的估价方法由多人进行评分时评分者信度的估价方法适用于:多组顺序型数据适用于:多组顺序型数据缺点:缺点:Excel、SPSS中没有现成计算公式中没有现成计算公式较少使用较少使用7、克隆巴赫、克隆巴赫 系数系数内部一致性信度内部一致性信度(同质性信度)(同质性信度)用于估价多个项目或多个分测验所构成的测验合成用于估价多个项目或多个分测验所构成的测验合成得分的信度系数。需用得分的信度系数。需用SPSS统计软件计算统计软件计算AnalyzeScaleReliabilityAnalysisReliabilityCoefficients10itemsAlpha=.7205Standardizeditemalpha=.7377信度估价方法总结信度估价方法总结重测信度:重测信度:积差相关法、等级相关法、方差分析法、积差相关法、等级相关法、方差分析法、抽样复测法抽样复测法复本信度:复本信度:积差相关法、等级相关法、方差分析法积差相关法、等级相关法、方差分析法评分者信度:评分者信度:等级相关法、方差分析法、和谐系数法等级相关法、方差分析法、和谐系数法分半信度:分半信度:裂半法裂半法同质性信度:同质性信度:克隆巴赫克隆巴赫 系数系数0.950.99非常可靠非常可靠0.900.94可靠可靠0.800.89可靠性可以接受可靠性可以接受0.700.79可靠性较差可靠性较差0.70以下以下一般认为不能使用一般认为不能使用可靠性程度的判断标准:可靠性程度的判断标准:1、测量误差、测量误差2(1)测试者)测试者(2)受试者)受试者3(3)测试仪器)测试仪器(4)测试方法)测试方法4(5)测试环境)测试环境5(6)抽样误差:)抽样误差:6抽样方法、样本量、样本代表性抽样方法、样本量、样本代表性四、影响可靠性的因素:四、影响可靠性的因素:同一种测量手段,用于个体差异不同的群体时,同一种测量手段,用于个体差异不同的群体时,个体差异较大的群体,估价出的信度系数较高,个体差异较大的群体,估价出的信度系数较高,个体差异较小的群体信度系数较低。个体差异较小的群体信度系数较低。2、受试者个体差异受试者个体差异3、受试群体的能力水平、受试群体的能力水平在某种能力水平上信度高的测验,对于其它能力在某种能力水平上信度高的测验,对于其它能力水平的群体信度未必就高。水平的群体信度未必就高。例如:适应能力问卷在本科文化程度人群中使用例如:适应能力问卷在本科文化程度人群中使用重测信度可以,但用于小学文化程度的人群信度重测信度可以,但用于小学文化程度的人群信度未必够未必够重测信度、复本信度中,重复测重测信度、复本信度中,重复测量间隔时间越长,估价出的信度量间隔时间越长,估价出的信度系数越低系数越低3重复测量的间隔时间重复测量的间隔时间重测信度、复本信度中重复测量的次数,评分重测信度、复本信度中重复测量的次数,评分者信度中的评分者人数,内部一致性信度中的者信度中的评分者人数,内部一致性信度中的题目数统称为测验的长度,长度越长信度越高,题目数统称为测验的长度,长度越长信度越高,但长度增加的同时测量工作量增加,其它影响但长度增加的同时测量工作量增加,其它影响影响测量结果的因素也增加。影响测量结果的因素也增加。4测量的长度测量的长度5测量指标的类型测量指标的类型稳定性高、不易变化的指标重测信度高;稳定性高、不易变化的指标重测信度高;定性评分项目中,受主观因素影响小的指定性评分项目中,受主观因素影响小的指标评分者信度高;标评分者信度高;6、测试细则、测试细则测试细则详细准确的测量重测信度高;测试细则详细准确的测量重测信度高;评分规则详细准确的评分者信度高评分规则详细准确的评分者信度高7估价可靠性时使用的方法估价可靠性时使用的方法如果同时可以使用几种方法估价信度系如果同时可以使用几种方法估价信度系数,可能计算结果会稍有不同。数,可能计算结果会稍有不同。8、测试人员的人数、水平、责任心等、测试人员的人数、水平、责任心等对评分者信度影响较大对评分者信度影响较大五、提高可靠性的方法:五、提高可靠性的方法:(一一)严严格格实实施施标标准准化化的的测测量量程程序序。包包括括测测量量仪仪器器设设备备的的标标准准化化,测测量量方方法法的的标标准准化化,测测量量实实施施的的标标准准化化。这这样可以减少随机误差和系统误差。样可以减少随机误差和系统误差。(二二)适适当当增增加加测测量量的的长长度度。在在运运动动技技术术测测量量当当中中,增增加加测测量量或或测测验验的的次次数数,在在体体育育社社会会、教教育育心心理理测测量量中中,适当增加题目的数量。适当增加题目的数量。(三三)适适当当地地增增加加平平行行测测验验项项目目,可可以以增增加加对对信信度度的的检检验,获得更丰富的信息。验,获得更丰富的信息。(四四)适适当当增增加加样样本本含含量量,并并提提高高抽抽样样的的科科学学性性(使使样样本具有代表性),这样可以减少抽样误差。本具有代表性),这样可以减少抽样误差。(五五)测测验验的的难难度度要要适适中中,使使受受试试者者表表现现出出应应有有的的成成绩绩差异。差异。(六六)在在选选取取受受试试者者群群体体时时,要要兼兼顾顾他他们们的的水水平平差差异异(最好接近正态)。(最好接近正态)。(七七)提提高高测测试试人人员员的的责责任任心心、业业务务素素质质和和测测量量技技巧巧,以减少过失误差、系统误差和随机误差。以减少过失误差、系统误差和随机误差。(八八)在在有有些些测测量量中中,要要对对受受试试者者进进行行必必要要的的宣宣传传鼓鼓动动,诱诱发发其其正正确确的的动动机机和和兴兴趣趣,使使之之事事先先对对测测量量方方法法、要要求求有有所所了了解解,更更好好地地配配合合测测试试。尤尤其其在在机机能能测测验验和和运运动动能能力力测测验验中中,以以及及在在量量表表测测试试过过程程中中,正正确确的的动动机机、认认真真的的态态度度、全全力力以以赴赴的的作作风风将将直直接接关关系系到到测测量量结结果果的的准准确确与可靠。与可靠。(九九)重重复复测测量量时时要要考考虑虑间间隔隔时时间间的的长长短短,以以及及要要保保证证两次测验的独立性(完整性)。两次测验的独立性(完整性)。(十十)要要注注意意测测量量时时间间和和环环境境的的选选择择。如如不不要要在在大大型型赛赛事事(如如校校运运会会)和和重重大大节节日日(如如国国庆庆节节)前前后后安安排排测测试试;测测试试要要求求适适当当充充裕裕的的时时间间;要要注注意意考考试试环环境境的的选选择择和和控控制(如噪音太大、考场纪律混乱等)。制(如噪音太大、考场纪律混乱等)。(十十一一)除除了了对对可可靠靠性性进进行行定定量量的的检检验验外外,还还可可以以通通过过其其它它途途径径对对信信度度检检验验进进行行补补充充和和修修正正,例例如如:受受试试者者的的平平时时表表现现、出出勤勤、作作业业、回回答答问问题题等等是是否否与与测测试试结结果果有有特别大的出入等等。特别大的出入等等。(十十)要要注注意意测测量量时时间间和和环环境境的的选选择择。如如不不要要在在大大型型赛赛事事(如如校校运运会会)和和重重大大节节日日(如如国国庆庆节节)前前后后安安排排测测试试;测测试试要要求求适适当当充充裕裕的的时时间间;要要注注意意考考试试环环境境的的选选择择和和控控制制(如噪音太大、考场纪律混乱等)。(如噪音太大、考场纪律混乱等)。(十十一一)除除了了对对可可靠靠性性进进行行定定量量的的检检验验外外,还还可可以以通通过过其其它它途途径径对对信信度度检检验验进进行行补补充充和和修修正正,例例如如:受受试试者者的的平平时时表表现现、出出勤勤、作作业业、回回答答问问题题等等是是否否与与测测试试结结果果有有特特别别大大的出入等等。的出入等等。一、有效性的概念一、有效性的概念1、操作定义:、操作定义:指所选择的测量手段在测量欲测属指所选择的测量手段在测量欲测属性时的准确程度,即能测量的属性和要测量的属性时的准确程度,即能测量的属性和要测量的属性之间的一致程度。效度有两曾含义:性之间的一致程度。效度有两曾含义:1、测量值、测量值与欲测属性之间的一致性;与欲测属性之间的一致性;2、测量值的可靠性、测量值的可靠性有效性用效度系数有效性用效度系数r表示,表示,-1 r 1测量的有效性(效度测量的有效性(效度Validity)2、有效性的理论定义、有效性的理论定义效度是在一组测量中,与测量目效度是在一组测量中,与测量目的有关的真实变异数与总变异数的有关的真实变异数与总变异数的比值。的比值。X=V+I+ET由所要测量的变因引起的有效变异由所要测量的变因引起的有效变异可靠性是有效性的必要条件,即要想有效可靠性是有效性的必要条件,即要想有效性高,可靠性必需高;有效性是可靠性的性高,可靠性必需高;有效性是可靠性的充分条件,即有效性高,可靠性一定高。充分条件,即有效性高,可靠性一定高。同一测验的信度系数高于其效度系数。同一测验的信度系数高于其效度系数。二、有效性与可靠性的关系:二、有效性与可靠性的关系:三、有效性的分类:三、有效性的分类:1、内容效度、内容效度(Content Validity):(1)所选择的测量内容反映总体属性的准确所选择的测量内容反映总体属性的准确程度。常用于理论知识的测验。程度。常用于理论知识的测验。(2)考察考察内容效度内容效度的前提是:要有定义较完整的前提是:要有定义较完整的总体属性的内容范围。的总体属性的内容范围。(3)确定内容效度的方法)确定内容效度的方法A专家调查:专家调查:一定数量专家逻辑分析的结果,一定数量专家逻辑分析的结果,也称逻辑效度。也称逻辑效度。B统计分析统计分析相关计算相关计算:一项测验与公认有较好:一项测验与公认有较好内容效度的测验的相关越高,说明内容效度越好。内容效度的测验的相关越高,说明内容效度越好。如高中毕业前的摸底测验,其内容效度可与高考如高中毕业前的摸底测验,其内容效度可与高考成绩比较成绩比较(1)一组测量所包含的各种属性与总体属性的各一组测量所包含的各种属性与总体属性的各种拟测成分在结构上的一致性程度。即可以实际种拟测成分在结构上的一致性程度。即可以实际操作的测验与理论上的构想的符合程度。常用于操作的测验与理论上的构想的符合程度。常用于心理与运动能力的成套测验。心理与运动能力的成套测验。2、构想效度、构想效度(ConstructValidity):(2)确定构想效度的方法)确定构想效度的方法A因素分析:因素分析:探索性和实证性因素分析探索性和实证性因素分析B相关计算:相关计算:与已有的构想效度较好的与已有的构想效度较好的测验的相关测验的相关C聚合效度和区分效度聚合效度和区分效度(1)所选择的测量与效标之间的关联一致性程度所选择的测量与效标之间的关联一致性程度。(2)效标:)效标:即检验效度的标准,已被检验证明能即检验效度的标准,已被检验证明能够作为参照标准,是一项有效性高的测量。够作为参照标准,是一项有效性高的测量。3、效标效度、效标效度(CriterionRelatedValidity):):(实证效度)(实证效度)(3)体育测量中常用的效标:)体育测量中常用的效标:A可定量测量的专项成绩:如可定量测量的专项成绩:如100米、跳远的成绩;米、跳远的成绩;B比赛的名次或运动等级;比赛的名次或运动等级;C具有数量特征的量:具有数量特征的量:100米跑的步频和步幅,米跑的步频和步幅,跳远的助跑速度;跳远的助跑速度;D 合成效标:如体质评价总分、成套测验总分。合成效标:如体质评价总分、成套测验总分。E 标准的实验室结果:如水下称重法测得的身体成标准的实验室结果:如水下称重法测得的身体成分、用气体分析仪和电动跑台测得的最大吸氧量。分、用气体分析仪和电动跑台测得的最大吸氧量。三、有效性的估价方法三、有效性的估价方法1逻辑分析法:逻辑分析法:专家调查法专家调查法2积差相关法(等级相关法):积差相关法(等级相关法):3因子分析(主成分分析)法:因子分析(主成分分析)法:4逐步回归法:逐步回归法:5指标鉴别力分析指标鉴别力分析例:为检验小腿长度能否反映短跑运动员的运动成例:为检验小腿长度能否反映短跑运动员的运动成绩,抽取绩,抽取14名运动员进行测试,结果如下,请检验名运动员进行测试,结果如下,请检验小腿长度反映运动员的短跑运动成绩的有效性。小腿长度反映运动员的短跑运动成绩的有效性。编号编号小腿长小腿长100m跑跑编号编号小腿长小腿长100m跑跑132.513.2833.912.3227.913.8931.412.1329.713.11030.513.2431.112.61130.812.6528.713.91233.111.8629.814.21328.813.6732.211.91431.112.2例:以例:以1987年全国地掷球男子单打决赛资料为例,计算年全国地掷球男子单打决赛资料为例,计算以滚靠技术成功率判断地掷球运动技术水平的有效性。以滚靠技术成功率判断地掷球运动技术水平的有效性。比赛名次比赛名次成功率成功率成功率排序成功率排序序差(序差(d)d 129.22-11226.33-11331.2124419.4624525.7411621.7511719.3700816.9800等级相关等级相关 两组数据之间的序差两组数据之间的序差 等级相关系数等级相关系数例:因子分析法进行效度检验例:因子分析法进行效度检验体质四因素模型因子分析各指标因子载荷(体质四因素模型因子分析各指标因子载荷(40岁以下)岁以下)指指 标标 因因 子子 载载 荷荷12345仰卧起坐(俯卧撑)仰卧起坐(俯卧撑).966纵跳纵跳.962抗病均分抗病均分.811自然均分自然均分.801社会均分社会均分.759坐位体前屈坐位体前屈.733肺活量肺活量.675握力握力.544单脚站立单脚站立.719 选择反应时选择反应时 .707台阶指数台阶指数 .689体重体重/身高身高 .608因子因子 特征值特征值 贡献率贡献率 累计贡献率累计贡献率 因子权重因子权重1 1 1.991 16.595 16.595 0.25 1.991 16.595 16.595 0.252 2 1.934 1.934 16.11916.119 32.714 0.246 32.714 0.2463 3 1.527 12.729 45.443 0.194 1.527 12.729 45.443 0.1944 4 1.219 10.155 55.598 0.155 1.219 10.155 55.598 0.1555 5 1.189 9.911 65.509 0.151 1.189 9.911 65.509 0.151体质四因素模型因子分析(体质四因素模型因子分析(4040岁以下)岁以下)例:羽毛球选材研究:例:羽毛球选材研究:第一轮初测指标体系(第一轮初测指标体系(共共 5 5类类2323项指标项指标)(1 1)机能指标:上、下肢无氧功率。)机能指标:上、下肢无氧功率。(2 2)素素质质指指标标:2020米米跑跑、400400米米5 5,1 1分分钟钟跳跳绳绳,四四角角跑跑,上肢对墙击球力度、立定跳远、纵跳。上肢对墙击球力度、立定跳远、纵跳。(3 3)技技能能指指标标:运运动动中中持持拍拍动动作作控控制制能能力力、用用力力感感、关关节节方向感。方向感。(4 4)心心理理指指标标:战战术术分分析析与与决决策策,河河内内塔塔测测试试,:意意志志,注意,动机,气质、个性稳定性、有恒性。注意,动机,气质、个性稳定性、有恒性。(5 5)形态指标:克托莱指数、上肢比例、下肢比例)形态指标:克托莱指数、上肢比例、下肢比例。筛选指标的依据 专项理论:与制胜规律密切相关的指标。专项理论:与制胜规律密切相关的指标。方差分析:具有显著性差异的指标。方差分析:具有显著性差异的指标。因子分析:类指标中因子载荷较大的指标因子分析:类指标中因子载荷较大的指标 综综合合评评估估:有有差差异异但但没没有有到到达达0.050.05显显著著性性水水平平,而而从从专专项理论角度分析该指标具有较强的代表性,也可考虑入选项理论角度分析该指标具有较强的代表性,也可考虑入选。指标筛选过程指标筛选过程1、初选指标:、初选指标:最初经专家调查,咨询和资料分析确定了最初经专家调查,咨询和资料分析确定了65个课题测试指标,测试中由于准确性原因,或难度大个课题测试指标,测试中由于准确性原因,或难度大(如内分泌指标儿茶酚胺)剔除了(如内分泌指标儿茶酚胺)剔除了13个,确定了个,确定了52个研究个研究指标指标2、测试指标:、测试指标:对对52个指标采集后,经过专家分析和初步个指标采集后,经过专家分析和初步的数据统计处理,又淘汰了与成绩相关度非常低的指标,的数据统计处理,又淘汰了与成绩相关度非常低的指标,(男:(男:18个;女:个;女:14个)。个)。3、选材指标:、选材指标:经过分类逐步回归,确定:心理经过分类逐步回归,确定:心理8个,技术个,技术4个,机能个,机能5个,素质个,素质2个,男:个,男:13个;女:个;女:12个。个。5大类大类19项指标。项指标。例:射箭选材研究例:射箭选材研究素质指标筛选素质指标筛选 Unstandardized CoefficientsStandardized Coefficientst Sig.BStd.ErrorBeta(Constant)1306.82149.441 26.432.000平衡能力-40.62313.951-.314-2.912.005上肢耐力.778.428.1961.820.073筛选结果(1 1)体能指标)体能指标 形态:克托莱指数,身高形态:克托莱指数,身高 机能:上肢无氧功率,下肢机能:上肢无氧功率,下肢5 5秒峰值功率,秒峰值功率,下肢下肢3030秒平均功率秒平均功率 素质:立定跳远,专项跑动时素质:立定跳远,专项跑动时(2 2)技战术能力:)技战术能力:拍数拍数/回合回合 主动失误次数主动失误次数/总拍数总拍数(3 3)心理能力:)心理能力:翻转反应时翻转反应时 操作思维步数操作思维步数 意志力意志力 指标鉴别性检验指标鉴别性检验 不同水平羽毛球男子运动员运动素质指标比较不同水平羽毛球男子运动员运动素质指标比较 立定跳远立定跳远(m)m)纵跳纵跳(cm)20cm)20米米5(5(s)1s)1分钟跳绳分钟跳绳(次次)优秀组优秀组 2.61 2.610.14 48.640.14 48.644.72 19.114.72 19.110.60 123.750.60 123.759.249.24 一般组一般组 2.48 2.480.24 46.830.24 46.836.71 19.326.71 19.320.86 121.630.86 121.639.429.42协方差协方差 年龄年龄 0.01*0.001*0.001*0.666 0.01*0.001*0.001*0.666 P P 值值 组别组别 0.05*0.596 0.676 0.432 0.05*0.596 0.676 0.432四、影响有效性的因素四、影响有效性的因素1、受试群体特征:、受试群体特征:年龄、性别、能力的个体差异等;年龄、性别、能力的个体差异等;2、样本含量及其代表性:、样本含量及其代表性:扩大样本含量,测量的可扩大样本含量,测量的可靠性提高,有效性也随之提高。应坚持随机抽样原靠性提高,有效性也随之提高。应坚持随机抽样原则,以提高样本的代表性;则,以提高样本的代表性;3、测量的可靠性:、测量的可靠性:可靠性是有效性的必要前提可靠性是有效性的必要前提4、效标的选择:、效标的选择:对于同一项测量手段,选择不同对于同一项测量手段,选择不同的效标,计算出来的效标有效性就不相同:的效标,计算出来的效标有效性就不相同:5、测量的难度与区分度:、测量的难度与区分度:测量难度适中时,区分测量难度适中时,区分度最高,有效性也会提高。度最高,有效性也会提高。测量的科学性专题作业测量的科学性专题作业1、归纳总结信度、效度的种类与估价方法、归纳总结信度、效度的种类与估价方法2、查阅有信度、效度检验的文献、查阅有信度、效度检验的文献5篇篇要求(要求(1)写明文章题目、作者、出处、时间)写明文章题目、作者、出处、时间(2)估价信、效度的方法)估价信、效度的方法(3)存在问题)存在问题雷同作业无成绩雷同作业无成绩
展开阅读全文