1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 相关系数,第一节 相关概述,第二节 积差相关系数,第三节 其他相关系数,1,第一节 相关概述,一、相关的含义,客观现象之间的数量联系存在着函数关系和相关关系。当一个或几个变量取定值时,另一个变量有确定的值与之对应,称为函数关系,可用,Y=f(X),表示。,图,5-0(a),函数关系,2,所谓,相关,就是指事物或现象之间的相互关系。事物之间在数量上的变化关系有的是属于因果关系(一种现象是另一种现象的原因,另一种现象是这种现象的结果),有的却不能直接作出因果关系的解释。当一个或几个相互联系的变量取一定
2、数值时,与之相对应的另一个变量的值虽然不确定,但它仍然按某种规律在一定范围内变化,变量间的这种关系,被称为,相关关系,,如图,5-0,(,b,)。,图,5-0,(,b,),3,二、相关的种类,(一)从变化方向上划分,1,、正相关。两个变量中,一个变量增大,另一个变量对应值也随之增大;或一个变量值减小,另一个变量对应值也随之减小,两列变量变化方向相同。如学生的学习成绩与智商之间的关系;教师工作积极性与学校民主管理程度之间的相关,学校办学经费与教学设施之间的相关等。,4,2,、负相关:两个变量中,一个变量增大,另一个变量对应值也随之减少;或一个变量值减小,另一个变量对应值也随之增大,两列变量变化方
3、向相反。如学生学习能力水平与其解题时间的关系;运动员赛跑与所用时间之间的相关;学生学习能力与识记所用时间之间的相关等。,5,3,、零相关。两变量值的变化方向无规律。如学生的身高与学生成绩的变化关系。,(二)从变量的个数上划分,1,、简相关。两个变量之间的相关关系。如在一定年龄阶段,儿童身高与年龄的关系。本课所研究的都是简相关。,2,、复相关。一个变量与两个或两个以上变量间的相关关系。如教师教学的成效与教师思维能力、教学方法、学生的学习准备情况之间的关系。,6,(三)从变量相互关系的程度上划分,1,、高度相关。即两个变量相互联系非常密切。如大学生的学习成绩和智商的关系。当两个变量变化关系达到一一
4、对应的密切程度时,数量变化就是确定性关系了,则称为完全相关。,2,、低度相关。即两变量存在相互联系,但其关系并不密切。,7,三、相关散布图,它是表示两种事物之间的相关性及联系的模式。以直角坐标的横轴表示,x,列变量,纵轴表示,y,列变量,在相关的两变量对应值的垂直相交处画点,构成相关散布图。如图,5-1,。,图,5-1,散布图,8,相关散布图的用途:,1,、判断相关是否直线式。,当两变量之间呈曲线趋势,其相关散布图呈弯月状,说明两变量之间是非线性关系,如图,5-2(a),。,图,5-2(a),曲线相关,9,当两变量间呈线性趋势,其相关散布图是椭圆形,说明两变量之间是线性关系,称为直线相关,如图
5、5-2(b),。,图,5-2(b),直线相关,10,2,、判断相关密切程度高低,相关散布图的形状和疏密,反映着相关程度的高低。如图,5-3,(,a,),散布图的椭圆形状较狭长,称为高度相关。,图,5-3,(,a,)高度相关,11,如果散布图的椭圆形状比较粗,称为低度相关。如图,5-3,(,b,)。,图,5-3b,低度相关,12,3,、判断相关变化方向,正相关:散布点主要位于一、三象限。如图,5-4,(,a,),即一个变量增加(或减少),另一个变量也增加(或减少)。,图,5-4,(,a,)正相关,13,负相关:若散布点主要位于二、四象限,如图,5-4,(,b,),即一个变量增加(或减少),另一
6、个变量也减少(或增加)。,图,5-4,(,b,)负相关,14,零相关:散布点的变化无一定规律。如图,5-4,(,c,)。,图,5-4,(,c,)零相关,15,四、相关系数,通过相关散布图的形状,我们大概可以判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数。总体相关系数用,(读,“,柔,”,)表示,样本相关系数用,r,表示。,16,相关系数,r,的取值范围是,-1r 1,,一般取小数点后两位。,r,的正负号表明两变量间变化的方向;,|r|,表明两变量间相关的程度,,r0,表示
7、正相关,,r0,表示负相关,,r=0,表示零相关。,|r|,越接近于,1,,表明两变量相关程度越高,它们之间的关系越密切。,17,附加说明,:,(,1,)两变量间存在相关,仅意味着变量间有关联,并不一定是因果关系。,(,2,)相关系数不是等距的测量单位。,r,是一个比值,不是由相等单位度量而来,不能进行加、减、乘、除运算。如,r1=0.25,r2=0.5,r3=0.75,,不能认为,r1=r3-r2,或,r2=2r1,。,(,3,)相关系数受变量取值区间大小及观测值个数的影响较大。,18,变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不相关的两
8、列变量,计算的结果可能相关,如学生的身高与学习成绩。本书所举例题,数据较少,仅为说明计算方法时较方便。,(,4,)相关系数在特定情况下使用才具有意义。,如高中生身高与体重的相关系数用在儿童身上就没有意义。,19,(,5,)通过实际观测值计算的相关系数,须经过显著性检验确定其是否有意义。,|r|,的取值范围,|r|,的意义,0.00-0.19,极低相关,0.20-0.39,低度相关,0.40-0.69,中度相关,0.70-0.89,高度相关,0.90-1.00,极高相关,表,5-0|r|,的取值与相关程度,20,*,如何判断两个变量的相关性,(,1,)找出两个变量的正确相应数据。,(,2,)画出
9、它们的散布图(散点图)。,(,3,)通过散布图判断它们的相关性。,(,4,)给出相关(,r,)的解答。,(,5,)对结果进行评价和检验。,21,进一步阅读资料:,1.,程俊玲等,.,中小学教师工作压力状况及相关因素调查研究,.,教育理论与实践,2004(6),2.,陈小异,.,大学生自我容纳与人格特征的相关研究,.,统计教育,2004(4),在线资源,:,1.SPSS10.0,相关分析,www,积差相关系数,一、概念及适用条件,(一)概念,积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为,(5.1),23,(二)适用条件,1,、两变量均应由测量得到的连续变量。,2,、两变量所来自的总体都
10、应是正态分布,或接近正态的单峰对称分布。,3,、变量必须是成对的数据。,4,、两变量间为线性关系。,24,二、计算方法,(一)基本公式计算法,步骤:,25,学生序号,X,(政治),Y,(语文),x,y,xy,1,74,82,-1.6,-1.7,2.72,2,71,75,-4.6,-8.7,40.02,3,80,81,4.4,-2.7,-11.88,4,85,89,9.4,5.3,49.82,5,76,82,0.4,-1.7,-0.68,6,77,89,1.4,5.3,7.42,7,77,88,1.4,4.3,6.02,8,68,84,-7.6,0.3,-2.28,9,74,80,-1.6,-3
11、7,5.92,10,74,87,-1.6,3.3,-5.28,75.6,83.7,4.454211,4.33705,91.8,例,1,某学校为调查学生学习各科目之间的能力迁移问题,随机抽取,10,名学生的政治与语文成绩见表,5-1,,请计算其相关程度。,26,解:依表,5-1,的资料,计算结果为,即,10,名学生的政治与语文成绩的相关程度为,0.475,。,27,(二)原始数据计算法,课后练习:用原始数据计算法计算例,5-1,。,28,第三节 其他相关系数,一、等级相关系数,(一)斯皮尔曼等级相关,1,、概念及适用条件,(,1,)概念,两变量是等级测量数据,且总体不一定呈正态分布,样本容量也
12、不一定大于,30,,这样两变量的相关,称为等级相关(斯皮尔曼相关),29,(,2,)适用条件,两变量的资料为等级测量数据,且具有线性关系。,连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。,不要求总体呈正态分布。,2,、计算方法,式中:,D,为两变量每对数据的等级之差;,N,表示样本容量。,(5.4),30,计算步骤:,(,1,)计算两变量等级之差,D,;,(,2,)计算,D,2,;,(,3,)计算,D,2,;,(,4,)代入公式(,5.4,),求得,r,R,例,3,求,10,名学生的语文成绩与阅读能力成绩之间的等级相关系数。,31,序号,X,(语文等级),Y,(阅读等级),D,D,
13、2,1,8,8,0,0,2,6,7,-1,1,3,5,4,1,1,4,3,2,1,1,5,2,1,1,1,6,4,5,-1,1,7,7,6,1,1,8,9,10,-1,1,9,1,3,-2,4,10,10,9,1,1,12,表,5-3 10,名学生的语文成绩与阅读能力成绩相关计算表,32,解:将有关数据代入公式(,5.4,)得,如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为,1,等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。,33,例,4,某校为了研究学生自学能力与学业成绩之间的关系,随机抽取,10,名学生的自学能力和学科成绩,见表
14、5-4,,求其相关系数。,序号,X,(能力),等级,Y,(成绩),等级,D,D,2,1,90,3.5,88,4,-1,0.25,2,85,7,80,6,1,1,3,70,10,80,6,4,16,4,85,7,79,8,-1,1,5,90,3.5,95,2.5,1,1,6,80,9,70,10,-1,1,7,85,7,75,9,-2,4,8,100,1,98,1,0,0,9,87,5,80,6,-1,1,10,92,2,92,2.5,-1,0.25,25.5,表,5-4 10,名学生的自学能力和学科成绩相关计算表,34,解:,即学生的自学能力与学习成绩的相关程度为,0.85,。,35,(二)
15、肯德尔和谐系数,1,、概念及适用条件,(,1,)概念,当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数或肯德尔,W,系数。,(,2,)适用条件,适用于两列以上等级变量。如了解几个评定者对同一组学生成绩等级评定的一致性程度等。,36,2,、计算方法,它以符号,W,表示,公式为,37,计算步骤:略,例,5,某评价小组,7,人依据已确定的,4,项内容对某教师打分,将分数转换为等级后的结果见表,5-5,,求这,7,人对该教师评价意见的一致性程度。,一,二,三,四,1,2.5,4,2.5,1,2,3.5,3.5,1.5,1.5,3,2.5,2.5,1,4,4,4,2,2,2
16、5,3,4,1.5,1.5,6,1,2,3,4,7,2,4,2,2,R,18.5,22,13.5,16,=,70,R,2,342.25,484,182.25,256,R,2,=,1264.5,表,5-5 7,人评价某教师意见资料表,38,解:将上述数据代入公式(,5.5,)中得,实际上,当出现相同等级时,应校正,W,系数,其校正公式为,39,例,5,中第一个人评的有,2,个等级相同,第二个人评的有,2,个,3.5,和,2,个,1.5,等级,所以,C,为,40,41,二、点二列相关,(一)概念及适用条件,1,、概念,两列变量一列是正态连续变量,另一列是二分变量,描述这两个变量之间的相关,称为点
17、二列相关。,2,、适用条件,一列是正态连续变量,另一列是二分变量(如男与女,对与错等)。,42,(二)计算方法,点二列相关系数以表示,r,pb,,公式为,式中:,p,为二分变量中某一项所占比例;,q,为二分变量中另一项所占比例,,p+q=1;,为二分变量中比例为,p,部分所对应的连续变量的平均数;为二分变量中比例为,q,部分所对应的连续变量的平均数,.,x,为连续变量的标准差。,43,例,6,随机抽取某区初二数学期末考试卷,15,份,试计算第二题的得分与总分相一致的程度(即试题的区分度,它是衡量试题鉴别能力的指标值)。数据见表,5-6,。,学生序号,1,2,3,4,5,6,7,8,9,10,1
18、1,12,13,14,15,第二题得分,1,0,1,0,0,0,1,1,0,1,1,1,1,1,1,总分,69,71,79,86,87,87,81,89,81,92,91,93,92,93,93,表,5-6,数据表,44,解:(,1,)求答对第二题的比率,p,和答错的比率,q,:,p=10/15=0.67,q=1-p=0.33,(2),求 和 ,分别为答对和答错第二题学生成绩的平均数:,(3),求,x,所有考生的总分的标准差:,x,=7.597(,分,),将上述数据代入公式(,5.7,),可得,45,即该试卷第二题的区分度为,0.297,。,46,三、,相关,(一)概念及适用条件,1,、概念,
19、当两变量均为二分变量时,描述这两个变量之间的相关,称为,相关。,2,、适用条件,两变量均为二分变量;或资料整理为,2,2,列联表一形式。,47,(二)计算方法,相关以符号,r,表示,其计算公式为,式中:,a,、,b,、,c,、,d,分别表示四格表中的实际次数,如表,5-7,所示。,Y1,Y2,X1,a,b,a+b,X2,c,d,c+d,a+c,b+d,a+b+c+d,表,5-7 2,2,列联表,48,例,7,某区为研究性别与学习数学的关系,随机抽取,100,名学生,以数学成绩,85,分为线进行分类,求性别与数学成绩间的相关系数。,85,分以上,85,分以下,男生,31,18,49,女生,29,22,51,60,40,100,表,5-8 100,名学生成绩分布表,49,即性别与数学成绩间的相关系数为,0.065,。,50,第四节 解释与应用相关系数时应注意的问题,略:,见第一节 四,作业:,1,、某小组,10,名学生物理期中与期末考试成绩如下,请用相关散点图分析其成绩动态变化情况并提出指导意见。,51,2,、某校为研究高中模拟考试与高考之间的相关程度,随机抽取为,20,名学生模拟考试与高考的数学成绩如下,请计算其相关系数。,3,、,4,位教师对,5,名学生的论文水平按等级评定,结果如下表,求评定结果的一致性程度。,52,53,