1、心理与教育统计学心理与教育统计学第第5章章 相关关系相关关系5.1 相关、相关系数与散点图相关、相关系数与散点图5.2 积差相关积差相关5.3 等级相关等级相关5.4 质与量相关质与量相关5.5 品质相关品质相关5.6 相关系数的选用与解释相关系数的选用与解释有其父必有其子?有其父必有其子?皮尔逊测量了皮尔逊测量了1078个父亲及其成个父亲及其成年儿子的身高。年儿子的身高。60 62 64 66 68 70 72 74 76 78 80父亲的身高(英尺)父亲的身高(英尺)6062646668707274767880儿儿子子的的高高度度(英英尺尺)相关系数用于描述双变量相互之间的关系。相关系数用
2、于描述双变量相互之间的关系。所谓双变量,是对于一个变量所谓双变量,是对于一个变量X的每一个观的每一个观测值测值X1,X2,Xn,同时有另一个变量,同时有另一个变量Y的的相应观测值相应观测值Y1,Y2,Yn与之对应。与之对应。例如,每个人的身高和体重是对应的。例如,每个人的身高和体重是对应的。5.1 相关、相关系数与散点图相关、相关系数与散点图5.1.1 5.1.1 什么是相关什么是相关1.1.事物之间的相互关系:事物之间的相互关系:(1)因果关系因果关系,一种现象是原因,另一种,一种现象是原因,另一种现象是结果。现象是结果。(2)共变关系共变关系,表面有联系的两种事物都,表面有联系的两种事物都
3、与第三种事物有关。与第三种事物有关。(3)相关关系相关关系,两类现象在发展变化的方,两类现象在发展变化的方向与大小方面存在一定的联系,但不是前向与大小方面存在一定的联系,但不是前两种关系。两种关系。2.相关的类别相关的类别(1)正相关正相关:两个变量的变化方向相:两个变量的变化方向相同。同。例如,你用于学习的时间越多,考试例如,你用于学习的时间越多,考试成绩越高。成绩越高。(2)负相关负相关:两个变量的变化方向相:两个变量的变化方向相反。反。例如,你完成考试的时间越少,所犯例如,你完成考试的时间越少,所犯的错误越多。的错误越多。(3)零相关零相关:两个变量的变化方向无:两个变量的变化方向无一定
4、规律。一定规律。例如,智商与体重的关系。例如,智商与体重的关系。5.1.2 相关系数相关系数相关系数相关系数(coefficient of correlation)用来描用来描述两个变量相关程度的统计指标。述两个变量相关程度的统计指标。一般样本的相关系数用一般样本的相关系数用r表示,总体的相关系表示,总体的相关系数用数用表示。表示。(1)相关系数的取值:)相关系数的取值:-1 r+1(2)相关系数的符号:)相关系数的符号:“”表示正相关,表示正相关,“”表示负相关。表示负相关。(3)相关系数)相关系数 r=1表示完全正相关表示完全正相关,r=-1表示完表示完全全负相关,相关,r=0表示完全独立
5、零相关或无相表示完全独立,零相关或无相关。关。(4)相关系数取值的大小表示相关强弱程度。)相关系数取值的大小表示相关强弱程度。绝对值绝对值0 r 1,绝对值接近,绝对值接近1一般为相关程一般为相关程度密切,接近度密切,接近0值端一般为关系不够密切。值端一般为关系不够密切。注意:注意:相关分析受样本影响,小样本的相关系相关分析受样本影响,小样本的相关系数不稳定。数不稳定。相关系数不是由相等单位度量而来的,相关系数不是由相等单位度量而来的,因此只能比较大小,不能做任何加、减、因此只能比较大小,不能做任何加、减、乘、除运算。乘、除运算。5.1.3 散点图散点图在平面直角坐标系中,以在平面直角坐标系
6、中,以X、Y两列变量两列变量(如(如X变量)为横坐标,以另一列变量为纵变量)为横坐标,以另一列变量为纵坐标,把每对数据坐标,把每对数据Xi、Yi当作同一平面上的当作同一平面上的N个点(个点(Xi,Yi),一一描绘在),一一描绘在XOY坐标系坐标系中,产生的图形即为中,产生的图形即为散点图散点图。正相关正相关负相关负相关散点的分布形状为椭圆形,可认为散点的分布形状为椭圆形,可认为两变量之间具有线性关系两变量之间具有线性关系。完全负相关完全负相关完全正相关完全正相关当所有的点都分布在一条直线上时,当所有的点都分布在一条直线上时,两变量之间的关系为完全相关。两变量之间的关系为完全相关。零相关零相关散
7、点的分布没有明显集中在某一方向散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的趋势,形成圆形区域时,两变量之间的关系为零相关。的关系为零相关。散点图告诉了我们什么?散点图告诉了我们什么?5.2 积差相关积差相关5.2.1 积差相关及其适用条件积差相关及其适用条件积差相关是英国统计学家皮尔逊于积差相关是英国统计学家皮尔逊于20世纪初提出的一种计算相关的方法,世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关因而被称为皮尔逊积差相关,也称为积也称为积矩相关(矩相关(product moment correlation)。)。积差相关适用于:积差相关适用于:成对的数据;成对
8、的数据;样本容量要大,不宜少于样本容量要大,不宜少于30对。对。两列变量各自总体为正态分布;两列变量各自总体为正态分布;一般情况下,正常人群的身高、体重、一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。则需要对数据进行正态性检验。两列变量均为连续变量;两列变量均为连续变量;根据得到数据的方式判断,测量数据。根据得到数据的方式判断,测量数据。两列变量之间的关系应是线性关系。两列变量之间的关系应是线性关系。可先绘制两列变量的散点图,根据散点可
9、先绘制两列变量的散点图,根据散点图可判断两个变量之间是否线性关系。图可判断两个变量之间是否线性关系。5.2.2 协方差协方差协方差协方差(covariance)是两个变量离均差乘积是两个变量离均差乘积的平均数。协方差越大,表示的平均数。协方差越大,表示X、Y两列变两列变量的线性关系越强。量的线性关系越强。用符号用符号COV表示。表示。x、y两个变量的离均差两个变量的离均差(5.1)为什么协方差表示一致性程度?为什么协方差表示一致性程度?哪个图中,哪个图中,XY的一致性程度高?的一致性程度高?散点图AXY散点图BXYXYXminXmaxYmaxYminXY表示该点与平均数构成的矩表示该点与平均数
10、构成的矩形的面积形的面积XY表示将所有点与平均数构表示将所有点与平均数构成的矩形的面积加起来成的矩形的面积加起来+-+-+-+-XY+-+-+-+-的值越大,一致性程度越大。的值越大,一致性程度越大。5.2.3 积差相关系数基本公式积差相关系数基本公式 协方差的值会随着协方差的值会随着XY的单位的不的单位的不同而变化,是一个很不稳定的量。为同而变化,是一个很不稳定的量。为了克服协方差的缺点,除以两变量的了克服协方差的缺点,除以两变量的标准差标准差sX.sY,得到了积差相关系数:,得到了积差相关系数:(5.2)x、y两个变量的离均差两个变量的离均差两个变量的标准差两个变量的标准差表表5-1 31
11、人的视听反应时(单位:毫秒)人的视听反应时(单位:毫秒)被试被试 听觉听觉X视觉视觉Y1174.1177.511.92-3.18-37.86141.9910.092136.4167.4-25.78-13.28342.33664.81176.283118.3116.7-43.88-63.982807.571925.814093.064178.1130.915.92-49.78-792.25253.322477.755186.3199.124.1218.42444.29581.58339.416135.2198.3-26.9817.62-475.54728.14310.5730133.4145.5
12、28.78-35.181012.53828.521237.4231147163-15.18-17.68268.41230.55312.48合计合计 5027.75601.015054.6622406.9428840.75先计算变量先计算变量 X 和和 Y 的标准差的标准差:再将数据代入公式计算积差相关系数再将数据代入公式计算积差相关系数:5.2.4 标准分数计算积差相关系数标准分数计算积差相关系数(5.3)ZX为为X变量的标准分;变量的标准分;ZY为为Y变量的标准分。变量的标准分。5.2.5 原始数据计算积差相关系数原始数据计算积差相关系数 由标准差公式:由标准差公式:(5.4a)所以:或者
13、5.4b)下面运用该公式计算相关系数:下面运用该公式计算相关系数:被试 听觉(X)视觉(Y)1174.1177.530310.8131506.25 30902.752136.4167.418604.9628022.76 22833.363118.3116.713994.8913618.89 13805.614178.1130.931719.6117134.81 23313.295186.3199.134707.6939640.81 37092.336135.2198.318279.0439322.89 26810.1630133.4145.517795.5621170.25 19409.7
14、03114716321609.0026569.00 23961.00合计 5027.75601.0837818.79 1040815923446.52谢谢!谢谢!复习复习协方差:协方差:相关系数:相关系数:相关系数的合成。相关系数的合成。5.3 等级相关等级相关在心理与教育领域研究中,有时搜集在心理与教育领域研究中,有时搜集到的数据不是等距或等比的测量数据,到的数据不是等距或等比的测量数据,而是具有而是具有等级顺序等级顺序的测量数据。的测量数据。搜集到的数据是等距或者等比的数据,搜集到的数据是等距或者等比的数据,但其但其总体分布不是正态总体分布不是正态。5.3.1 斯皮尔曼等级相关斯皮尔曼等级
15、相关斯皮尔曼等级相关是等级相关的一种。它适斯皮尔曼等级相关是等级相关的一种。它适用于用于两列两列等级变量性质等级变量性质的线性关系的资料,的线性关系的资料,用于用于称名数据称名数据和和顺序数据顺序数据的相关问题。的相关问题。其相关系数常用其相关系数常用rR或或rS表示表示不要求总体呈正态分布,不要求样本的容量不要求总体呈正态分布,不要求样本的容量必须大于必须大于30。当连续数据不能满足计算积差相关的条件时,当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级可以转换成等级数据从而计算斯皮尔曼等级相关系数。相关系数。缺点:精确度要差于积差相关。缺点:精确度要差于积差相关
16、N为等级个数;为等级个数;D指二列成对变量的等级差数;指二列成对变量的等级差数;Rx与与Ry为两列变量各自排列的等级次数。为两列变量各自排列的等级次数。1.等级差数法:等级差数法:2.等级序数法:等级序数法:计算方法计算方法 (5.5a)(5.5b)假设有两列变量不服从正态分布,其假设有两列变量不服从正态分布,其中第一列变量为:中第一列变量为:X1、X2、X3Xn,其,其等级序数为:等级序数为:RX1、RX2、RX3RXn;第二列变量为:第二列变量为:Y1、Y2、Y3Yn,其等级序数为:其等级序数为:RX1、RX2、RX3RXn。等级差数法:等级差数法:等级序数法:等级序数法:见见P114公
17、式公式5-3a 1010个高三学生学习潜在能力测验个高三学生学习潜在能力测验(X)(X)与自学能与自学能力测验力测验(Y)(Y)成绩成绩序号序号XYXY=RX-RY190212-1128412111376434-11475545-11573656-11671767-11769878-118683862496610910-111064910911合计合计133.有相同等级时计算等级相关的方有相同等级时计算等级相关的方法法 如果有相同等级时如果有相同等级时,可用它们所占等可用它们所占等级位置的平均数作为它们的等级。级位置的平均数作为它们的等级。29.5252829.5301646.252.5164
18、164164936.252.5426.252.5932.251.56.252.5426.252.5422.251.56.252.5421111 随着相同等级数据的增多,随着相同等级数据的增多,有规有规律的减少律的减少,但,但与相同等级的位置无关与相同等级的位置无关。假设假设1、2、3n个等级相等,新的等个等级相等,新的等级:级:不同等级:不同等级:相同等级:相同等级:没有相同等级情况下:没有相同等级情况下:有相同等级情况下:有相同等级情况下:由于由于同理:同理:P118公式公式5-4b 下表是下表是10名学生的数学和语文考试成绩,名学生的数学和语文考试成绩,问数学和语文成绩是否相关?问数学和语
19、文成绩是否相关?学生学生语文语文数学数学RxRxRyRyD=Rx-RyD=Rx-Ry1 1595947474.54.56 6-1.5-1.52.252.252 235354040101010100 00 03 3595942424.54.58 8-3.5-3.512.512.54 4575755556 63.53.52.52.56.256.255 5505049497 75 52 24 46 6717163631 11 10 00 07 7626255553 33.53.5-0.5-0.50.250.258 8474742428 88 80 00 09 9434342429 98 81 11
20、11010686857572 22 20 00 0N=10解:5.3.2 肯德尔等级相关肯德尔等级相关(一)肯德尔(一)肯德尔W系数系数肯德尔肯德尔W系数,又称为肯德尔和谐系数,是表系数,又称为肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。两列以上的等级变量。计算肯德尔和谐系数,原始数据资料的获得一计算肯德尔和谐系数,原始数据资料的获得一般采用般采用等级评定法等级评定法,即让,即让K个被试(或称为评个被试(或称为评价者)对价者)对N件事物或件事物或N种作品进行等级评定,种作品进行等级评定,每个评价者都能对每个评价者都能对
21、N件事物(或作品)的好坏、件事物(或作品)的好坏、优劣、喜好、大小、高低等排出一个等级顺序。优劣、喜好、大小、高低等排出一个等级顺序。常用常用W表示。表示。例:有例:有10人对红、橙、黄、绿、青、蓝、紫七人对红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为最喜欢的等级为1,最不喜欢的等级为,最不喜欢的等级为7。问这。问这10人对颜色的爱好是否具有一致性人对颜色的爱好是否具有一致性?N=7评评价者价者 K=10Ri123 4 56 78910红红352 3 44 324333橙橙667 6 75 776663黄黄545 7
22、 66 445450绿绿111 2 22 211215青青434 4 33 563540兰兰223 1 11 132117紫紫776 5 57 657762合合计计280N=7评评价者价者 K=10Ri123 4 56 78910红红111 1 11 111110橙橙222 2 22 222220黄黄333 3 33 333330绿绿444 4 44 444440青青555 5 55 555550兰兰666 6 66 666660紫紫777 7 77 777770合合计计280 W系数是每一评价对象系数是每一评价对象实际得到的等级实际得到的等级总和的变异总和的变异与被与被评价对象一致性程度最大
23、评价对象一致性程度最大时时等级总和的变异的比值。等级总和的变异的比值。一致性程度最高的情况:一致性程度最高的情况:求实际等级总和的方差:求实际等级总和的方差:P88公式公式4-9:求一致性程度最大时等级总和的方差:求一致性程度最大时等级总和的方差:W系数:系数:肯德尔肯德尔 W系数:系数:Ri的平方和;的平方和;评价对象获得的评价对象获得的K个等级之和;个等级之和;被等级评定的对象的数目;被等级评定的对象的数目;等级评定者的数目。等级评定者的数目。将将代入上式,可得:代入上式,可得:(5.6a)(5.6b)例:有例:有10人对红、橙、黄、绿、青、蓝、紫七人对红、橙、黄、绿、青、蓝、紫七种颜色按
24、照其喜好程度进行等级评价。其中,种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为最喜欢的等级为1,最不喜欢的等级为,最不喜欢的等级为7。问这。问这10人对颜色的爱好是否具有一致性人对颜色的爱好是否具有一致性?N=7评评价者价者 K=10RiRi2123 4 56 78910红红352 3 44 3243331089橙橙667 6 75 7766633969黄黄545 7 66 4454502500绿绿111 2 22 211215225青青434 4 33 5635401600兰兰223 1 11 132117289紫紫776 5 57 6577623844合合计计28013516解:有
25、相同等级出现时有相同等级出现时W的计算的计算n为相同等级的数目式中:(5.6c)五位评分者对七篇作文进行了评价,五位评分者对七篇作文进行了评价,评价等级为评价等级为1-5,评价结果如下,试问评分,评价结果如下,试问评分者之间对标准的掌握是否一致?者之间对标准的掌握是否一致?N=7被评作文被评作文评价者评价者 K=5RiRi212345A453.55421.5462.25B111.5216.542.25C2.521.52210100D6554525625E2.533.52314196F5576629841G77677341156合计合计1403422.5解:复习复习斯皮尔曼等级相关斯皮尔曼等级相
26、关两列等级数据,不限总体分布,不限样本两列等级数据,不限总体分布,不限样本数量数量基本公式:基本公式:有等级相同:有等级相同:肯德尔肯德尔W系数系数多列等级数据相关,等级评定法,评分者多列等级数据相关,等级评定法,评分者信度信度基本公式:基本公式:)(12132NNKSSWR-=有等级相同:有等级相同:取值范围:取值范围:(二)肯德尔(二)肯德尔U系数系数肯德尔肯德尔U系数又称一致性系数,适用于对系数又称一致性系数,适用于对K个评价者的一致性进行统计分析。个评价者的一致性进行统计分析。它与肯德尔它与肯德尔W系数所处理的问题相同,但所系数所处理的问题相同,但所处理的资料的获得方法不同,计算结果也
27、不处理的资料的获得方法不同,计算结果也不同。同。如果有如果有N件事物,由件事物,由K个评价者,将个评价者,将N件事件事物两两配对,形成了物两两配对,形成了N(N-1)/2对,然后对每对,然后对每一对中两事物进行比较,优者记一对中两事物进行比较,优者记1,非优者,非优者记记0。红红橙橙黄黄绿绿青青蓝蓝紫紫红红10906210橙橙020005黄黄180308绿绿10101010510青青4107009蓝蓝8101051010紫紫05201010个评价者对个评价者对7种颜色对偶选择结果种颜色对偶选择结果被评价事物的数目被评价事物的数目评价者的数目评价者的数目对偶比较记录表中对偶比较记录表中ij(或或
28、ij)格中的择优分数格中的择优分数K为奇数为奇数 K为偶数为偶数 (5.7)取值范围:取值范围:红红橙橙黄黄绿绿青青蓝蓝紫紫红红10906210橙橙020005黄黄180308绿绿10101010510青青4107009蓝蓝8101051010紫紫05201010个评价者对个评价者对7种颜色对偶选择结果种颜色对偶选择结果解:已知解:已知N=7,K=10,对角线以下的择优,对角线以下的择优分数分析:分数分析:5.4 质与量的相关质与量的相关实际研究中常会遇到这种情形:需要实际研究中常会遇到这种情形:需要计算相关的两列变量一列为计算相关的两列变量一列为等比或等等比或等距距的测量数据,另一列是按的测
29、量数据,另一列是按性质划分性质划分的类别的类别,欲求这样两列变量的直线关,欲求这样两列变量的直线关系,称为质量相关系,称为质量相关5.4.1 点二列相关点二列相关适用条件适用条件一个变量为一个变量为正态、连续变量正态、连续变量,另一个变量,另一个变量为为真正的二分变量真正的二分变量,这两个变量之间的相,这两个变量之间的相关,称为点二列相关。关,称为点二列相关。可用于评价由可用于评价由是非类测验题目是非类测验题目组成的测验组成的测验的的内部一致性内部一致性等问题。等问题。有时一个变量并非真正的二分变量,而是有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来双峰分布的变量,也
30、可以用点二列相关来表示。例如,按识字量划分文盲和非文盲表示。例如,按识字量划分文盲和非文盲点二列相关公式:点二列相关公式:是与二分名义变量的一个值对应的连续变量的平均数是与二分名义变量的一个值对应的连续变量的平均数;是与二分名义变量的另一个值对应的连续变量的平均数是与二分名义变量的另一个值对应的连续变量的平均数;p 和和q分别是二分名义变量的两个值各自所占的比例,分别是二分名义变量的两个值各自所占的比例,p+q=1;st 是连续变量的标准差是连续变量的标准差.(5.8)设变量设变量X为连续变量,其样本值为为连续变量,其样本值为X1、X2、X3XN,N为样本容量;变量为样本容量;变量Y为为二分变
31、量,其取值分别用二分变量,其取值分别用1与与0来表示,取来表示,取1的比率为的比率为p,取,取0的比率为的比率为q,则:,则:相关系数:相关系数:有一是非选择测验,每题选对得有一是非选择测验,每题选对得2分,共分,共50题,满分题,满分100分。下表为分。下表为20名学生在该名学生在该测验中的总成绩及第测验中的总成绩及第5题的选答情况。请题的选答情况。请问这道题与测验总分的相关程度如何?问这道题与测验总分的相关程度如何?设设p为答对第五题的学生的比率;为答对第五题的学生的比率;q为答错第五题学生的比率。为答错第五题学生的比率。5.4.2 二列相关二列相关二列相关的适用资料是两列数据均属二列相关
32、的适用资料是两列数据均属于正态分布,其中于正态分布,其中一列变量为等距或一列变量为等距或等比等比的测量数据,另一列变量为的测量数据,另一列变量为人为人为划分的二分变量划分的二分变量。例如测验成绩,人为划分为及格与不例如测验成绩,人为划分为及格与不及格。及格。(5.9a)(5.9b)公式中,公式中,y为标准正态分布曲线中与为标准正态分布曲线中与p值值对应的纵线高度对应的纵线高度其余符号与点二列相关计算公式中含义其余符号与点二列相关计算公式中含义相同相同二列相关公式:二列相关公式:补充知识:补充知识:已知概率P如何求概率密度YP概率概率Y概率密度概率密度Z分数分数P=|0.5-p|P为分布表上查阅
33、的概率为分布表上查阅的概率p为实际的概率为实际的概率例例 下下表是表是10名学生在一次测验中总分和一名学生在一次测验中总分和一道问答题的得分。该题回答是否合格与卷面道问答题的得分。该题回答是否合格与卷面总分的关系如何?(该问答题满分为总分的关系如何?(该问答题满分为10分,分,规定达到规定达到6分为合格)分为合格)学生学生ABCDEFGHIJ卷面总卷面总分分75577365675663616567问答题问答题分分967474448610名学生某题得分与卷面总分名学生某题得分与卷面总分 计算:计算:sX6.12,p0.6,q0.4,查正态分布表查正态分布表P449,当,当 p0.60时,Y0.3
34、8667复习复习点二列相关点二列相关一列变量为正态连续变量,另一列变量为一列变量为正态连续变量,另一列变量为真正的二分变量。真正的二分变量。二列相关二列相关两列变量均为正态连续数据,但其中一列两列变量均为正态连续数据,但其中一列变量被人为划分为二分变量。变量被人为划分为二分变量。5.4.3 多列相关多列相关多列相关适合处理两列正态变量资料,多列相关适合处理两列正态变量资料,其中一列为其中一列为等距或等比的测量数据等距或等比的测量数据,另一列被另一列被人为划分为多种类别人为划分为多种类别,称为,称为名义变量。例如,学习成绩被人为划名义变量。例如,学习成绩被人为划分为优、良、中、差四类。分为优、良
35、中、差四类。优优良良中中差差多列相关计算公式:多列相关计算公式:为每系列的次数比率;为每系列的次数比率;为每一名义变量下限的正态曲线高度为每一名义变量下限的正态曲线高度为每一名义变量上限的正态曲线高度为每一名义变量上限的正态曲线高度(5.10)例例 下下表是表是10名学生在一次测验总分和老师名学生在一次测验总分和老师评价等级。该测验与老师评价之间的关系如评价等级。该测验与老师评价之间的关系如何?何?学生学生ABCDEFGHIJ卷面总卷面总分分75577365675663616567评价等评价等级级ABBDCDCCBB10名学生某题得分与卷面总分名学生某题得分与卷面总分评价等级:D C B A
36、 合计比率:0.2 0.3 0.4 0.1累加比率:0.2 0.5 0.9 1y:0.348 0.399 0.176 0yL-yH:-0.348 -0.051 0.223 0.176 :60.5 63.67 65.5 75.00:-21.06-3.25 14.61 13.2 3.505:0.606 0.009 0.124 0.31 1.048 下表的数据是下表的数据是140名学生学习能力测名学生学习能力测验分数与教师对该部分学生的评价等级验分数与教师对该部分学生的评价等级(A、B、C、D)资料。计算能力与教师)资料。计算能力与教师评价之间的一致性。评价之间的一致性。分组分组教师某一评定等级的人
37、数教师某一评定等级的人数合计合计fDfCfBfA809000123708001381260701272131506056207384050815543230401434021203021003合计合计30284042140评价等级:D C B A 合计比率:0.214 0.2 0.286 0.3累加比率:0.214 0.414 0.7 1y:0.292 0.39 0.347 0yL-yH:-0.292 -0.098 0.043 0.347 :40.83 47.36 55.25 63.79:-11.922 -4.641 2.376 22.135 7.95:0.3979 0.048 0.0065
38、0.4014 0.85385.5 品质相关品质相关两个变量都是按性质划分成几种类别,表两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。示这两个变量之间的相关称为品质相关。品质相关主要用于列联表(品质相关主要用于列联表(RC表)的相表)的相关。关。依据二因素的性质及分类项目的不同,有依据二因素的性质及分类项目的不同,有不同的名称和计算方法,主要有四分相关、不同的名称和计算方法,主要有四分相关、相关、列联表相关。相关、列联表相关。5.5.1 四分相关四分相关四分相关适用于计算两个变量都是连四分相关适用于计算两个变量都是连续变量,且每个变量的变化都被人为续变量,且每个变量的变
39、化都被人为地分为两种类型的测量数据。地分为两种类型的测量数据。例如,学习成绩,划分为例如,学习成绩,划分为“及格及格”和和“不及格不及格”。abcd高高 矮矮胖胖瘦瘦高度高度体体重重a+cb+da+bc+d四格表的一般形式变量变量12合 计变变量量1aba+b2cdc+d合计a+cb+d n=a+b+c+d四分相关的计算公式:四分相关的计算公式:(5.11)abcd记忆方法记忆方法:下表所列数据是调查下表所列数据是调查377名学生两科测名学生两科测验成绩所得到的结果,假设两科成绩验成绩所得到的结果,假设两科成绩分布为正态,只是人为地将其按一定分布为正态,只是人为地将其按一定标准划分为及格、不及
40、格两类。标准划分为及格、不及格两类。a124b68c85d100历史成绩历史成绩及格及格 不及格不及格地地理理成成绩绩及及格格不不及及格格5.5.2 5.5.2 系数系数系数适合于系数适合于两个变量至少有一个是真正的二两个变量至少有一个是真正的二分变量的相关,如吸烟(吸烟者和非吸烟者),分变量的相关,如吸烟(吸烟者和非吸烟者),性别,婚姻状态。性别,婚姻状态。值小于值小于0.30.3时,表示相关较弱,当时,表示相关较弱,当值大于值大于0.60.6时,表示相关较强。时,表示相关较强。在应用在应用相关时,一般不指出相关方向,只说相关时,一般不指出相关方向,只说明相关程度是否显著。明相关程度是否显著
41、相关系数计算公式(5.12)aba+bcdc+da+c b+d巧记公式:143 例5-14:关于吸烟与患癌症之间关系数据的四格表癌症(癌症(0 0)其他(其他(1 1)吸烟者(吸烟者(0 0)a6b4非吸烟者(非吸烟者(1 1)c3d710109115.5.3 列联表相关列联表相关当两个变量均被分成两个以上类别,当两个变量均被分成两个以上类别,或其中一个变量被分成两个以上类别,或其中一个变量被分成两个以上类别,表示这两个变量之间的相关,称为列表示这两个变量之间的相关,称为列联相关。联相关。列联相关系数是由列联相关系数是由的列联表求得的列联表求得的,因此称为列联相关。最常用的是的,因此称为列联
42、相关。最常用的是皮尔逊定义的列联相关系数。皮尔逊定义的列联相关系数。列联相关系数的计算公式中:为列联相关系数公式中:为列联相关系数值的计算方法将在卡方检验值的计算方法将在卡方检验一章中学习。一章中学习。(5.12)相关与数据类型相关与数据类型女性无名指与食女性无名指与食指的长度比例与指的长度比例与跑步成绩相关跑步成绩相关焦虑程度(高焦虑程度(高/低)低)与吸烟次数的相与吸烟次数的相关关考生类型(应届考生类型(应届/历届)与研究生历届)与研究生录取(录取录取(录取/不录不录取)取)二列相关二列相关phi相关相关考生类型(应届考生类型(应届/历届)与研究生历届)与研究生录取(录取录取(录取/不录不
43、录取)取)积差相关积差相关二列相关二列相关phi相关相关参加培训班(参加、参加培训班(参加、不参加)与考试成不参加)与考试成绩的关系绩的关系学生综合成绩排名学生综合成绩排名与物理成绩排名与物理成绩排名身高与收入(高身高与收入(高/中中/低)低)积差相关积差相关等级相关等级相关点二列相关点二列相关多列相关多列相关晒太阳时间与健康晒太阳时间与健康程度(好程度(好/中中/差)差)啤酒销售量与暴力啤酒销售量与暴力案件量案件量不同程度的教养方不同程度的教养方式(权威型式(权威型/专制型专制型/纵容型)与未来成纵容型)与未来成就(高就(高/中中/低)低)多列相关多列相关积差相关积差相关列联相关列联相关ph
44、i相关相关跳高成绩(及格跳高成绩(及格/不不及格)与短跑成绩及格)与短跑成绩(及格(及格/不及格)的不及格)的关系关系养猫(养养猫(养/不养)与不养)与神经质(有神经质(有/无)无)道歉时间(早道歉时间(早/中中/晚)晚)与接受道歉者的满与接受道歉者的满意程度(不满意意程度(不满意/一一般般/很满意)很满意)四分相关四分相关Phi相关相关列联相关列联相关多列相关多列相关计算得到了相关系数,还不能确定这两个变计算得到了相关系数,还不能确定这两个变量的总体一定具有相关关系,需要对相关系量的总体一定具有相关关系,需要对相关系数进行显著性检验之后,才能做出判断。数进行显著性检验之后,才能做出判断。0|
45、r|0.4 弱相关;弱相关;0.4|r|0.6 中等正相关;中等正相关;0.6|r|0.8 强相关;强相关;0.8|r|1 非常强相关。非常强相关。相关系数值的解释相关系数值的解释半期考核半期考核小组为单位,进行一项科学研究,可以是实验研小组为单位,进行一项科学研究,可以是实验研究、问卷调查等。撰写研究报告(电脑撰写,绘究、问卷调查等。撰写研究报告(电脑撰写,绘图)。图)。考核时间:考核时间:5月月11日,日,5月月13日日评分标准:评分标准:1、意义是否重大?、意义是否重大?2、格式是否规范?、格式是否规范?3、统计方法是否恰当?、统计方法是否恰当?4、美观(图表排版等)、美观(图表排版等)考核方式:每小组选一位同学报告研究内容(做考核方式:每小组选一位同学报告研究内容(做成成PPT)。每个班选一位同学和我一起作为评委,。每个班选一位同学和我一起作为评委,最后得分为四个评委的平均分。最后得分为四个评委的平均分。






