1、两变量间的关系的度量第一节第一节 概述概述1 相关关系得概念和分类相关关系得概念和分类相关得概念事物之间得关系种类:因果关系和相关关系。n 三、相关三、相关类型型 方向上方向上 形状上形状上 程度上程度上 变量个数上变量个数上n(一)方向上正相关、负相关和零相关直线n(二)形状上曲线相关、直线相关(三)变量个数简相关和复相关(四)相关程度完全相关、强相关、弱相关和无相关相关关系得散点图示相关关系得散点图示1 散点呈椭圆形分布散点呈椭圆形分布,X X、Y Y 同时增减同时增减-正相关正相关(positive correlation)positive correlation);X X、Y Y 此增
2、彼减此增彼减-负相关负相关(negative correlation)(negative correlation)。散点在一条直线上散点在一条直线上,X X、Y Y 变化趋势相同变化趋势相同-完全正相关完全正相关;反向变化反向变化-完全负相关。完全负相关。相关系数示意图相关系数示意图 相关关系得散点图示相关关系得散点图示2零相关图示零相关图示曲线相关图示曲线相关图示2 相关分析相关分析相关程度得度量相关程度得度量相关分析相关分析就就是探索变量之间关系得紧密程度及其表现形式得过程。常用方法:图示法:散点图计算法:积差相关等级相关(斯皮尔曼等级相关、肯德尔和谐系数)点二列相关双列相关四分相关相关系
3、数得数字特征相关系数得数字特征相关系数记为:相关系数得值域:-1,+1相关系数得符号表示相关得方向,绝对值得大小表示关系紧密程度。r1:完全正相关r-1:完全负相关r0:零相关0、70|r|1:高度相关0、40|r|0、70:中等相关0|r|0、40:低度相关大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点3 相关系数得使用条件相关系数得使用条件计算相关系数一般要求成对数据。任意两个个体之间得观测值不能求相关。要先考察两变量关系得形式。相关关系不同于因果关系。相关系数不就是等距变量。
4、相关系数需要检验。计算相关系数、相关系数得计算相关系数、相关系数得解释应该注意哪些问题?解释应该注意哪些问题?第二节第二节 积差相关积差相关一、积差相关1 积差相关得使用条件要求成对得数据要求成对得数据个数不宜少于个数不宜少于3030个个两列变量各自总体得分布都就是正态两列变量各自总体得分布都就是正态较大样本较大样本,正态性检验正态性检验两列变量就是连续变量两列变量就是连续变量等距等距/比率数据比率数据两列变量就是线性关系两列变量就是线性关系散点图散点图2、基本公式例 计算身高与体重得相关系数。二、等级相关(Rank correlation)等级相关得意义n定义定义:以等级资料研究变量之间相互
5、关以等级资料研究变量之间相互关 系得方法。系得方法。n资料形式资料形式 等级评定资料等级评定资料 n 非等级资料非等级资料 等级资料等级资料使用条件使用条件n多列多列变量均量均为等等级或或顺序序变量量;n成成对变量数目可少于量数目可少于30;n变量可呈非正量可呈非正态分布。分布。二、等级相关二、等级相关(Rank correlationRank correlation)斯皮尔曼等级相关斯皮尔曼等级相关两列变量两列变量;线性关系线性关系肯德尔等级相关肯德尔等级相关多列变量多列变量(适用于评分者信度分析适用于评分者信度分析)分析方法nKendle和谐系数 n无重复等级法 n有重复等级法Spearm
6、an等级等级相关相关 无重复等级法无重复等级法 有重复等级法有重复等级法(一)、斯皮尔曼等级相关rR适用条件:属直线相关范畴属直线相关范畴,积差相关体系积差相关体系适用于两列具有等级顺序得测量数据适用于两列具有等级顺序得测量数据,或总体为非正态或总体为非正态得等距、等比数据。得等距、等比数据。如果两列变量就是连续变量如果两列变量就是连续变量,但样本容量小但样本容量小,且总体分布且总体分布非正态非正态,常常将连续变量转换为等级变量常常将连续变量转换为等级变量,然后计算等级然后计算等级相关。相关。优点优点:总体分布不作要求总体分布不作要求缺点缺点:精度低于积差相关精度低于积差相关1 斯皮尔曼等级相
7、关公式斯皮尔曼等级相关公式等级差数法公式:等级相关计算实例等级相关计算实例车间123456789101112131415质量123456789101112131415纪律143295687101213111415D 0-202-411020-1-1200 例:有人对15个车间得生产质量与纪律得状况进行了调查,各车间得排名如下表所示,问质量与纪律得关系如何?等级相关得校正等级相关得校正学生测验I测验II等级I等级IID180701、55、5-4270755、532、5370705、55、50480751、53-1、55656089、5-1、5670755、532、5775803128606597
8、、52、5970655、57、5-2105560109、50、5例:10名学生得两次测验成绩如表所示,求其等级相关系数。有两个1、5等有四个5、5等二、肯德尔和谐系数二、肯德尔和谐系数W适用条件:适用于多列等级变量得相关分析、公式:当相同等级增多时,需校正。公式变形公式变形肯德尔和谐系数计算实例肯德尔和谐系数计算实例例:6位都就是对五篇相同作文所评等级如下表,试分析所评等级得一致性如何。一二三四五135241235241334152435142535241635241182910258例例 有有10人对人对7种颜色进行等级评价种颜色进行等级评价,结果如下表结果如下表,问这问这10人得评价就是否
9、具有一致性?人得评价就是否具有一致性?10人对人对7种颜色得评价具有较高种颜色得评价具有较高得一致性。得一致性。肯德尔和谐系数计算得校正肯德尔和谐系数计算得校正例:5位评价者对6位教师教学质量评定等级如表所示,试分析这5位评价者得评价一致性程度。12345A453、55421、5B111、5216、5C2、521、52210D6554525E2、533、52314F5566628教师1评了两个2、5等教师2评了三个5等习题习题有有3 3位教师对位教师对5 5位学生得作文进行等级评定位学生得作文进行等级评定,结果如下结果如下:A A生得到得等级评定分别就是生得到得等级评定分别就是:3 3、5 5
10、、3 3;B B生得到得等级评定分别就是生得到得等级评定分别就是:1 1、2 2、2 2;C C生得到得等级评定分别就是生得到得等级评定分别就是:2 2、1 1、1 1;D D生得到得等级评定分别就是生得到得等级评定分别就是:2 2、3 3、2 2;E E生得到得等级评定分别就是生得到得等级评定分别就是:2 2、4 4、3 3;请计算请计算3 3位老师评定得肯德尔和谐系数。位老师评定得肯德尔和谐系数。习题习题五位教师对甲乙丙三篇作文分别排定名次如下表五位教师对甲乙丙三篇作文分别排定名次如下表:教师序号教师序号 名次名次 甲甲 乙乙 丙丙1 3 1 21 3 1 22 3 2 12 3 2 13
11、 3 1 23 3 1 24 1 3 24 1 3 25 1 3 25 1 3 2请对上述数据进行相应得统计分析请对上述数据进行相应得统计分析(1010)三、点二列相关(point-biserial correlation)n适用资料n两列变量中一列为总体正态分布得等距或比率变量,另一列就是二分称名变量。n应用n多用于评价就是非类测验题目组成得测验内部一致性。n注:每个题目(二分称名变量)与总分(数值)变量得相关,称为每个题目得区分度。相关高说明该题答对答错与总分得一致性高,即区分度高。点二列相关系数点二列相关系数计算实例例:一次某种能力测验,一考场共14名考生,男生得成绩为分别 为:67、1
12、0、20、43、61、26、18、35、23;女生成绩分别为:44、60、10、23、30。问从该考场看,该能力得测验成绩与性别就是否相关?四、二列相关1 1、适用条件、适用条件:两列变量均为来自正态总体得等距或等比变量两列变量均为来自正态总体得等距或等比变量,而其中一列被人为地而其中一列被人为地划分为两个类别得数据。划分为两个类别得数据。2 2、公式、公式:二列相关计算区分度二列相关计算区分度测验总分与项目分数均为连续变量测验总分与项目分数均为连续变量,其中一个被人为地分成两个类别其中一个被人为地分成两个类别,公式得说明公式得说明:p为二分变量中某一类别在全为二分变量中某一类别在全部变量中所
13、占得比例部变量中所占得比例,q为另一为另一类别所占得比例类别所占得比例(q1-p)St为全部连续变量得标准差为全部连续变量得标准差Y表示正态曲线下与表示正态曲线下与P相对应相对应得纵线高度。得纵线高度。生生1 12 23 34 45 56 67 78 89 910101111121213131414151516161717181819192020总总86865252949472726565222276768383808075757676737362629191474774748181888862625858作作47473737555527272222101035354242464639394040414138385252212139394242484829292727类类合合合合合合不不不不不不不不合合合合合合合合合合合合合合不不不不合合合合不不不不
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100