资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第4讲相关分析,函数关系,(,几个例子,),函数关系的例子,某种商品的销售额,(,y,),与销售量,(,x,),之间的关系可表示为,y,=,px,(,p,为单价,),圆的面积,(S),与半径之间的关系可表示为,S=,R,2,企业的原材料消耗额,(,y,),与产量,(,x,1,),、单位产量消耗,(,x,2,),、原材料价格,(,x,3,),之间的关系可表示为,y=x,1,x,2,x,3,相关关系,变量间关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定,当变量,x,取某个值时,变量,y,的取值可能有几个,各观测点分布在直线周围,x,y,相关关系,(,几个例子,),相关关系的例子,父亲身高,(,y,),与子女身高,(,x,),之间的关系,收入水平,(,y,),与受教育程度,(,x,),之间的关系,粮食亩产量,(,y,),与施肥量,(,x,1,),、降雨量,(,x,2,),、温度,(,x,3,),之间的关系,商品的消费量,(,y,),与居民收入,(,x,),之间的关系,商品销售额,(,y,),与广告费支出,(,x,),之间的关系,相关关系的描述与测度,-,散点图,不相关,负线性相关,正线性相关,非线性相关,完全负线性相关,完全正线性相关,什么是相关分析,用统计方法揭示变量之间是否存在相互关系及如何将相关的密切程度及相关的方向描述出来,相关分析常用的方法:,散点图,统计指标(相关系数),相似性或距离,怎样分析变量间的相关关系?,分析变量之间的关系需要解决下面的问题,变量之间是否存在关系?,如果存在,它们之间是什么样的关系?,变量之间的关系强度如何?,样本所反映的变量之间的关系能否代表总体变量之间的关系?,相关分析的分类,简单相关分析,研究两个变量之间的关系,复相关分析,研究一个因变量与两个以上自变量之间的关系,偏相关分析,控制一个变量,研究其他变量之间的关系,距离相关分析,相似性或距离,三种相关分析对应着相应的相关系数,简单相关分析,Pearson,相关系数,测度两数值变量的线性相关性,Spearman,等级相关系数,测度两顺序变量的相关性(非参数方法),Kendalls tau-b,相关系数,测度两顺序变量的相关性(非参数方法),数学家的年工资额问题,某科学基金会的管理人员欲分析从事数学研究工作的中等或较高水平的数学家的,年工资额,y,与他们的研究成果(论文、著作)的,质量指标,x,1,,从事,研究工作的时间,x,2,以及能,成功获得资助的指标,x,3,之间的关系,为此按一定的试验设计方法调查了,24,位此类型的数学家。请分析变量间的相关性。,度量变量之间,线性关系,强度的一个统计量,若相关系数是根据总体全部数据计算的,称为总体相关系数,记为,若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为,r,是一种简单相关系数,样本相关系数的计算公式,Pearson,相关系数(含义),Pearson,相关系数,(,取值及其意义,),-1.0,+1.0,0,-0.5,+0.5,完全负相关,无线性相关,完全正相关,负相关程度增加,r,正相关程度增加,Pearson,相关系数,(,取值及其意义,),r,的取值范围是,-1,1,|,r,|=1,,为完全相关,r,=1,,为完全正相关,r,=-1,,为完全负正相关,r,=0,,不存在,线性,相关关系,-1,r,0,,为负相关,0,r,1,,为正相关,|,r,|,越趋于,1,表示关系越密切;,|,r,|,越趋于,0,表示关系越不密切,Pearson,相关系数(相关程度),高度,线性相关,显著,线性相关,低度,线性相关,非线性,相关,Pearson,相关系数的检验,假设形式,H,0,:,=0,H,1,:,0,检验的统计量,在两随机变量X和Y服从正态分布及原假设为真时,统计量,t,t,(n-2),决策规则,当 (或,p,)时拒绝原假设,表明样本相关系数,r,是显著的;否则表明,r,在统计上是不显著的,两总体不存在显著的相关关系。,SPSS,中,Pearson,相关系数的计算,SPSS,ANALYZE,Correlate,Bivariate,数学家的年工资额问题,某科学基金会的管理人员欲分析从事数学研究工作的中等或较高水平的数学家的,年工资额,y,与他们的研究成果(论文、著作)的,质量指标,x,1,,从事,研究工作的时间,x,2,以及能,成功获得资助的指标,x,3,之间的关系,为此按一定的试验设计方法调查了,24,位此类型的数学家。请分析变量间的相关性。,SPSS,中,Pearson,相关系数的输出结果,申请打字人员的口试与实际操作的相关关系,有一家公司招聘打字员,采用口试与实际操作两种考核方式。现有,6,个申请人的口试与实际操作的评分如下表。现要求测定这些申请人实际操作成绩与口试成绩之间是否存在关系及关系的密切程度。,申请人,1,2,3,4,5,6,口试成绩,B,-,A,-,B,+,A,C,B,操作成绩,28,38,47,56,29,32,Spearman,等级相关系数(含义),Spearman,等级相关适用于测度,两顺序变量,的相关性,利用秩来进行计算的,是一种非参数方法,其计算公式为:,U,i,,,V,i,分别为两变量按大小或优劣排序后的秩,Spearman,等级相关系数,(,取值及其意义,),-1.0,+1.0,0,-0.5,+0.5,完全负相关,无线性相关,完全正相关,负相关程度增加,r,正相关程度增加,申请打字人员的口试与实际操作的相关关系,有一家公司招聘打字员,采用口试与实际操作两种考核方式。现有,6,个申请人的口试与实际操作的评分如下表。现要求测定这些申请人实际操作成绩与口试成绩之间是否存在关系及关系的密切程度。,申请人,1,2,3,4,5,6,口试成绩,B,-,A,-,B,+,A,C,B,操作成绩,28,38,47,56,29,32,Spearman,等级相关系数计算,申请人,口试成绩,操作成绩,转换成等级,口试,操作,d,i,1,B,-,28,5,6,-1,1,2,A,-,38,2,3,-1,1,3,B,+,47,3,2,+1,1,4,A,56,1,1,0,0,5,C,29,6,5,+1,1,6,B,32,4,4,0,0,4,SPSS,中,Spearman,等级相关系数的输出结果,SPSS,ANALYZE,Correlate,Spearman,Kendalls tau-b,相关系数(含义),Kendalls tau-b,相关系数适用于测度,两顺序变量,的相关性,利用秩来进行计算的,是一种非参数方法,同序对:指的是变量大小顺序相同的两个样本观测值,即,X,的等级高低顺序与,Y,的等级高低顺序相同。否则,称为异序对。,其计算公式为:,V,为异序对数目之和,Kendalls tau-b,相关系数,(,取值及其意义,),-1.0,+1.0,0,-0.5,+0.5,完全负相关,无线性相关,完全正相关,负相关程度增加,r,正相关程度增加,申请打字人员的口试与实际操作的相关关系,有一家公司招聘打字员,采用口试与实际操作两种考核方式。现有,6,个申请人的口试与实际操作的评分如下表。现要求测定这些申请人实际操作成绩与口试成绩之间是否存在关系及关系的密切程度。,申请人,1,2,3,4,5,6,口试成绩,B,-,A,-,B,+,A,C,B,操作成绩,28,38,47,56,29,32,Kendalls tau-b,相关系数计算,申请人,口试成绩,操作成绩,转换成等级,口试,操作,异序对,4,A,56,1,1,0,2,A,-,38,2,3,1,3,B,+,47,3,2,0,6,B,32,4,4,0,1,B,-,28,5,6,1,5,C,29,6,5,0,SPSS,中,Kendalls tau-b,相关系数的输出结果,SPSS,ANALYZE,Correlate,Kendalls tau-b,数学家的年工资额问题,(续),现继续对,数学家的年工资额问题,的数据进行分析。在,Pearson,相关分析中,四个变量年工资额,y,与研究成果(论文、著作)的质量指标,x,1,,从事研究工作的时间,x,2,以及能成功获得资助的指标,x,3,,存在较强的相关关系,且相关系数均通过显著性检验,并且可以看出年工资额与工作时间相关性最强。,现考虑在剔除,x,1,及,x,3,的影响后,年工资额,y,与从事研究工作的时间,x2,之间是否还存在较强的相关关系。,偏相关分析,偏相关(,Partial correlation,)分析就是在控制对两变量之间相关性的可能产生影响的其它变量的前提下,即在剔除其它变量的干扰后,研究两个变量之间的相关性。,偏相关分析假定变量之间的关系均为线性关系,三个变量间的偏相关系数计算公式:,四个变量间的偏相关系数计算公式:,SPSS,中,偏,相关系数的输出结果,SPSS,ANALYZE,Correlate,Partial,啤酒品牌的相似度分析,受某啤酒公司的委托,尼尔森咨询公司就啤酒市场进行了详细的品牌调查。数据如下,现对啤酒品牌的相似度进行分析。,编号,啤酒品牌,热量(卡),钠含量,(%),酒精含量,(%),价格(,$,),1,Budweiser,144.00,19.00,4.70,0.43,2,Schlitz,181.00,19.00,4.90,0.43,3,Ionenbrau,157.00,15.00,4.90,0.48,4,Kronensourc,170.00,7.00,5.20,0.73,5,Heineken,152.00,11.00,5.00,0.77,6,Old-milnaukee,145.00,23.00,4.60,0.26,7,Aucsberger,175.00,24.00,5.50,0.40,8,Strchs-bohemi,149.00,27.00,4.70,0.42,距离相关分析,距离相关(,Distance Correlation,)分析是对样品或变量之间相似或不相似程度的一种度量,计算的是一种广义距离。,距离相关分析根据统计量的不同,分为,不相似性测度(,Dissimilarities,),:,通过计算距离来表示的,其数值越大,表示相似程度越弱,.,相似性测度(,Similarities,),:,通过计算,Peason,相关系数或,Cosine,相似系数来表示的,其数值越大,表示相似程度越强,.,SPSS,中,距离相关分析,的输出结果,(不相似性测度),SPSS,ANALYZE,Correlate,Distance,SPSS,中,距离相关分析,的输出结果,(相似性测度),SPSS,ANALYZE,Correlate,Distance,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,
展开阅读全文