资源描述
第8章 相 关 分 析 Correlations 返回返回1精选课件ppt目 录相关分析的概念与相关分析过程相关分析的概念与相关分析过程两个变量间的相关分析两个变量间的相关分析q简单实例简单实例q二个变量间的相关分析过程二个变量间的相关分析过程q秩相关及其实例秩相关及其实例q关于相关矩阵数据文件关于相关矩阵数据文件偏相关分析偏相关分析 距离分析距离分析 习题及参考答案习题及参考答案结束结束返回返回2精选课件ppt相关分析的概念与相关分析过程返回3精选课件ppt有关公式:有关公式:Pearson积矩相关积矩相关 Spearman相关系数相关系数 式中式中Ri是第是第i个个x值的秩,值的秩,Si是第是第i个个y值的秩。值的秩。分别是分别是Ri和和Si的平均值。的平均值。返回4精选课件ppt有关公式:有关公式:Kendalls tau-b:其中其中 ti(或(或ui)是)是x(或(或y)的第)的第i 组结点组结点x(或(或y)值的数目,)值的数目,n为观测量数。为观测量数。返回5精选课件ppt有关公式:有关公式:关于相关系数统计意义的检验关于相关系数统计意义的检验 式中式中r是相关系数,是相关系数,n是样本观测量数,是样本观测量数,n2是自由度。是自由度。当当tt0.05(n-2)时,时,pt0.05(n-k-2)时,时,p0.05拒绝原假设拒绝原假设 返回15精选课件ppt偏相关分析的主对话框偏相关分析的主对话框返回16精选课件ppt偏相关的选择项对话框偏相关的选择项对话框返回17精选课件ppt偏相关应用实例输出偏相关应用实例输出1 四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度这四个气候因素哪个因素有关。数据来源于袁佳祖编著灰色系统理论,数据编号data10-03。各变量的描述统计量各变量的描述统计量生长量与各变量间生长量与各变量间PearsonPearson相关分析结果相关分析结果返回18精选课件ppt偏相关分析输出偏相关分析输出2:返回19精选课件ppt偏相关分析结论偏相关分析结论中山柏生长量与四个气候因素的偏相关综合结果中山柏生长量与四个气候因素的偏相关综合结果 TEMPHUMIHSUNRAINHGROW.9774.7310.6318-0.4906(7)(7)(7)(7)p=0.000p=0.025p=.068p=0.180返回20精选课件ppt距 离 分 析Distance 返回21精选课件ppt距离分析的主对话框图距离分析的主对话框图返回22精选课件ppt不相似性距离测度选择项对话框不相似性距离测度选择项对话框 返回23精选课件ppt相似性测度选择项对话框相似性测度选择项对话框 返回24精选课件ppt距离分析实例距离分析实例 观测量间的欧氏距离观测量间的欧氏距离 返回25精选课件ppt变量间不相似性分析例题输出变量间不相似性分析例题输出变量间的不相似性测度变量间的不相似性测度 标准化后的欧氏距离标准化后的欧氏距离返回26精选课件ppt变量间的相似性测度例题变量间的相似性测度例题相关系数矩阵相关系数矩阵返回27精选课件ppt习题八及参考答案习题八及参考答案1.什么是两个变量间的线性相关?两个变量间的相关系数的数值范围是什么?什么是两个变量间的线性相关?两个变量间的相关系数的数值范围是什么?负相关系数反映的是两个变量数值间的什么样的关系?负相关系数反映的是两个变量数值间的什么样的关系?2.SPSS提供了几个求相关系数的方法?个适应什么样的变量?提供了几个求相关系数的方法?个适应什么样的变量?3.在在data08-04中记录了中记录了29个被试的身高、体重、肺活量的数据,试分析肺活个被试的身高、体重、肺活量的数据,试分析肺活量与哪个因素线性相关程度更高。说明为量与哪个因素线性相关程度更高。说明为 什么要计算偏相关?什么要计算偏相关?4、在、在data08-05中是中是474名职工的职务等级名职工的职务等级jobcat、起始工资、起始工资salary、现工资、现工资salary、受教育程度、受教育程度educ、本单位工作经历(月)、本单位工作经历(月)jobtime、以前工作经历(月)、以前工作经历(月)prevexp,id为职工编号。分析该公司起始工资的确定与什么因素有关。当前为职工编号。分析该公司起始工资的确定与什么因素有关。当前工资与什么因素有关。工资与什么因素有关。5.data08-06是某公司太阳镜销售情况。分析销售量与平均价格、广告费用和是某公司太阳镜销售情况。分析销售量与平均价格、广告费用和日照时间之间的关系。作图协助分析。此题使用偏相关分析是否有实际意义?日照时间之间的关系。作图协助分析。此题使用偏相关分析是否有实际意义?返回28精选课件ppt习题及解答习题及解答13131.两个变量的对应关系不具有唯一性时,相关分析研究他们之间线性关系的密切程度。变量Y随着变量X的增加(或减少)而增加(或减少),称为两个变量之间存在着线性关系,也称这两个变量线性相关。相关系数的数值范围是在-1+1之间。当一个变量随着另一个变量的增加而减少,这种相关关系称为负相关。相关系数小于0。2.提供了三个相关分析方法:Pearson相关适合于分析正态分布的两个连续变量(测量方法定义为scale的尺度变量)间的相关系数。对于非正态分布的尺度测量的变量或顺序测量的等级变量(order)应该使用Spearman 和Kendalls tau-b方法计算相关系数。后者考虑了结点的影响。3.分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。这是应该控制一个变量的变化求另两个变量间的相关系数,也就是说,在第三个变量不变的情况下,两个变量的线性程度。CORRELATIONS /VARIABLES=VCP with HEIGHT WEIGHT /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.返回29精选课件ppt习题及解答习题及解答-3-3PARTIAL CORR /VARIABLES=VCP with WEIGHT BY HEIGHT /SIGNIFICANCE=TWOTAIL /MISSING=LISTWISE.PARTIAL CORR /VARIABLES=VCP with HEIGHT BY WEIGHT /SIGNIFICANCE=TWOTAIL /MISSING=LISTWISE.做偏相关,执行这样两个程序。假设:肺活量与体重间无线性相关关系Significant=0.002,拒绝原假设,说明肺活量和体重(控制了身高)高度相关,相关系数为0.569。假设:肺活量与身高间无线性相关关系。Significant=0.619,接受原假设,说明肺活量和身高(控制了体重)没有线性关系,相关系数为0.098。正是由于在身高和体重之间高度线性相关,因此只做线性相关无法找到肺活量与身高和体重的真正的相关关系。结论是:肺活量与体重高度相关,与身高无线性关系。返回30精选课件ppt习题及解答习题及解答-4CORRELATIONS /VARIABLES=salbegin with educ prevexp jobcat /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.NONPAR CORR /VARIABLES=salbegin with educ prevexp jobcat /PRINT=BOTH TWOTAIL NOSIG /MISSING=PAIRWISE.左面程序的执行结果,Pearson相关下表是执行右面程序的结果,使用非参相关:Spearman和Kendalls tau-b方法计算相关系数。这两个结果是不同的。Pearsom相关分析结果初始工资与受教育程度和职务等级高度相关(p0.001),与以前的工作经历无关(p=0.327)。Spearman和Kendalls tau-b的结果是与三者都是高度相关的p值均小于0.001。只是与以前工作经历相关系数较小0.133和0.186。应该使用哪个输出结果做结论呢?应该查看变量的测度和进行正态性分析。返回31精选课件ppt习题及解答习题及解答-4-4从上3个图可以看出受教育年限、其始工资、以前工作经历(月)都不是正态分布;从变量属性的测度类型看,职务等级是Order类型,只分3等,受教育程度也是分类变量少于24等,所以也属于分类变量Order类型;左表是描述统计量的输出,偏度和峰度度值都说明这些变量都非正态分布,因此应该做非参相关。根据前页第2个表格看出,起始工资的确定主要考虑了雇员的受教育程度和职务等级。也考虑了以前工作经历长短。均为正相关。返回32精选课件ppt习题及解答习题及解答-4-4 根据前面对变量测度类型和正态性分析,当前工资与各因素的相关关系的分析只采用Spearman和Kendalls tau-b方法计算相关系数。(只有本企业工作经历时间偏度接近0)结论:当前工资与以前工作经历的时间长短无关;与受教育年限、起始工资和职务高度相关,与本单位工作时间长短有一定的相关关系:p0.05,但是相关系数仅为0.071。返回33精选课件ppt习题及解答习题及解答55所有变量均可以看作连续变量(Scale尺度变量),且近似正态分布。因此可以使用Pearson相关分析CORRELATIONS /VARIABLES=sell with price ad_rate sunlight /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.结论:平均价格、广告费用、平均日照时间三个变量与销售量均高度相关,不相关的概率均小于0.001,相关系数均大于0.9。可以进一步求以销售量为因变量,其他变量为自变量的回归方程了。返回34精选课件ppt注意使用辅助方法注意使用辅助方法GraphScatter返回返回返回35精选课件ppt
展开阅读全文