资源描述
精选2021版课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,精选2021版课件,*,第五章,相关分析与检验,1,精选2021版课件,相关分析之一,有关与无关,寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即,:,有关与无关。,在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。,2,精选2021版课件,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。,自变量的不同取值在因变量上无差异,两变量无关。,自变量的不同取值在因变量上有差异,两变量有关。,3,精选2021版课件,统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。,自变量,因变量,4,精选2021版课件,变量关系的统计类型,5,精选2021版课件,相关分析之二,关系强度,变量关系强度的含义,:,指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析:,A,)两变量是否相互独立。,B,)两变量是否有共变趋势。,C,)一变量的变化多大程度上能由另一变量的变化来解释。,6,精选2021版课件,变量关系强度测量的主要指标,7,精选2021版课件,相关分析之三,关系性质,直线相关与曲线相关,正相关与负相关,完全相关与完全不相关,8,精选2021版课件,一、列联相关(第四章已讲),(一)列联分析的基本原理,自变量发生变化,因变量取值是否也发生变化。,比较边缘百分比和条件百分比的差别。,9,精选2021版课件,卡方测量用来考察两变量是否独立,(,无关,),。,10,精选2021版课件,二、,相关分析,(,Correlate,),11,精选2021版课件,(一)简介,相关分析用于描述两个变量间联系的密切程度,其特点是变量不分主次,被置于同等的地位。检验的原假设为相关系数为,0,。可选择是单尾检验还是双尾检验。,在,Analyze,的下拉菜单,Correlate,命令项中有三个相关分析功能子命令,Bivariate,过程,(,二变量相关分析,),、,Partial,过程(偏相关分析)、,Distances,过程(距离分析)。,12,精选2021版课件,(二)相关分析类型,Bivariate,过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。,Partial,过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。,Distances,过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析,一般不单独使用,而作为因子分析等的预分析。,13,精选2021版课件,(三),Bivariate,相关分析,在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能得出错误结论。,Bivariate,相关分析的步骤:,输入数据后,依次单击,AnalyzeCorrelateBivariate,,打开,Bivariate Correlations,对话框,14,精选2021版课件,Bivariate Correlations,对话框,15,精选2021版课件,Pearson,复选框,选择进行积差相关分析,即最常用的相关分析,其计算连续变量或等间隔测度变量间的相关系数。计算该相关系数时,不仅要求两相关变量均为正态变量,而且样本数(,N,)一般不应少于,30,。,16,精选2021版课件,Kendalls tau-b,复选框,计算,Kendalls,等级相关系数,其计算定序变量间的线性相关关系。(有打结现象时),Spearman,复选框,计算,Spearman,相关系数。也是计算等级相关系数(定序与定序)。最常用的非参数相关分析(秩相关),适用于连续等级资料。(无打结现象)以上三种相关分析可以选择其中之一,也可以同时多选。如果参与分析的变量是连续变量,选择,Kendalls tau-b,或,Spearman,相关,则系统自动对连续变量的值先求秩,再计算其秩分数间的相关系数。,17,精选2021版课件,Flag significant correlations,用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时,P0.05,的系数值旁会标记一个*,,P0.01,的则标记两个*。,18,精选2021版课件,Options,对话框,对每一个变量输出均值、标准差和无缺省值的观测数。,对每一个变量输出交叉距阵和协方差距阵。,计算某个统计量时,在这一对变量中排除有缺省值的观测值。,对于任何分析,有缺省值的观测值都会被排除。,19,精选2021版课件,一般,如果,r,的绝对值大于,0.8,,则认为两变量之间具有较强的线性相关关系;如果,r,小于,0.3,,则认为两变量之间具有较弱的线性相关关系。当然,相关关系的程度与样本的容量大小也有很大的关系。,20,精选2021版课件,例,1:,为研究高等院校人文社会科学研究中立项课题数会受哪些因素影响,收集,1999,年,31,个省市自治区部分高校有关社科方面的数据,研究立项课题数(当年)与投入的具有高级职称的人年数(上年)、发表论文数(上年)之间是否具有较强的线性关系。,可以画散点图先进行判断。,21,精选2021版课件,Graphs-legacy-scatter,22,精选2021版课件,23,精选2021版课件,Analyze-correlate-Brivariate,24,精选2021版课件,25,精选2021版课件,例,2,:定序变量的,Spearman,分析实例,为了研究集团迫使个人顺从的效应,一些研究者用量表和为测量地位欲而设计的一种量表对,12,名大学生进行调查。欲知道对权威主义的评分之间相关的信息,数据如下。,学生,A,B,C,D,E,F,G,H,I,J,K,L,权威主义,2,6,5,1,10,9,8,3,4,12,7,11,地位欲,3,4,2,1,8,11,10,6,7,12,5,9,权威主义和地位欲评秩,26,精选2021版课件,1,)输入数据,依次单击,AnalyzeCorrelateBivariate,,打开,Bivariate Correlations,对话框,2,)选择,power,和,position,变量进入,Variables,框中。,3,)在,Correlation Coefficients,栏内选择,Spearman,。,4,)在,Test of Significance,栏选择,Two-tailed,。,5,)选择,Flag significant correlation,。,6,)单击,Options,按钮,选择,Mean and standard deviations,、,Cross-product deviations and covariances,、,Exclude cases pairise,选项。,7,)单击,OK,。,分析步骤:,27,精选2021版课件,从表中可看出,权威主义和地位欲的相关系数为,0.818,,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为,0.001,,否定假设,即权威主义与地位欲是相关的。,结果分析:,28,精选2021版课件,例,3,:定序变量的,Kendall,分析实例,仍用前例中的数据(数据文件:权威(,Spearman,相关),.sav,)。操作过程相同,只是在第,3,)步在,Correlation Coefficients,栏内选择,Kendalls,选项。结果如下:,权威主义和地位欲的相关系数为,0.667,,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为,0.003,,否定假设,即权威主义与地位欲是相关的。结果类似于,Spearman,分析。,29,精选2021版课件,(四),Partial,过程,相关分析计算两个变量间的相关系数,分析两个变量间线性关系的程度。但是往往因为第三个变量的作用,使相关系数不能真正反映两个变量间线性程度。例如,可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关程度,这就是偏相关分析。,30,精选2021版课件,例:立项课题数与发表论文数之间的净相关系数研究。,立项课题数与发表论文数之间有较强的正线性相关系数。但是,这种关系可能掺入了投入高级职称的人年数的影响。投入高职称的人年数与论文数,(,上年发表,),、立项课题数的简单相关系数分别为,0.953,和,0.944,,因此,可以把这个变量控制起来,研究立项课题数与发表论文数之间的净相关系数,进行偏相关分析。,31,精选2021版课件,32,精选2021版课件,【Variables,框,】,用于选入需要进行偏相关分析的变量,至少需要选入两个。可多选。,【Controlling for,框,】,用于选择需要在偏相关分析时进行控制的协变量,如果不选入,则进行的就是普通的相关分析。,【Display actual significince level,复选框,】,用于确定是否在结果中给出确切的,P,值,一般选中。,33,精选2021版课件,【Options,钮,】,Zero-order correlations,给出包括协变量在内所有变量的相关方阵。,34,精选2021版课件,35,精选2021版课件,说明,上年发表的论文数对当年的立项课题数的线性影响非常弱。前面的是属于虚假相关。,36,精选2021版课件,上机作业五,1,、以实验,3,中保存的“数据,8.sav”,为例,完成以下任务:,求出性别与工资等级的列联表,要求按性别输出百分比,求出相关系数,并进行卡方检验,理解所得结果。,2,、对居民储蓄数据中的多选项进行列联表分析。(要求先定义多选项变量集,用分类法做频数分析,再选择一个变量,做列联表分析),3,、试以,spss,自带的某一个数据文件为例(建议使用,1991U.S.General Social Survey,数据)进行分析,了解变量是否相关,发掘数据中变量间的规律性。,37,精选2021版课件,
展开阅读全文