1、外语教学科研中统计之SPSS篇/10/101第1页一、一、教育统计学概述:分类教育统计学概述:分类&1.1 分类分类&描述统计(descriptive statistics)描述数据全貌。包含数据分组,使用统计图表描述数据分组和分布,计算数据参数。&推断统计(inferential statistics)依据随机样本数据,从局部推断总体特征。包含参数检验和非参数检验、方差分析、回归分析、因子分析等。/10/102第2页一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2 1.2 基本概念基本概念&1.2.1 变量(variable)研究活动中关键原因。相对于常量而言(在研究过程中一
2、直保持不变特征或条件)。自变量(independent variable):教学方法 因变量(dependent variable):学生成绩 中间变量(interdependent variable):学习格调&如:研究者经常在课题研究对象(某一层次学习者)中安排不一样格调学习者。当某个自变量自变量(如教学方式)改变时,能够观察到因变量(学习成绩)对应改变及其规律。然后针对不一样学习格调研究对象(中间变量),再观察上述教学现象规律有何改变。/10/103第3页一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.2 总体(population)、个体(individual)、样本
3、(sample)研究对象全体为总体,组成总体基本单元为个体,按照一定规则从总体中抽取一部分个体为样本。&1.2.3 样本容量(sample size)无严格数量界限。普通把样本容量小于30(50、100)样本称为小样本,大于等于30(50、100)为大样本。/10/104第4页&1.2.4正态分布(normal distribution)正态分布是连续型随机变量分布中最主要也是最常见一个分布。比如,在人数较多群体中,学习成绩得到数值,其分布近似于正态分布即测验分数都是中等分数人数多,高分、低分人数少,假如以分数为横坐标,次数取得某一分数人数)为纵坐标,绘制成曲线图,就会发觉曲线呈中间大、两头小
4、、左右基本对称特点。一、一、教育统计学概述:基本概念教育统计学概述:基本概念起源:Bachman,L.F.(1990).Fundamental Considerations in Language Testing.Oxford:OUP,p.73/10/105第5页一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.5 SPSS中变量分类(1)定量/连续变量/等距变量(scale measure)一定单位实际测量值,能够加减计算,如学生考试成绩(65,76)(2)分类变量(包含定序变量 和称名变量)定序变量(ordinal measure):能够把研究对象从高到低或由大到小排序,如
5、受教育程度(1小学,2初中,3高中,4大学,5硕士);又如态度(1完全不适合,2通常不适合,3有时适合,4通常适合,5完全不适合)称名变量(Nominal measure):也叫无序变量,变量值没有大小之分,只有类别之分,如性别(1男,2女)/10/106第6页一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.6 参数检验和非参数检验参数检验(parametric test):总体服从正态分布、数值连续变量、样本数为单一样本或双样本。如T检验、两个或两个以上样本为方差分析等。非参数假设检验(non-parametric test):总体不一定服从正态分布、数值为定序变量(有时为
6、连续变量)、样本数为单一样本、双样本或多样本。如X2 检验、检验、Wilcoxon 检验、Mann-Whitney U检验&1.3 统计分析简明流程图/10/107第7页一、一、教育统计学概述:统计模型教育统计学概述:统计模型1.4 统计模型和数据类型模型类型模型类型因变量因变量自变量自变量Regression连续变量连续变量或者分类变量Logistic Regression分类变量连续变量或者分类变量ANOVA,GLM连续变量分类变量或者连续变量Log-Linear分类变量分类变量SEM不限不限起源:Wu,Eric(,9.6-7).Introduction to SEM.上海:上海财经大学.
7、/10/108第8页一、一、教育统计学概述:正态分布检验教育统计学概述:正态分布检验&正态分布检验正态分布检验 参数检验分析法前提是数据服从正态分布和方差齐性,除非对数据作转换,非正态分布数据宜采取非参数检验。/10/109第9页SPSS要求:当样本容量3n5000,结果以Shapino-Wilk(W检验)为准,当样本容量n5000时,结果以Kolmogorov-Smirnov(D检验为准)。结论:n5000,W值得概率PZ1)。评分公正欠佳!评分公正欠佳!/10/1021第21页二、实战操作2.2.3前提条件三 假如数据来自不一样群体受试者,而且比较是两组数据之间差异,那么:参数检验:两个独
8、立样本t 检验(independent samples t-test)非参数检验:Mann-Whitney U检验(连续变量)Crosstabs 检验(称名变量或定序变量)/10/1022第22页参数检验:两个独立样本t 检验(independent samples t-test)举例举例5 5:已知72名男女学生两个学期课外学习时间,问:男女学生在努力程度上是否存在显著性差异?二、实战操作:两个独立样本t检验/10/1023第23页注备:Equal varince assumed假设方差相等,本例方差齐性(sig.0.05)。结论:男女学生在努力程度上存在显著差异,女生努力程度显著高于男生。
9、/10/1024第24页二、实战操作:两个独立样本t检验举例举例6 6:某校对英语课进行教学改革试验,选取甲、乙两个平行班作试点。甲班30人,采取传统教师讲授教学方法,乙班33人,采取教师只讲授重点,主要由学生自学和学生相互讨论方法。一年后,用同一份试题对两个班学生进行测验。试问:这两种教学方法效果是否有显著性差异?结论:这两种方法效果没有显著差异!(注意两个平行班方差不注意两个平行班方差不等,应看等,应看Equal variance not assuemed一栏结果一栏结果)原因:可能是测试没有表达出教改优势!测试没有表达出教改优势!/10/1025第25页二、实战操作2.2.3前提条件四假
10、如比较是三组或多组数据之间差异,那么:来自多个独立样本数据:参数检验:单原因方差分析(One-way ANOVA)非参数检验:Kruskal-Wallis检验(连续变量,惯用);中位数(Median)检验(连续变量)来自多个相关样本数据:参数检验:单原因重复测量方差分析(repeated measures ANOVA)多原因方差分析(Factorial ANOVA)非参数检验:Friedman检验(连续变量);Kendall检验(定序变量);Cochrans Q检验(称名变量)/10/1026第26页二、实战操作:Kruskal-Wallis检验非参数检验:多个独立样本:中位数检验(Media
11、n test)(适合用于等距变量)Kruskal-Wallis检验(适合用于等距变量,更惯用)举例举例7:某校对大二学生进行了一次英语测验。现分别从经济系、政法系、汉字系、教育系以及理科各系中随机抽取部分学生测验成绩。问:不一样学科学生英语成绩是否存在显著性差异?/10/1027第27页非参数检验表明不一样学科之间学生英语成绩存在显著差异,但却没法绘制图表,也无法详细比较可采取参数检验单尾ANOVA分析,制作平均分线图。/10/1028第28页二、实战操作:多个样本Kendall检验举例举例8:5位教师对甲、乙、丙3篇作文所作评价以下,问5 位教师对评价3篇作文所作评价是否一致。注意输入方法!
12、注意输入方法!/10/1029第29页结论:5 位教师对3篇作文所作评价是不一致(p0.05)。标准制订和阅卷教师培训很主要!标准制订和阅卷教师培训很主要!/10/1030第30页二、实战操作:单原因方差分析基本思想:经过分析不一样起源变异对总变异贡献大小,从而确定可控原因对研究结果影响力大小。一项试验有多个影响原因,假如只有一个原因在发生改变,其它原因保持不变,称为单原因方差分析。(One-way ANOVA)举例举例9:为了寻求很好词汇习得方法,现选择3种不一样方法,分别对3个平行组学生进行一学期词汇习得训练,现取得学生期末成绩。问:3种不一样方法下学生词汇习得成绩是否有显著性差异?哪种更
13、理想一点?/10/1031第31页单原因事后多重比较假设方差相等时可选取LSD或S-N-K等方法;若方差不等可采取Dunnetts C方法。检验方差是否齐性;平均数做图/10/1032第32页方差齐性检验表明,三种教学方法所取得成绩方差相等。ANOVA显示,三种方法成绩差异显著,能够深入做多重比较LSD方法显示各教学方法成绩差异显著。/10/1033第33页结论:3种不一样方法下学生词汇习得成绩有显著性差异。相比而言,第三种教学方法更理想一点。/10/1034第34页二、实战操作:多原因方差分析假如有两个或两个以上原因发生改变,那么对应方差分析称为多原因方差分析。几个原因(变量)对试验结果影响
14、有两种情况:A 独立影响(between-subject design),如单原因方差分析和双原因方差分析。B 交互影响(within-subject design),如单原因重复测量方差分析和双原因混合方差分析。/10/1035第35页二、实战操作:双原因方差分析A 独立影响(between-subject design),单原因方差分析(例9)和双原因方差分析。双原因方差分析举例举例10:8名评委对5篇论文评分以下,试分析5篇论文水平差异是否显著?评委对评分标准所掌握分寸是否一致?(三个变量)论文得分多少主要受到两个原因影响:一个是论文本身水平,另一个是评委对评分标准所掌握分寸(但二者之间
15、无交互作用)。需要检验假设以下:5篇论文水平无显著性差异;评委对评分标准所掌握分寸无显著性差异。/10/1036第36页当因变量只有一个(本例为学生作文成绩),采取GLMUnivariate方法。固定原因指是在样本中它全部可能取值都出现了;而随机效应原因指是全部可能取值在样本中没有都出现,或不可能都出现,两种情况结论完全相同,不一样只是推论。张文彤(),SPSS统计分析高级教程,北京:高等教育出版社。/10/1037第37页本研究只分析独立影响,无交互效应,所以选Main Effects。左下方Sum of squares框用于选择方差分析模型类别,有1型到4型四种,假如搞不清他们之间区分,使
16、用默认3型即可;中下部有个Include intercept in model复选框,用于选择是否在模型中包含截距,不用改动,默认即可(但用处不大,能够不选!)。/10/1038第38页能够定义输出哪些指标预计均数、并做两两比较,还有其它一些输出,如惯用描述指标、方差齐性检验等。/10/1039第39页首先是所用方差分析模型检验,F值为28.277,p小于0.05,所以所用模型有统计学意义,能够用它来判断模型中系数有没有统计学意义。第二行是截距,它在我们分析中没有实际意义,忽略即可。第三行是变量论文,可见它也有统计学意义,不过我们关心也不是它;第四行是我们真正关心变量评委,非常遗憾,它p值为0
17、.061,还没有统计学意义。我们结论是:5篇论篇论文水平有显著差异;不过文水平有显著差异;不过评委对评分标准所掌握分寸评委对评分标准所掌握分寸一致一致(左边同质性检验也说明这一点)。注:Partial Eta Squared指主效应大小,值越大,效应越强。本研究表明学生作文成绩严重受到论文和评委共同影响。不过评委本身对作文成绩影响较弱。/10/1040第40页右图是八个评委作文打分分布左图是五篇作文整体分布/10/1041第41页/10/1042第42页二、实战操作:协方差分析协方差分析 将那些极难控制原因作为协变量,在排除协变量影响条件下,分析控制变量对观察变量影响,从而愈加准确地对控制变量
18、进行评价。不论是单原因方差分析还是多原因方差分析,它们都有一些人为能够控制控制变量。在实际问题中,有些随机原因是极难人为控制,但它们又会对结果产生显著影响。假如忽略这些原因影响,则有可能得到不正确结论。举例举例11:研究一个班3组同学(分别接收了3种不一样教学方法)在英语成绩上是否有显著差异。/10/1043第43页首先应进行预分析,了解数据是否符合协方差分析要求,最主要一点就是看入学成绩影响在三组中是否相同,这能够用入学成绩与组别是否存在交互作用来表示。该步骤用于判断入学成绩和组别间是否存在交互作用,如存在,则协方差分析条件不满足,分析不能继续。注意这里选择了Model I,从而拟合结果和模
19、型中变量引入次序相关,即侧重点在入学成绩对英语成绩影响大小和交互作用上。/10/1044第44页显示交互作用无统计学意义,而且P值非常大,所以交换组别和入学成绩多半交互作用也无统计学意义,所以能够不继续作预分析了,当然,严格步骤应该交换二者次序继续进行预分析。正式分析开始!/10/1045第45页/10/1046第46页各组英语成绩方差相等模型拟合很好。组间差异显著,各组入学成绩没显著差异,从而能够分析组别之间英语成绩差异。三组学生英语成绩/10/1047第47页1、3组和2、3组成绩差异显著;1、2组之间无显著差异。结论:三组学生成绩差异显著/10/1048第48页二、实战操作:积差相关法
20、相关分析 A:积差相关法 是指采取英国统计学家Pearson皮尔逊提出一个计算相关系数方法。举例举例12:某大学一年级12名学生参加了语音、听写和语法三项考试。问:三项考试之间两两相关系数。/10/1049第49页二、实战操作:等级相关法B:等级相关法 当我们研究变量是定序数据,或者变量不是正态分布时,若要考查它们相关程度就必须采取等级相关法。它是依据含有等级次序测量数据(定序数据)来研究变量间相互关系方法。主要有Spearman斯皮尔曼相关(适合用于非参数两列相关)和Kendall W肯德尔友好系数(较保守,不如Spearman)相关。举例举例13:其教研室要为学生准备一批英语课外阅读材料,
21、教研室首先让一批学生读八篇材料,要求他们依据自己感受,为这些材料难易程度评定等级(等级分为九级,一级为尤其简单,九级为极端困难)。然后让一批老师也为这八篇材料评定难易度等级。这么得到下面数据。学生:3 5 6 8 8 9 4 7老师:1 3 7 9 6 8 2 9现在,要检验这两组变量是否有显著相关。/10/1050第50页学生评定和老师评定一致性系数为0.667,显著相关,不过难度认可相同程度为40%,不甚理想。学生和教师认知程度和学习经验有差异,有时为了公正征求学生看法,但结果往往不甚理想。提议:学生意见学生意见仅供参考!仅供参考!/10/1051第51页二、实战操作:点二列相关法C:点二
22、列(point-biserial)相关法研究中,经常有只含两个类别变量(称名变量),比如性别、是否达标、正确是否等等。这类只有两种改变结果称名变量称为“二分”称名变量。将0、1 分别与两种改变结果相对应,则对“二分”称名变量一系列观察,得到一个“二分”数列。一个连续变量一系列观察值是一个点数列。假如一个点数列中点与一个“二分”数列中点存在一一对应关系,则称这两个数列为点二列。点二列相关法就是考查连续变量(其观察值为点数列)与“二分”称名变量之间相关程度。举例举例14:某小学五年级男女学生I5人英语成绩以下表,问英语成绩与性别是否相关?/10/1052第52页二、实战操作:偏相关D:偏相关(pa
23、rtial)在教育领域中两种现象之间关系,往往受到各种原因影响,是这些原因共同作用结果,因而简单相关系数可能因为其它原因影响而反应仅仅是表面非本质联络,不能真正反应两个变量之间相关程度。为了正确地显示出两个变量之间本质联络,必须剔除其它变量影响。我们把两个变量在剔除了其它变量影响之后相关系数叫做偏相关系数。举例15:傣族母语是傣语,儿童小学开始学习汉语,上中课时又学习英语。最近研究人员对30名受过高等教育傣族成年人进行了傣语、汉语及英语三种语言水平测试。问三种语言水平考试相关关系,尤其是傣语与英语关系。/10/1053第53页三种语言之间相关显示,在没有控制汉语对英语和傣语之间影响时,傣语和英
24、语成绩显著相关,r=0.560这时英语和傣语相关为0.657/10/1054第54页参考文件参考文件Bachman,L.F.(1990).Fundamental Considerations in Language Testing.Oxford:OUP,p.73史耕山,(年6月13日),外语教学科研中统计与SPSS实现讲义和数据。河北工业大学外国语学院/中国外语教育研究中心.http:/202.204.128.82/forum/(205月31日)。张文彤,2004,SPSS统计分析高级教程。北京:高等教育出版社。/10/1055第55页愿我们共同进步,攀登学术上the Himalayas!谢谢大家!/10/1056第56页