资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第5章-SPSS基本统计分析,1.,描述集中趋势的统计量,(1),均值,(mean):,a.,表示某变量所有变量值集中趋势或平均水平的统计量。,b.,适用于定距数据。,c.,特点:利用了全部数据,易受极端值的影响。,(2),众数,(mode)(,在,frequency,菜单中计算,),a.,一组数据中出现频数最多的变量值。,b.,适用于各类数据,主要用于定类数据。,c.,特点:众数可能不唯一,不受极端值的影响。,2.,描述离散程度的统计量,(1),标准差,(standard deviation-Std Dev),(2),方差,(variance),(3),极差,(range):,最大值,(minimum)-,最小值,(minimum),极差很小表明所有数据几乎集中在一起,应用于相同样本容量的两组数据离散程度比较,3.,描述分布特征的统计量,(1,)偏度,(skewness):,描述对称程度的统计量,偏度为,0,表示对称,;,大于,0,表示正偏差大,(,右偏,),频数最的,值比均值小,极值大于均值,;,小于,0,表示负偏差大,(,左偏,).,3.,描述分布特征的统计量,(2),峰度,(kurtosis):,描述某变量所有变量值分布形态陡缓程度的统计量。,峰度为,0,表示与正态分布峭度相同。,大于,0,表示比正态分布陡,尖峰。,小于,0,表示比正态分布缓;平峰。,二、计算基本描述统计量 的操作步骤,1.,打开菜单,Analyze-Descriptives Statistics-Descriptives.,,出现窗口;,2.,选择参加计算的数值型变量到,Variables,框,三、计算基本描述统计量的其 他菜单选项,1.Save standardized values as variables,标准化处理变量值,2.Option,选项,四、分组计算描述统计量,1.,菜单选项:,Data,Split File,;,2.,选择拆分变量到,Groups Based on,框中;,3.,选择输出方式:,Compare groups,/Organize output by groups,;,4.,点选,Sort the file by grouping variables/File is already sorted,。,四、分组计算描述统计量,5.2,变量的频数分析,一、变量频数的描述方法,利用变量的频数分布分析可以方便的对数据按组进行归类整理,形成各观测量的不同水平(分组)的频数分布情况表和图形,以便对数值的数量特征和内部结构状况有一个概括的认识。,5.3,变量的频数分析,1.,频数、百分比,有效百分比:各频数占总有效样本数之比,累计百分比:各百分比逐级累加结果。,2.,分位数,4,分位数(,Quartiles,),3.,统计图形,条形图、饼图、直方图,二,、频数统计的基本步骤,例题 现对,1991,年美国社会调查情况数据进行统计处理,数据文件为,SPSS,自带,1991U.S.General Society Survy.sav,。分析不同年龄(,age,)和最高受教育年限(,educ,)各水平的频数分布情况。,操作步骤如下:,(1),单击,Analyze Descriptive statistics,Frequencies,(,2,)在左侧源变量框中选择一个或多个变量送入,Variables,(,s,)中;,(3),根据需要选择相应的选择项:,Display frequency tables,选择此项将显示频数分布表。如果你只想画图可以不选择此项。,Statistics,选择此项,打开统计量选择对话框如图所示。在对话框中选择输出统计量。,可选择的统计量分四组,每组中的统计量可以并列选择。,Percentile Values,栏,百分位数选择项。,n,Quartiles,,输出四分位数。,n,Cut points for equal groups,,输出等分点的百分位数(,2-100,之间)。,Dispersion,离差栏:,n,Std.Deviation,标准差,n,Variance,方差,n,Range,全距,n,Minmum,n,Mmaxmun,n,S.E.mean,均数的标准误,General Tendency,中心趋势栏,n,Mean,均数,n,Median,中位数,n,Mode,众数,n,Sum,算术和,Distribution,分布参数栏,n,Skewness,正态分布的偏度,同时显示偏度的标准误。,n,Kurtosis,正态分布的峰度。,如果,Skewness,与,Kurtosis,的值为,0,,那么表示观测量数据的分布非常接近正态分布;如果,Skewnes,的值为正数,表示数据的分布为正偏态分布,如果,Kurtosis,的数值为正,那么表明数据的分布要比正态分布具有更尖锐的峰型。,Charts,统计图形,Format,设置频数表输出格式。,Multiple variables,多变量栏,Compare variables,,将所有变量结果在一个图形,z,中输出,Organize output by variables,,为每一个变量单独输出一个图形。,(,4,)结果分析,观察量数,合法值,百分位数,5.4,交叉分组下的频数分析,一、交叉分组下的频数分析,1.,主要任务:,(,1,)编制交叉列联表,(,2,)变量间进行相关性分析,一、交叉分组下的频数分析,1.,交叉列联表,两个或两个以上的变量交叉分组后形成的列联表。,行变量,(Row),:表,1,、,2,中 职称,列变量,(Column),:表,1,、,2,中文化程度,层变量,(Layer),:表,2,中性别,一、交叉分组下的频数分析,二维交叉列联表(表,1,),一、交叉分组下的频数分析,三维交叉列联表(表,2,),一、交叉分组下的频数分析,交叉列联表单元格中的数据项:,(,1,)观察频数,(Observed Counts),(,2,)期望频数,(Expected Counts),RT,为行频数合计,CT,为列频数合计,(,3,)行百分比,(Row Percentage),(,4,)列百分比,(Column Percentage),一、交叉分组下的频数分析,(,5,)总百分比,(Total Percentage),(,6,)剩余,(Unstandardized Residuals),观测频数,-,期望频数,(,7,)标准化剩余,(Standardized Residuals),一、交叉分组下的频数分析,2.,行、列变量相关性分析,卡方统计量检验行列变量之间是否相关。,服从,(,行数,1)(,列数,1),的卡方分布,交叉列联表卡方检验的一些说明,:,若交叉列联表中行、列变量应均为定类变量,最好是等距变量,若交叉列联表中20%以上单元格中的期望频数小于5,则一般不宜采用卡方检验。此时卡方检验统计量往往偏大,易于拒绝原假设。可以采用似然卡方检验等方法进行修正。,二、交叉分组下的频数分析的操作步骤,1.,菜单:,Analyze-Descriptive Statistics-,Crosstabs,弹出,对话框,;,2.,选择行变量到,Row,框中,选择列变量到,Column,框中;,3.,若有其他变量参与分析,作为层控制变量选到,Layer,框中;,4.,选择,Display clustered bar charts,选项,指定绘制频数分布柱形图;,Suppress tables,表示部输出列联表;,二、交叉分组下的频数分析的操作步骤,5.,单击,Cells,指定列联表单元格中的输出内容;,6.,单击,Format,指定列联表各单元的输出排列顺序;,7.,单击,Statistics,指定用哪种方法分析行变量和列变量的关系。,5.5,多选项分析,一、什么是多选项问题,二、分析多选项问题的一般方案,三、多选项分析处理多选项问题,一、什么是多选项问题,例,:,某地高三学生志愿调查中,为分析学生填报志愿的倾向性,设计了以下问题。,按照你的志愿,按顺序依次选择打算报考的三所大学,:,(1),北京大学,(2),清华大学,(3),中国人民大学,(4),北京理工大学,(5),北京师范大学,(6),北京外国语大学,一、什么是多选项问题,1.,多选项问题:一道问题有两个或两个以上答案同时出现的问题。,2.,答案为顺序水准或名义水准,并且允许选择的答案为多个,有两个或两个以上被同时选中。,二、分析多选项问题的一般方案,1.,多选项问题的分解,基本思路:将多选项问题分解成几个子问题,设置几个,SPSS,变量,分别存放描述这些问题的几个可能被选择的答案。,2.,分解方法,(1),多选项二分法,:Multiple Dichotomies Method,(2),多选项分类法,:Mutilple Category Method,2.1多选项二分法,将多选项问题中提供的每个可能的答案设为一个,SPSS,变量,每个变量只有,0,或,1,两个取值,分别表示选择该答案和不选择该答案。,SPSS,变量名,变量名标签,变量值,T1,报考北京大学,0/1,T2,报考清华大学,0/1,T3,报考中国人民大学,0/1,T4,报考北京理工大学,0/1,T5,报考北京师范大学,0/1,T6,报考北京外国语大学,0/1,2.2多选项分类法,1.,估计最多可能同时出现的答案个数;,2.,为每个答案设置一个,SPSS,变量,变量取值为多选问题中的可选答案。,SPSS,变量名,变量名标签,变量取值,V1,志愿一,1/2/3/4/5/6,V2,志愿二,1/2/3/4/5/6,V3,志愿三,1/2/3/4/5/6,二、分析多选项问题的一般方案,3.,对多选项问题做普通频数分析的困难,与多选项问题的分解方法有较大关系。,如 对,T1,至,T6,作频数分析,只能得到各个学校的考生报考情况;,对,V1,至,V3,作频数分析,只能得到志愿,1,至,3,中各学校的报考情况。,三、多选项分析处理多选项问题,1.,基本实现思路:,(1),按多选项二分法或多选项分类法将多选项问题分解成若干问题,并设置若干,SPSS,变量;,(2),采用多选项频数分析或多选项交叉分组下的频数分析。,三、多选项分析处理多选项问题,2.,多选项分析的基本步骤,(1),定义多选项分析的多选项变量集,(2),进行多选项的频数分析,(3),进行多选项的交叉列联表分析,定义多选项分析的多选项变量集,(1),菜单,Analyze-Multiple Response-Define Sets,弹出对话框。,定义多选项分析的多选项变量集,(2),从数值型变量中将进入多选项变量集的变量选择到,Variables in Set,框中。,(3),在,Variables Are Coded As,框中指定变量按照哪种方法分解。,(4)Name,为多选项变量集命名。,(5),单击,Add,按钮将定义好的多选项变量集加到,Mult Response Sets,。,进行多选项的频数分析,(1),选择菜单,Analyze-Multiple Response,-Frequencies,弹出对话框。,(2),从,Mult Response Sets,把待分析的变量集选择到,Table For,框中。,(3),指定是否处理缺失数据,进行多选项的交叉列联表分析,(1),选择菜单,Analyze-Multiple Response,-Crosstabs,弹出对话框。,(2),选择交叉列联表的行变量并定义取值范围。,(3),选择交叉列联表的列变量并定义取值范围。,(4),选择交叉列联表的分层变量并定义取值范围。,(5),单击,Option,按钮,选择列联表的输出内容和计算方法。,5.6,基本统计分析的报表制作,一、,用户统计报表概述,二、,制作用户基本报表,三、,制作普通报表,一、用户统计报表概述,1.,用户统计报表的组成,职工工资情况报表,主标题,男职工,副标题 列标题,注:截止到本年底,行标题,数据单元,文化程度,本科,专科,高中,初中,职称,高级工程师,工程师,技术员,无技术职称,一、用户统计报表概述,2.,用户统计报表的种类,基本报表(,Basic Tables,),普通报表(,General Tables,),频数报表(,Tables of Frequencies,),多选项报表(,Multiple response Tables,),二、制作用户基本报表,1.SPSS,基本报表样式,(1)Summary:,指代汇总变量,(2)Down:,指代行控制变量,(3)Across:,指代列控制变量,(4)Separate:,指代表控制变量,二、制作用户基本报表,2.,基本报表的功能,3.,基本操作步骤,(1),单击菜单选项:,Analyze-Custom tables-Basic tables.,(2),指定汇总变量到,Summaries,框中。,(3),指定行控制变量到,Subgroup,框中的,Down,框中。,(4),指定列控制变量到,Subgroup,框中的,Across,框中。,二、制作用户基本报表,(4),指定表控制变量到,Subgroup,框中的,Separate,框中。,二、制作用户基本报表,4.,制作基本报表的其他选项,三、制作普通报表,基本报表:只能对汇总变量作同一种或几种统计计算;,普通报表:可以对不同的汇总变量分别计算不同的统计量。,1.SPSS,基本报表样式,(1)Rows:,指代行控制变量,(2)Columns:,指代列控制变量,(3)Layers:,指代表控制变量,注:无专门的汇总变量。可指定行、列上的某些变量为汇总变量。,三、制作普通报表,2.,普通报表的功能,3.,基本操作步骤,(1),单击菜单选项:,Analyze-Custom tables-General tables.,(2),指定行控制变量到,Rows,框中。若行维中有用户希望汇总的变量,选中后点击,Selected Variables,框中的,Is Summarized,选项。,(3),指定列控制变量到,Columns,框中。若列维中有用户希望汇总的变量,方法同,(2),。,三、制作普通报表,三、制作普通报表,4.,其他选项,(1),指定变量层次关系,:Nest,和,Unnest,选项。,(2)Omit Label,选项。,(3)Insert Label,选项。,(4)Statistics Labels Appear,框中的选项。,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,
展开阅读全文