收藏 分销(赏)

第2章-常用统计分析功能.ppt

上传人:精*** 文档编号:12525066 上传时间:2025-10-24 格式:PPT 页数:49 大小:1.46MB 下载积分:8 金币
下载 相关 举报
第2章-常用统计分析功能.ppt_第1页
第1页 / 共49页
第2章-常用统计分析功能.ppt_第2页
第2页 / 共49页


点击查看更多>>
资源描述
*,SPSS,2.1 基本统计分析,频数分布表,描述统计分析,探索分析,列联表,频数分布表,利用频数分布表可以方便地对数据按组进行归类整理,形成各变量的不同水平,(,分组,),的频数分布表及图形,以便对各变量的数据特征和观测量的分布状况有一个概括的认识,;,单变量频数分布分析,可通过,Frequencies,频数分布对话框,(,Analyze,Descriptive Statistics Frequencies,),来具体实现,。,例2.1a,已知5种软饮料购买频数的原始记录,分析各种饮料的频数分布情况,(数据集1),。,可口可乐,新 骑 士,可口可乐雪 碧,雪 碧,杏 仁 露,可口可乐,可口可乐,醒 目,可口可乐,新 骑 士,可口可乐,可口可乐,雪 碧,可口可乐,醒 目,可口可乐,雪 碧,杏 仁 露,杏 仁 露,雪 碧,雪 碧,可口可乐,可口可乐,雪 碧,新 骑 士,雪 碧,可口可乐,雪 碧,醒 目,雪 碧,雪 碧,杏 仁 露,可口可乐,可口可乐,杏 仁 露,可口可乐,杏 仁 露,新 骑 士,杏 仁 露,可口可乐,新 骑 士,雪 碧,可口可乐,杏 仁 露,可口可乐,醒 目,可口可乐,醒 目,雪 碧,不输出图形,条形图,饼形图,直方图,选择频数表排列顺序,按变量值升序排列,按变量值降序排列,按变量值发生频数升序排列,按变量值发生频数降序排列,选择多变量输出表格设置,控制频数表输出的分类数,Frequencies,对话框,输出结果:,本例均选系统默认项,描述统计分析,描述统计分析过程,是通过计算均值、算术和、标准差、极值、方差、均值、标准误等统计量来描述样本数据的集中趋势、离散趋势及分布特征;,描述统计分析过程,可通过,Descriptives,对话框,(,Analyze,Descriptive Statistics,Descriptives,),来具体实现,。,序号,性别,年龄,身高,体重,序号,性别,年龄,身高,体重,12345678910,11,12,13,14,15,男,男,男,男,男,女,女,女,女,女,男,男,男,男,男,13,13,13,13,13,13,13,13,13,13,13,14,14,14,14,156.0,155.0,144.6,161.5,161.3,158.0,161.0,162.0,164.3,144.0,157.9,176.1,168.0,164.5,153.0,47.5,37.8,38.6,41.6,43.3,47.3,47.1,47.0,33.8,33.8,49.2,54.5,50.0,44.0,58.0,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,女,女,女,女,女,男,男,男,男,男,女,女,女,女,女,14,14,14,14,14,15,15,15,15,15,15,15,15,15,15,164.7,160.5,147.0,153.2,157.9,166.0,169.0,170.0,165.1,172.0,159.4,161.3,158.0,158.6,169.0,44.1,53.0,36.4,30.1,40.4,57.0,58.5,51.0,58.0,55.0,44.7,45.4,44.3,42.8,51.1,例2.1b,已知三十名学生的身高与体重数据,要求对其进行简单的描述统计分析,(数据集2),。,Descriptives,对话框,指定统计量与输出结果显示的顺序,计算并保存所选变量的标准化值,公式为,Descriptives,对话框,均值,合计,偏度,峰度,标准差,方差,全距,均值标准误,离散趋势,分布,输出顺序,按均值升序显示统计量,按均值降序显示统计量,按变量名字母顺序显示统计量,按数据集中变量的排列顺序显示统计量,输出结果:,标准化值,探索分析,探索分析是指对测得的数据进行初步考察与核实,目的是检查数据中是否存在奇异值、影响点或错误数据,判别数据分布特征,以及进行假设检验等;,探索分析过程,可通过,Explore,对话框,实现,(,Analyze,Descriptive Statistics,Explore,),,,该过程要求参与分析的变量是等间隔测度的数值型变量,因子变量,(,分组变量,),可以是数值型或是字符型。,例2.1c,对,例2.1b,中三十名学生的身高数据按性别进行简单的探索分析,(数据集2),。,选择分析变量,指定分组变量,选择标识变量,选择输出项,选择描述统计量,设置输出图形,指定缺失值的处理方式,Explore,对话框,输出基本描述统计量,指定均值的置信区间,输出最大似然比的稳健估计,输出5个最大与最小值,输出5、10、25、50、75、90以及95的百分位数,剔除带有缺失值的观测量,同时剔除缺失值及与其有成对关系的观测量,将缺失值单列一组显示,Explore,对话框,盒形图,描述图形,茎叶图,直方图,输出正态概率与离散概率图,输出回归直线斜率及方差齐性的Levenes检验,转换幂值估计,对原始数据进行变换,输出结果:,选项均为系统默认,输出结果:,盒形图,茎叶图,奇异值,极值,列联表,列联表是指交叉分组的多维频数分析表,用来反映多个变量不同取值的数据分布情况、变量间的相互影响和关系等;,列联表分析过程,可通过,Crosstabs,对话框,实现,(,Analyze,Descriptive Statistics,Crosstabs,),。,公司1,公司2,公司3,公司4,合计,赞成,68,75,57,79,279,反对,32,45,33,31,141,合计,100,120,90,110,420,例2.1d,已知对集团公司某项改革方案意见的调查结果,试分析各子公司对该项改革方案的态度是否一致.,定义变量,(,形成数据集3,),公司,company,公司1 1,公司2 2,公司3 3,公司4 4,68,32,75,45,57,33,79,31,态度,attitude,赞成 1,反对 2,赞成 1,反对 2,赞成 1,反对 2,赞成 1,反对 2,观察频数 freq,指定,freq,为加权变量,Crosstabs,对话框,指定行变量,指定列变量,指定分布表的层变量,显示分类条形图,不输出多维交叉表,Crosstabs,对话框,本例中选择chi-square,卡方检验,分类变量相关指标,相关,列联系数,和V系数,值,不确定系数,定序变量的相关指标,适用于一个为分类变量、另一个为等间隔变量的检验,Crosstabs,对话框,本例中选择频数及频率输出项,观察频数,期望频数,频率,行频率,列频率,总和频率,残差,非标准化,标准化,调整的标准化残差,频数,升序,行顺序,降序,输出结果:,输出结果:,第二章 常用统计分析功能的实现,2.1 基本统计分析,2.2 均值比较与检验,2.2 均值比较与检验,均值比较是指利用参数检验的统计推断方法,来检验不同样本均值的差异是否具有统计意义,是否能说明总体存在差异性;,SPSS,提供的均值比较分析功能,(,Analyze Compare Means,),具体包括:,Means,过程,、,单一样本,t,检验,、,独立样本,t,检验,、,配对样本,t,检验,及,单因素方差分析,等。,Means,过程,Means,过程的基本功能是,分组计算,,比较指定变量的描述统计量,包括均值、标准差、总和、方差等一系列单变量描述统计量,还可以给出方差分析表和线性检验结果。,例2.2a,已知三十名学生的身高与体重数据,要求分析按性别和年龄分组的学生身高是否存在显著性差异,(数据集2),。,Means,对话框,因变量列表,自变量列表,指定变量的层次安排,Means,对话框,可供选择的统计量,用于描述各单元格特征的统计量,对第一层每个控制变量的分析,方差分析表及 和 统计量,线性检验,输出结果:,选项均为系统默认,单一样本t检验,单一样本,t,检验,过程是检验某个变量的总体均值与指定的检验值之间是否存在显著差异,其前提是样本来自的总体应服从正态分布;,单一样本,t,检验,过程可通过,One-Sample T Test,对话框实现。,例2.2b,数据集2,是对某市1215岁青少年身高的抽样调查资料,试在5的显著性水平下,推断该市该年龄段的青少年是否达到了160厘米的标准身高。,One-sample T Test,对话框,检验值,缺失值处理方法,剔除分析变量含缺失值的观测,剔除所有含缺失值的观测,输出结果:,P值=0.6530.05,应接受原假设,即可以认为该市青少年身高达到了160cm的标准。,在SPSS中,值被定义为所对应 值分布一侧面积的双倍。因此双侧检验时,可直接比较 值与 值的大小,若为单侧检验,则需比较 值与 值的大小,独立样本t检验,独立样本,t,检验,过程用于检验两独立总体的均值是否具有显著差异,其前提是两样本彼此独立,且其来自的总体均服从正态分布;,独立样本,t,检验,可通过,Independent-Samples T Test,对话框实现。,例2.2c,对于,数据集2,,在10的显著性水平下,比较该市1215岁青少年中,男、女青少年的身高是否有显著性差异。,Independent-Samples,T Test,对话框,分组变量,输出结果:,P值=0.1440.10,应接受原假设,即可以认为该市男女青少年的身高不存在显著差异。,配对样本t检验,用于检验两配对总体的均值是否具有显著性差异,其前提是两样本具有配对关系,且其来自的总体均服从正态分布;,实质是检验每对测量值差值变量的均值与零之间差异的显著性,若差异不显著,则说明配对变量均值之间的差异不显著;,可通过,Paired-Samples T Test,对话框实现。,例2.2d,已知7种商品在两种不同促销形式下的销售额数据如下,试分析两种不同促销形式对商品销售额的影响是否具有显著性差异。,(数据集4),商品,促销形式A,促销形式B,1,2,3,4,5,6,7,65,73,73,30,73,56,73,34,36,37,26,43,37,60,配对样本t检验,Paired-Samples,T Test,对话框,指定配对变量,输出结果:,P值=0.0020.05,应拒绝原假设,表明两种促销形式对商品销售额的影响具有显著差异。,单因素方差分析,用于检验由单一因素影响的一个,(,或几个相互独立的,),因变量按因素各水平分组的均值之间是否具有显著性差异,也可用于进行两两组间均值的比较;,前提是因变量服从正态分布;,可通过,One-Way ANOVA,对话框实现。,例2.2e,已知四种不同颜色的饮料在五个超市的销售量资料如下,试分析不同颜色饮料的销售量之间是否具有显著差异。,(数据集5),单因素方差分析,超市,黄色,无色,粉色,绿色,1,2,3,4,5,27.9,25.1,28.5,24.2,26.5,26.5,28.7,25.1,29.1,27.2,31.2,28.3,30.8,27.9,29.6,30.8,29.6,32.4,31.7,32.8,变量sale,定义为,One-Way ANOVA,对话框,因变量列表,影响因素变量,多重比较选择项,对照比较选择项,指定输出统计量及缺失值处理方法,One-Way ANOVA,对话框,多重比较选择项对话框,对照比较选择项,指定输出统计量及缺失值处理方法,多项式选项,对照比较选项,输出统计量,缺失值处理方法,One-Way ANOVA,对话框,输出结果:,(选项均为系统默认),由于F=10.544,P值=0.0000.05,故应拒绝原假设,即可认为不同颜色饮料的销售量之间具有显著差异。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服