收藏 分销(赏)

第三章spss描述性统计PPT课件.ppt

上传人:胜**** 文档编号:839654 上传时间:2024-03-28 格式:PPT 页数:61 大小:1.02MB
下载 相关 举报
第三章spss描述性统计PPT课件.ppt_第1页
第1页 / 共61页
第三章spss描述性统计PPT课件.ppt_第2页
第2页 / 共61页
第三章spss描述性统计PPT课件.ppt_第3页
第3页 / 共61页
第三章spss描述性统计PPT课件.ppt_第4页
第4页 / 共61页
第三章spss描述性统计PPT课件.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、 旅游与管理工程学院旅游与管理工程学院第三章描述性统计分析 旅游与管理工程学院旅游与管理工程学院第一节描述性统计理论一、描述性统计(DescriptiveStatistics)1、概念:描述性统计就是组织、描述和总结所收集到的一组数据的特征。需要注意的是,它所描述的是这组数据本身的分布特征,并不能深入了解统计数据的内部规律。SPSS的许多模块都可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在描述统计菜单中,他们就是计算各种统计量或绘制统计图来实现描述功能。旅游与管理工程学院旅游与管理工程学院 所谓描述性统计分析,就是对一组数据的各种特征所谓描述性统计分析,就是对一组数据的各种特征进

2、行分析,以便于描述测量样本的各种特征及其所代表进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。等等。这些分析是复杂统计分析的基础。平均数、标准误平均数、标准误中位数、众数、全距中位数、众数、全距标准差、方差标准差、方差四分位、十分位、百分位数四分位、十分位、百分位数频数分布、峰度、偏度频数分布、峰度、偏度标准分数及其线性转换标准分数及其线性转换探索分析探索分析交叉列联表

3、分析交叉列联表分析2、描述性统计分析:旅游与管理工程学院旅游与管理工程学院 二、描述性统计分析指标集中趋势的量度(measuresofcentraltendency):共性离散程度的量度(measuresofvariability):异质性分布形态的量度 旅游与管理工程学院旅游与管理工程学院1、集中趋势的量度集中趋势(平均数值)是对整个群体的数值的最好的代表。有三种形式的平均数值:平均值(mean)、中位数(median)、众数(mode)。其中,最常用的是平均值。旅游与管理工程学院旅游与管理工程学院 算术平均数算术平均数 算术平均数等于所有样本数据的总和除以数据个数。算术平均值是描述样本数据

4、中心趋势最常用的统计量。在分组条件下,其公式为:旅游与管理工程学院旅游与管理工程学院 2、离散程度离散程度(异质性)反映的是数值之间是如何的不同。同样均值不同差异程度。如:7,6,3,3,1 3,4,4,5,4 4,4,4,4,4 有五个离散程度的量度指标:全距(range)、平均差(Average Difference)标准差(standard deviation)、方差(variance)和标准误。其中,最常用的是标准差。旅游与管理工程学院旅游与管理工程学院 标准差(方差)标准差(方差)标准差()与方差(2)是反映数据离散趋势最常用的统计量。在分组条件下,标准差的公式为:标准差是方差方差的

5、算术平方根。旅游与管理工程学院旅游与管理工程学院 严格地讲,在方差和标准差的计算中,分母应取n-1,因为数据变异的自由度是n-1。但在大样本情况下,使用n和n-1差别不大。自由度df是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的资料的个数,称为该统计量的自由度。统计学上的自由度包括两方面的内容:首先,在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。旅游与管理工程学院旅游与管理工程学院 其次,在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其

6、中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。例如,假如n=1个观测值,可以计算均值,但无法计算标准差,只有当n超过1时,才能计算标准差,所以,对于标准差,实际上只有(n-1)个信息。旅游与管理工程学院旅游与管理工程学院 标准误,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标

7、准误是统计推断可靠性的指标。此外,还需要特别指出的是,标准误还可以指样本标准差、方差等统计量的标准差,不仅仅只是样本均数的标准差。旅游与管理工程学院旅游与管理工程学院3、分布形态的量度 频数频数 (Frequency)Frequency):就是一个变量的各个就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数可以统计出各分数值的人数。峰度(峰度(Kurtosis):Kurtosis):是描述某变量所有取值是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正

8、态分布进行比较的结果。如果峰度的度量是与正态分布进行比较的结果。如果峰度等于度等于 0 0,其数据分布的陡缓程度与正态分布相,其数据分布的陡缓程度与正态分布相同同 ;峰度大于;峰度大于 0 0,其数据分布比正态分布更陡峭;,其数据分布比正态分布更陡峭;峰度小于峰度小于0 0,其数据分布比正态分布更平坦,其数据分布比正态分布更平坦。旅游与管理工程学院旅游与管理工程学院 偏度(偏度(Skewness)Skewness)是描述数据分布对称性的统计是描述数据分布对称性的统计量量 ,而且也是与正态分布的对称性相比较而得到的。如果,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于分布的偏度等于

9、0 0,则其数据分布的对称性与正态分布相同,则其数据分布的对称性与正态分布相同 ;如果偏度大于;如果偏度大于0 0,则其分布为正偏或右偏,即在峰的右边,则其分布为正偏或右偏,即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度小于小于 0 0,则为负偏或左偏,即在峰的左边有大的偏差值,使,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。左边出现一个拖得较远的尾巴。旅游与管理工程学院旅游与管理工程学院三、正态分布理论三、正态分布理论1、.概念 正态分布又称高斯(Gauss)分布,是最常见、最重要的一种连续型分

10、布,表现为中间高,两端低,左右完全对称的图形。旅游与管理工程学院旅游与管理工程学院2、图形、图形正态分布密度函数正态分布密度函数 其中参数其中参数 为均值,为均值,为标准差,由此决定的正态分布记作为标准差,由此决定的正态分布记作 。旅游与管理工程学院旅游与管理工程学院正态分布概率密度曲线示意图正态分布概率密度曲线示意图 旅游与管理工程学院旅游与管理工程学院不同均值正态分布示意图不同均值正态分布示意图 旅游与管理工程学院旅游与管理工程学院不同标准差的正态分布示意图不同标准差的正态分布示意图 旅游与管理工程学院旅游与管理工程学院正态曲线下面积的分布规律:正态曲线下面积的分布规律:通过对密度函数积分

11、我们可以知道正态曲线下,横轴所夹的面积为1。理论上:范围内曲线下的面积占总面积的68.27%;范围内曲线下的面积占总面积的90%;范围内曲线下的面积占总面积的95%;范围内曲线下的面积占总面积的99%。旅游与管理工程学院旅游与管理工程学院3、标准正态分布及其应用标准正态分布及其应用标准正态分布:均值为0,标准差为1的正态分布 只要变量 ,就可经下式转换为 、的标准正态分布,记作 。此变换也称为标准化变换,或称 变换。旅游与管理工程学院旅游与管理工程学院四、用图形显示数据四、用图形显示数据1、常用图形柱状图 多边图线性图 旅游与管理工程学院旅游与管理工程学院柱状图 旅游与管理工程学院旅游与管理工

12、程学院多边图 旅游与管理工程学院旅游与管理工程学院线性图 旅游与管理工程学院旅游与管理工程学院2、图型显示的频数分布特征频数分布的特征可以有4个指标来显示:均值标准差偏度(skewness)峰度(kurtosis)旅游与管理工程学院旅游与管理工程学院均值均值低收入低收入A群体的平均收入B群体的平均收入C群体的平均收入高收入高收入频数 旅游与管理工程学院旅游与管理工程学院异质性(标准差)异质性(标准差)频频数数低收入低收入均值高收入高收入群体A的收入分布群体B的收入分布群体C的收入分布 旅游与管理工程学院旅游与管理工程学院偏度偏度频频数数低收入低收入高收入高收入群体A收入分布正向倾斜群体B收入分

13、布无倾斜群体C收入分布负向倾斜 旅游与管理工程学院旅游与管理工程学院峰度峰度低收入高收入频数群体A的收入分布群体B的收入分布群体C的收入分布 旅游与管理工程学院旅游与管理工程学院第二节单变量描述性分析一、频数分析过程二、数据描述分析过程三、数据探索过程 旅游与管理工程学院旅游与管理工程学院2024/3/18周一31 旅游与管理工程学院旅游与管理工程学院一、频数分析过程频数分布表是描述性统计中最常用的方法之一,SPSS频数分析过程就是专门为产生频数表而设计的,它不仅可以产生单变量详细的频数表,显示文件中指定变量特定值发生的频数,还可以获得某些描述统计量或按要求给出某百分位点的数值以及常用的条图、

14、圆图等统计图。分析实例:见统计学成绩.sav 旅游与管理工程学院旅游与管理工程学院 旅游与管理工程学院旅游与管理工程学院单击统计量按钮,在弹出的对话框中勾选均值和标准差 旅游与管理工程学院旅游与管理工程学院单击图标按钮,在弹出的对话框中选择直方图和显示正态分布曲线 旅游与管理工程学院旅游与管理工程学院 旅游与管理工程学院旅游与管理工程学院其他采用默认设置,点击确定 旅游与管理工程学院旅游与管理工程学院二、数据描述分析过程二、数据描述分析过程 描述分析过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特

15、殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。旅游与管理工程学院旅游与管理工程学院顺次点击描述分析-描述,将统计学考试成绩变量调入选入对话框,在选项中对分析指标进行选择 旅游与管理工程学院旅游与管理工程学院分析结果 旅游与管理工程学院旅游与管理工程学院三、数据探索过程三、数据探索过程主要用于对资料数据的性质、分布状况等完全不清楚时的进行分析,故称探索性分析。在常用的描述性统计指标的基础上,它又增加了有关数据详细分布特征的文字与图形描述,如茎叶图、箱式图等,显得更加详细全面。还可以为以方差齐性为目的的变量变换提供线索,有助于用户制定继续分析的方案。旅游与管理工程学

16、院旅游与管理工程学院单击探索按钮,默认置信区间为95%,采用茎叶图,采用默认设置即可 旅游与管理工程学院旅游与管理工程学院 旅游与管理工程学院旅游与管理工程学院茎叶图,整数位为茎,小数位为叶。这样可以非常直观的看出数据的分布范围及形态 旅游与管理工程学院旅游与管理工程学院第三节列联表及多选题频数分析列联表分析多选题频数分析 旅游与管理工程学院旅游与管理工程学院一、列联表分析列联表又称交互分类表,所谓交互分类,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。如果是按两个标志对一组观察值进行交叉分组所得到的频数分布表,表中列出

17、同时联系于横行和纵行某特定标志名称的观察值数目,在表的右边栏列出各行频数的合计,在表的底行列出各列频数的合计,在两者交叉处,即表的右下角,列出频数总计,这类表就是列联表。旅游与管理工程学院旅游与管理工程学院若总体中的个体可按两个属性A与B分类,A有r个等级A1,A2,,Ar,B有c个等级B1,B2,,Bc,从总体中抽取大小为n的样本,设其中有nij个个体的属性属于等级Ai和Bj,nij称为 频数,将rc个nij排列为一个r行c列的二维列联表,简称rc表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。最常用的列联表为两个变量的列联表。一个为行变量,其分类数为r个;一个为列变

18、量,其分类数为c个。一个r行c列的列联表称为rc列联表。旅游与管理工程学院旅游与管理工程学院列链表的构造列X行Y12c合计(行边缘)12rf11f21fr1f12f22fr2f1cf2cfrcFY1=f1jFY2=f2jFYr=frj合计(列边缘)FX1=fi1FX2=fi2FXc=ficn 旅游与管理工程学院旅游与管理工程学院联合频数与边缘频数 表中fij为联合频数;FXj为列边缘频数;FYi为行边缘频数;n为总观测数量。联合频率与边缘频率 fij/n为联合频率;FXj/n为列边缘频率;FYi/n为行边缘频率。条件频率 fij/FXj为X条件Y频率P(Y=i|X=j);fij/FYi为Y条件

19、X频率P(X=j|Y=i)。旅游与管理工程学院旅游与管理工程学院例如色觉与性别频数、频率、边缘频数、边缘频率、条件频率、条件频数列联表如下:性别X色觉Y男女合计正常色盲44238514695644合计4805201000 旅游与管理工程学院旅游与管理工程学院列联表分析的基本问题是,判明所考察的各属性之间有没有关联,即是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?一般采用k.皮尔逊的拟合优度检验(简称卡方检验)SPSS分析例子见吸烟与健康状况.sav 旅游与管理工程学院旅游与管理工程学院首先以人数为权重进行加权处理,再顺序点击分析-描述统计交叉表,在弹出对话框中把是否吸烟和健康状

20、况选入行和列:旅游与管理工程学院旅游与管理工程学院在统计量中选卡方检验和相依系数 旅游与管理工程学院旅游与管理工程学院在单元格中选观察值 旅游与管理工程学院旅游与管理工程学院其他不变,采用默认设置,点确定,计算结果便出来了 旅游与管理工程学院旅游与管理工程学院卡方检验结果:皮尔逊卡方相伴概率P=0.006,小于0.01,差异非常显著 旅游与管理工程学院旅游与管理工程学院二、多选题频数分析案例见家庭计算机调查1.sav,因为d1到d6都是计算机用途的答案,因此先定义集,调多重相应定义变量集程序 旅游与管理工程学院旅游与管理工程学院单击添加则集定义完毕,返回多重响应,调频率程序,就可进行频数分析了 旅游与管理工程学院旅游与管理工程学院 旅游与管理工程学院旅游与管理工程学院SPSS还可以多选题进行交叉表分析,调多重响应交叉表程序即可实现。旅游与管理工程学院旅游与管理工程学院2024/3/18周一61

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服