收藏 分销(赏)

描述统计.pptx

上传人:胜**** 文档编号:1680066 上传时间:2024-05-07 格式:PPTX 页数:59 大小:875KB
下载 相关 举报
描述统计.pptx_第1页
第1页 / 共59页
描述统计.pptx_第2页
第2页 / 共59页
描述统计.pptx_第3页
第3页 / 共59页
描述统计.pptx_第4页
第4页 / 共59页
描述统计.pptx_第5页
第5页 / 共59页
点击查看更多>>
资源描述

1、第二讲 SPSS基本统计频数分析(频数分析(Frequencies)描述统计(描述统计(Descriptives)探索性分析(探索性分析(explore)交叉列联表(交叉列联表(crosstabs)第一节第一节频数分析(频数分析(Frequencies)Analyze-descriptive statistics-Frequencies统计量选择对话框要求计算4分位数要求计算若干等分的分位数要求计算自定义的分位数离中趋势的指标集中趋势的指标分布形状指标画图的对话框不作图作柱状图作饼状图作直方图第二节描述统计(第二节描述统计(Descriptives)数据分布的特征集中趋势集中趋势集中趋势集中趋

2、势(中心位置中心位置中心位置中心位置)离中趋势离中趋势离中趋势离中趋势(分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)集中趋势集中趋势 一、算术平均数一、算术平均数 二、中位数二、中位数 三、几何均数三、几何均数 四、众数四、众数离中趋势指标离中趋势指标 一、全距一、全距 二、方差与标准差二、方差与标准差 三、变异系数三、变异系数 四、四分位差四、四分位差偏度和峰度指标偏度和峰度指标 一、峰度指标一、峰度指标 二、偏度指标二、偏度指标 中心趋势指标 常用的中心趋势指标有:算术均数、几常用的中心趋势指标有:算术均数、几何均数、中位数、众

3、数,统称为平均数何均数、中位数、众数,统称为平均数(averageaverage)一、算术平均数(一、算术平均数(The Arithmetic The Arithmetic meanmean)简称均数(简称均数(MeanMean)或均值,定义为所有)或均值,定义为所有测量值之和除以变量值个数(即,样本含量测量值之和除以变量值个数(即,样本含量Sample SizeSample Size)。反映一组呈对称分布的变)。反映一组呈对称分布的变量值在数量上的平均水平。量值在数量上的平均水平。均数的特征1.1.最常用,特别是正态分布资料;最常用,特别是正态分布资料;2.2.均数对极值特别敏感,均数对极值

4、特别敏感,3.3.极大值或极小值通常将均数拉向自己;极大值或极小值通常将均数拉向自己;二、二、中位数与百分位数中位数与百分位数11个大鼠存活天数:个大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60。平均存活天数平均存活天数?(一)中位数(一)中位数(median)是将每个变量值从小到大排列,位置居是将每个变量值从小到大排列,位置居于中间的那个变量于中间的那个变量值值。存活天数存活天数 2,3,4,7,9,10,13,15,50,60,60秩次秩次 1 2 3 4 5 6 7 8 9 10 11 计算计算公式公式:n为奇数时为奇数时 n为偶数时为偶数时中位数的特征1.计算时只

5、利用了位置居中的测量值计算时只利用了位置居中的测量值优点:对极值不敏感优点:对极值不敏感缺点:并非考虑到每个观测值缺点:并非考虑到每个观测值2.适用于各种分布类型的资料,适用于各种分布类型的资料,特别适合于:大样本偏态分布资料特别适合于:大样本偏态分布资料或者一端或两端无确切数值的资料或者一端或两端无确切数值的资料 百分位数示意图百分位数示意图(二)百分位数(二)百分位数(percentile)四、众数(四、众数(Mode)是是一一群群数数据据中中出出现现次次数数(频频数数)最最多多的的值值。适适用用于大样本;较粗糙。于大样本;较粗糙。例例有有16例高血压病人的发病年龄例高血压病人的发病年龄(

6、岁岁)为:为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。,试求众数。众数的特征众数的特征1、对于某些数据而言,例如均匀分布,并不存在众数;、对于某些数据而言,例如均匀分布,并不存在众数;2、对于某些数据存在两个或多于两个的众数;、对于某些数据存在两个或多于两个的众数;3、定性数据可以存在众数;、定性数据可以存在众数;众数对于进一步的统计学计算与分析不具备应用价值。众数对于进一步的统计学计算与分析不具备应用价值。五、其他位置指标五、其他位置指标1、四分位数(、四分位数(Quartile)(三个四分位数)(三个四分位数)2、十分位数、

7、十分位数(Centile):9个十分位数个十分位数离散与变异性指标离散与变异性指标全全距距四四分分位位间间距距方方差差标标准准差差变变异异系系数数1、全距、全距(Range)与绝对差与绝对差全距为最大值与最小值之差,也叫极差全距为最大值与最小值之差,也叫极差缺点:仅利用了两个极端值。缺点:仅利用了两个极端值。2 2、方差与标准差、方差与标准差 方差方差(Variance)(Variance)也称均方差(也称均方差(meansquaredeviation),反映一组数据的平均),反映一组数据的平均离散水平。离散水平。样样本本方方差差为为各各变变量量值值到到样样本本均均数数距距离离的平方和除以自由

8、度的商值,即的平方和除以自由度的商值,即总体方差定义为总体方差定义为 样本标准差为样本方差的平方根;样本标准差为样本方差的平方根;总体标准差为总体方差的平方根。总体标准差为总体方差的平方根。标准差(standard deviation)随机变量xi的标准化如果如果随机变量xi服从正态分布,均数和标服从正态分布,均数和标准差分别为准差分别为和和s,则,则随机变量xi的标标准化正态离差值(准化正态离差值(Standardnormaldeviation)又称为标准化得分值)又称为标准化得分值(StandardScores)为:)为:三、变异系数(coefficient of variation)变异

9、系数(coefficient of variation,CV)常用于比较度量单位不同度量单位不同或均数相差均数相差悬殊悬殊的两组(或多组)资料的变异程度。某地某地7岁男孩身高的均数为岁男孩身高的均数为123.10cm,标准差,标准差为为4.71;体重均数为;体重均数为22.59kg,标准差为,标准差为2.26kg,比较其变异度?比较其变异度?四、四分位数间距四、四分位数间距(inter-quartilerange)四分位数间距,用IQR表示:IQR=第三四分位数:Q3 第一四分位数:Q1偏态偏态是指大部份的数值落在平均数的哪一边,若分配較多集中在低数值方面,是为正偏态分配(或称右偏态分配);若

10、分配较多集中在高数值方面,是为负偏态分配(或称左偏态分配),正态分布的偏态为0,SPSS计算公式为:偏度和峰度系数峰度峰度是次数分配曲线与常态曲线比較,是较为尖峻或平坦;通常较为尖峻者,稱為高峰(leptokurtic),较为平坦者称为低峰(platykurtic)。正态分布的峰度有些书定义为3,有些书定义为0,这是因为定义为0的是(减去了3)。SPSS是定义的0,且计算公式为:AnalyzeDescriptive StatisticsDescriptives选择描述统计的内容选择描述统计的内容(Options)统计量输出结果的顺序第二节 探索性分析 计算相关的描述统计量 绘制相关的统计图 使

11、你对数据有从感性到理性的认识。仔细把玩!为其选择合适的统计分析的方法。描述统计量95%的置信限M估计量5个最小值和5个最大值10分位点绘制茎叶图绘制盒线图绘制正态性检验图第三节第三节交叉列联表分析交叉列联表分析(Crosstabs)AnalyzeDescriptiveCrosstabs分类数据与列联表分类数据与列联表独立性检验独立性检验1 分类数据与列联表分类数据列联表的构造列联表的分布(1)分类数据 定类和定序数据都是定性数据,或称分类数据.分类数据表现为类别.例如:性别(男,女)各类别也可用符号或数字代码来表示.例如:1.男;2.女 对定类或定序数据的描述和分析通常使用列联表,并采用 检验

12、.(2)列联表(contingency table)的构造 1)由两个或两个以上变量进行交叉分类的频数分布表.2)行变量的类别数用 r 表示,列变量的类别数用 c 表示.3)由行变量和列变量的所有可能组合的频数构成的表格,称为列联表.4)一个 r 行 c 列的列联表称为 rc 列联表.22 列联表 列 行12合计12合计 表示 i 行 j 列的观察频数,行合计列合计.而样本容量 列 行12c合计12r合计r c 列联表部门态度一分公司二分公司三分公司四分公司合计赞成该方案68755779279反对该方案32453331141合计10012090110420 关于改革方案的调查结果单位:人例例

13、一个集团公司在四个不同的区域设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方法,从四个分公司共抽取 420 名职工,了解职工对此项改革的看法。(3)列联表的分布1)观察值的分布1.各行合计 的分布称行边缘分布,称行边缘频数,称行百分数.2.各列合计 的分布称列边缘分布,称列边缘频数,称列百分数.3.称为总百分数.包含百分比的 24 列联表2)期望值的分布 1.假定行变量和列变量相互独立2.实际频数 的期望频数的估计 为计算例根据表91,第一行第一列的实际频数 ,相应的期望频数的估计则为 类似可求得各个实际频数的期望频数(估计)列于表 94.部门态度一分

14、公司二分公司三分公司 四分公司合计赞成该方案实际频数68755779279期望频数(66)(80)(60)(73)反对该方案实际频数32453331141期望频数(34)(40)(30)(37)合计10012090110420实际频数和期望频数分布表单位:人一种原料来自三个不同的地区,原料质量划分成三个不同等级.从这批原料中随机抽取500件进行检验,结果如表所示.要求检验各个地区和原料之间是否存在依赖关系.表原料抽样结果 单位:件 33 列联表计算过程:地区和原料之间独立:地区和原料之间不独立取 时,查表得由于所以拒绝,接受.即认为地区和原料之间不独立.选择统计分析内容确定交叉表内单元格值的选项 确定交叉表的行顺序 某心理学者想了解人的社會参与度與生活满意度之关系。因此随机抽取1077位市民,结果如下表所示,请問此心理学者如何解释此结果?利用该数据你可以得到什么信息。利用你知道的检验方法进行检验。社会参与社会参与时常参加时常参加偶尔参加偶尔参加很少参加很少参加生活满意生活满意很很满意满意3503501501504848无意见无意见1201201021028888不不满意满意30308787102102H0:社会参与度与生活满意度无显著关系。社会参与度与生活满意度无显著关系。H1:社会参与度与生活满意度有显著关系。社会参与度与生活满意度有显著关系。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服