资源描述
第7章 描述统计返回1目 录频数分布频数分布分析过程频数分布分析实例描述统计描述统计过程与实例探索分析探索分析的基本内容探索分析过程探索分析实例返回交叉列联表分析交叉列联表分析过程交叉列联表分析实例比率分析比率分析过程比率分析实例P-P图和Q-Q图习题及参考答案结束2频数分布分析频数分布分析过程 返回3频数分布主对话框 返回4选择输出统计量对话框 返回5图形选择对话框 返回6频数分布表格式对话框 返回7频数分布分析实例 返回8例1表7-1 种族变量的频数分布表表7-2 幸福感变量的频数分布表 返回9例2 表7.5不同年龄人员和其受教育年限的描述统计 返回10例2 表7.6受教育年限变量的频数分布表 返回11age变量的直方图 返回12educ变量直方图 返回13描 述 统 计描述统计过程与实例 返回14 算术平均数、中位数和众数 四分位数和百分位数 全距、方差、标准差和标准误 偏度和峰度 列联表及其独立性检验 比率分析 正态分布的检验返回基本参数15描述统计分析主对话框 返回16描述统计:选择项对话框 返回17全美各种犯罪数据描述统计量 返回18探 索 分 析 过 程 返回19箱图 返回20茎叶图 返回21箱图与Spread vs level图(a)返回22箱图与Spread vs level图(b)返回23数据探索主对话框 返回24选择描述统计量对话框 返回25统计图对话框 返回26探索:选项27实例输出之一:观测量摘要表 返回28salary变量的描述统计量 返回29变量的极端值 返回30数据正态分布检验结果 返回31方差齐性检验结果 返回32 按照性别分组后的Current Salary的茎叶图 返回33薪水的Q-Q图 返回34男、女组薪水数据的箱图 返回35交叉列联表分析过程 返回36 交叉表分析主对话框 返回37选择统计量对话框 返回38精确检验对话框 返回39有关公式:列联系数:Cramer V:返回40显示单元格值对话框 返回41格式对话框 返回422024/5/22 周三43Data-03数据交叉列联表分析结果 表7.15观测量统计处理摘要 返回44表7.16 各变量之间的多维频数分布表 返回45 表7.17 卡方检验 返回46Data-04交叉列联表分析结果 表7.18观测量统计处理摘要 返回47表7.19交叉列联表 及表7.20卡方检验结果 返回48比率分析 返回49比率分析主对话框 返回50比率分析:统计量对话框 返回51 比率分析实例 data07-05结果表7-21 样本数据摘要 返回52表7-22地产最后估价与售价比值的比率统计量 返回53P-P图和Q-Q图 返回54P-P概率图主对话框 返回55图7-32(a)为肺癌生存时间的Weibull分布P-P概率图 返回56图7-32(b)为肺癌生存时间的趋降Weibull分布P-P概率图 返回57data07-07pb变量转换前后的分布 返回58Q-Q概率图主对话框 返回59图7-35(a)是对某市150名3岁女童身高数据所做的Q-Q正态概率图 返回60图7-35(b)是某市150名3岁女童身高数据趋降Q-Q正态概率图 返回61习题及参考答案 返回62习题7第5题 分析不同性别的受访者的工资水平与订阅报纸的比例之间是否存在差异。使用的数据文件为data05-05,“inccat”变量为工资分类情况、“News”变量为报纸订阅情况,“gender”变量为性别。返回63第5题操作步骤(1)读取数据文件data07-09,按分析描述统计交叉表的顺序打开交叉分析主对话框。(2)将变量“家庭收入”选入行框中,将变量“订阅报纸”选入列框中,设置行列变量。将变量“性别”选入层1的1框中,作为控制变量。(3)单击统计量按钮,展开统计量对话框,选中卡方复选项。(4)单击单元格按钮,展开单元显示对话框,在计数栏中选中观察值复选项。(5)在主对话框中,单击确定按钮,提交系统执行。返回64第5题结果此表说明合法观测量6400个,没有缺失值 返回65第5题 结果分析1.男女订阅报纸的比例分别为43.8、42.7。2.被调查的男、女性工资水平高的,订阅报纸的比率也高。被调查者工资水平与订阅报纸的比率是否真有关系,见检验的结果。返回66第5题 结果分析 卡方检验表(其零假设为行列变量相互独立),由于男女各项测试指标的显著水平值均小于0.01,由此可以判明,工资水平与订阅报纸的比例有着明显的联系。返回67习题7第6题 使用data05-09数据,利用频数表简单说明家庭收入数据的分布情况与修整数据的方案。返回68(1)打开spss07-09数据,按照分析描述统计频率的顺序打开“频率”对话框;(2)选择 变量家庭收入进入变量框中;(3)选择显示频率表格选择项;(4)打开“统计量”对话框,选择均值、中位数、标准差、最小值和最大值;(5)打开“图表”对话框,选择直方图,选择在直方图上显示正态曲线项;(6)单击确定按钮提交运算第6题操作步骤 返回69 在本例中发现平均值与中位数相差25左右,可能预示数据不会是正态分布第6题输出表之一 返回70第6题输出表之二收入的频数分布表 返回71 在图中可以发现绝大部分观测量集中在坐标的左侧,也就是说绝大部分家庭的收入少于100,000 元,只有很少一部分家庭的收入超过500,000元 但是这些很少的观测量却又会显著地影响着整个观测量的平均值。第6题输出之三 返回721.为了修整数据的分布情况,对本例“家庭收入”进行对数转换,按照转换 计算变量.的顺序打开计算变量 对话框,在“目标变量”框中输入一个新变量的名称(本例输入“lnin”),在“数字表达式”框中输入转换公式和变量名称(本例输入Ln(income)。单击“确定”按钮提交运算。数据文件中生成新变量lnin。2.(1)按照分析描述统计频率的顺序打开“频率”对话框;(2)选择 变量lnin进入变量框中;(3)打开“图表”对话框,选择带有正态曲线的直方图选择项;(5)单击确定按钮提交运算。第6题结果 返回73上图为重新生成的直方图,其数据已经比较接近正态分布。第6题结果 返回74 使用data07-10合金数据,利用数据探索过程分析一种新型合金耐高温所得数据的分布情况。习题7第7题 返回75第7题操作步骤(1)打开spss07-10数据,按照分析描述统计探索的顺序打开“探索”对话框。(2)选择 变量“摄氏温度temp”进入因变量列表框中,作为因变量;选择 变量“合金batch”进入因子列表框中,作为因素变量。(3)选择变量“labrunid”,作为标签变量进入标注个案框中。(4)打开“统计量”对话框,选择M-估计量、界外值和统计量(5)打开“绘制”对话框,选择带检验的正态图选择项;(5)单击确定按钮提交运算。返回76第7题分析结果输出结果之一:观测摘要从表中可以知道该数据中高级合金和标准合金各有240个样本数据。无缺失值。返回77输出结果之二:描述统计。从表中可以了解高级合金和标准合金的基本描述统计量。如从表中可以知道高级合金的平均温度是1542.1,标准合金的平均温度是1514.7。返回78输出结果之三:M估计该表列出了高级合金和标准合金的四个M估计的结果。这些值是根据框外的加权系数计算的。结果更接近中位数。返回79输出结果之四:极端值该表中分别列出了高级合金和标准合金的最高和最低的5个值。返回80输出结果之五:正态性检验 该表是正态性检验结果。是操作过程中选中Plots对话框Normality plots with tests选项的结果。从表中看,高级合金组的Sig0.05,说明变量不呈正态分布。而标准合金组的Sig大于0.05,表明该变量呈正态分布。返回81输出之六:高级合金组和标准合金组的茎叶图从两个图的比较看,高级合金的分布(左侧图)不对称,而标准合金(右侧图)的分布呈基本对称。返回82使用基本统计分析功能了解变量的基本特征返回目录返回832024/5/22 周三84
展开阅读全文