统计软件及应用实验.doc_咨信网zixin.com.cn

资源描述

实验课程名称：统计软件及应用专业市场营销班级学号 1021 姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称基本统计分析（交叉分组下的频数分析）指导教师李晓辉一、实验目的掌握利用SPSS 软件进行基本统计量均值与均值标准误、中位数、众数、全距、方差和标准差、四分位数、十分位数和百分位数、频数、峰度、偏度的计算，进行标准化Z分数及其线形转换，统计表、统计图的显示。二、实验内容案例4-5 利用第二章案例2—1的住房状况问卷调查数据，分析本市户口与外地户口家庭对“未来三年是否打算买房”是否持相同态度。三、实验结论(包括SPSS输出结果及分析解释) 本市户口和外地户口家庭对“未来三年是否打算买房”看法的列联表本市户口和外地户口家庭对“未来三年是否打算买房”看法的一致性检验结果。 1.结果：（1）在总体样本中，2712户为本市户口，168户为外地户口，分别占总样本的94.2%和5.8%，可见本市户口占多数。未来三年不打算买房、打算买房的样本分别为2161和719，各占总体样本的75%和25%，不打算买房的占较大比例。（2）本市户口中，未来三年不打算买房和打算买房的样本量分别为2052和660，个占总体样本的75.7%和24.3%，不打算买房仍占较大比例，但打算买房的比例低于总体比例，在外地户口中，未来三年不打算买房和打算买房的样本量分别为109和59，个占总样本的64.9%和35.1%，未来三年不打算买房的仍占较大比例，但打算买房的比例高于总体比例。（3）对不同看法进行分析。在未来三年不打算买房的样本中，本市户口和外地户口的家庭数是2052和109，分别占总样本的95.0%和5.0%，比例相差较为悬殊；在未来打算买房的样本中，本市户口和外地户口的家庭数分别为660和59，分别占总样本的91.8%和8.2%，比例差距仍较大。但应注意的是，由于本市户口和外地户口的样本量本身存在较大悬殊，因此这里的分析是存在一定问题的。（4）通过频数分析能够掌握单个变量的数据分布情况，实际分析中，不仅要了解单变量的分布特征，还要分析多个变量不同取值下的分布，掌握多变量的联合分布特征，进而分析变量之间的相互影响和关系。（5）频数：即便两只落在某个区间（或某个类别）中的次数。南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业市场营销班级学号 1021 姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称参数检验（两独立样本T检验）指导教师李晓辉一、实验目的掌握利用 SPSS 进行单样本 T 检验、两独立样本 T 检验和两配对样本 T 检验的基本方法，并能够解释软件运行结果。二、实验内容案例5-3：利用第二章案例2—1的住房问卷调查数据，推断本市户口总体和外地户口总体的家庭人均住房面积的平均值是否有显著差异。（“住房状况调查”数据）。三、实验结果及结论(包括SPSS输出结果及分析解释) 案例5-3的结果及结论： a图 a图表明：本市户口总体和外地户口总体的家庭人均住房面积的平均值有一定差距。 B图 B图表明： 1. 这里，该检验的f统计量观察值为65.469，对应的p值为0.00.。如果显著水平是0.05，p小于0.05，可以认为两总体的方差有显著差异。 2. 由于概率值小于0.05，可以认为两总体的方差有显著差异。即本市户口和外地户口家庭人均住房面积的样本平均值有显著差异。 3. 单样本t检验的基本步骤：提出原假设；选择检验统计量；计算检验统计量观测值和概率值；给定显著性水平a，并作出决策。南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业市场营销班级学号 1021 姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称方差分析（多因素方差分析）指导教师李晓辉一、实验目的掌握利用 SPSS 进行单因素方差分析、多因素方差分析的基本方法，并能够解释软件运行结果。二、实验内容 (包括实验案例及基本操作步骤) 某企业在制定某商品广告策略时，收集了该商品在不同地区采用不同广告形式促销后的销售额数据，希望那个对广告形式、地区以及广告形式、和地区的交互作用是否对商品销售额产生影响进行分析。基本操作步骤如下：（1）选择菜单analyze-general linear model-univariate （2）完善如下图所示三、实验结论(包括SPSS输出结果及分析解释) 结论：销售额多因素方差分析结果 1.在表二中，第一列是对观测变量总变差分解的说明；第二列是观测变量变差分解的结果；第三列是自由度；第四列是方差，第五列是F检验统计量的观测值；第六劣势检验统计量的概率P-值。 2.corrected model对应的变差（20094.306）是x1，x2，x1*x2对应变差相加的结果（20094.306=5866.083+9265.306+4962.917）。是线性模型整体对观测变量变差解释的部分。 3.在多因数方差分析中，观测变量值的变动会受到以下三方面影响：控制变量独立作用的影响；控制变量交互作用的影响；随机因数影响。 4多因数多因数方差分析的基本步骤：提出原假设；选择检验统计量；计算检验统计量观测值和概率p-值；给定显著性水平a，并作出决策南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业市场营销班级学号 1021 姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称非参数检验（单样本非参数检验）指导教师李晓辉一、实验目的掌握利用 SPSS 软件进行非参数检验的基本方法。包括卡方(Chi-Square)检验；二项分布(Binomial)检验；游程(Runs)检验；单样本(l-Sample)K-S检验； 2个独立样本(2 Independent Samples)检验；K个独立样本(K Independent Samples) 检验；2个相关样本(2 Related Samples) 检验；K个相关样本(K Related Samples) 检验。二、实验内容 ( 实验案例 ) 案例7-3 收集到21名周岁儿童身高的样本数据，分析周岁儿童身高的总体是否服从正态分布。具体数据见“儿童身高。SAV”。三、实验结论(包括SPSS输出结果及分析解释) 如果显著性水平a为0.05，由于概率P-值大于显著性水平，因此不能拒绝假设，可以认为周岁儿童身高的总体分布于正态分布无显著性差异。南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业市场营销班级学号 1021 姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称相关分析指导教师李晓辉一、实验目的掌握利用 SPSS 软件进行相关分析的基本方法，包括简单相关分析、偏相关分析和其它相关系数的计算。二、实验内容及步骤(包括实验案例及基本操作步骤) 利用第2章案例2-1的住房状况问卷调查数据，分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。文件名为“住房状况调查.sav” 1、绘制散点图步骤：（1）选择菜单：【Graphs】→【Legacy Dialogs】→【Scatter/Dot】（2）选择散点图的类型（3）根据所选择的散点图类型，按Deline按钮对散点图作具体定义 2、三维散点图步骤：在绘制散点图后的输出结果中选中【Elements】菜单下的【Fit Line at Total】子菜单并选择”棒状”的样式。 3、计算相关系数的基本操作步骤（1）选择菜单【Analyze】→【Correlate】→【Bivariate】（2）在【Correlation Cofficients】框中选择哪种相关系数。（3）选择参加计算相关系数的变量到【Variables】框中。（4）在【Test of Significance】框中选择输出相关系数检验的双尾(Two-tailed)概率P-值还是（one-tailed）概率P-值。（5）选中【Flag significant correlations】选项表示分析结果中除显示统计检验的概率P-值以外，还输出星号标记，以表明变量间的相关性是否显著；不选中则不输出星号标记。（6）在option按钮中的【Statistics】选项中，【Cross-product devitions and covariance】表示输出个变量的离差平方和、样本方差，两变量的叉积离差和协方差。三、实验结论(包括SPSS输出结果及分析解释) 结论： - - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - - Zero Order Partials 家庭收入计划面积常住人口家庭收入 1.0000 .3228 .1139 ( 0) ( 830) ( 830) P= . P= .000 P= .001 计划面积 .3228 1.0000 -.0755 ( 830) ( 0) ( 830) P= .000 P= . P= .030 常住人口 .1139 -.0755 1.0000 ( 830) ( 830) ( 0) P= .001 P= .030 P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed _ - - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - - Controlling for.. 常住人口家庭收入计划面积家庭收入 1.0000 .3345 ( 0) ( 829) P= . P= .000 计划面积 .3345 1.0000 ( 829) ( 0) P= .000 P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed 1. 上图的目的是分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。 2. 在常住人口数作为控制变量的条件下，家庭收入与计划购房面积的偏相关系数为0.335，但呈一定的弱相关，与简单相关系数相比略高。 3. 在实际分析中，散点图经常表现出某些特定的形式，如绝大多数的数据点组成类似于橄榄球的形状，或集中形成一根棒状，而剩余的少数数据点零散的分布在四周。通常橄榄球和棒状代表了数据对的主要结构和特征，可以利用曲线将这种主要结构的轮廓描绘出来，使数据的主要特征更凸显。南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业市场营销班级学号 1021 姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称回归分析指导教师李晓辉一、实验目的掌握在 SPSS 软件中进行多元线性回归分析方法和曲线参数的估计方法。二、实验内容案例9-1 为研究高等院校人文社会科学研究中立项课题数受那些因数的影响，收集某年31个省市自治区部分高校有关社科研究方面的数据，并利用线性回归分析方法进行分析。这里，被解释变量为立项课题数（X5），解释变量为投入人年数（X2）、投入高级职称的人年数（X3）、投入科研事业费（X4）、专著数（X6）、论文数（X7）、获奖数（X8）。（数据“高校科研研究”）三、实验结论(包括SPSS输出结果及分析解释) 1. 立项课题数多元线性回归分析结果（一）中各列数据项的含义依次是：被解释变量和解释变量的复相关系数、判定系数R^2、调整的判定系数、回归方程的估计标准误差。 2. 立项课题数多元线性回归分析结果（二）中各列数据项的含义依次是：被解释变量和变差来源、离差平方和、自由度、方差、回归方程显著性检验中F检验统计量的观测值和概率P-值。 3. 立项课题数多元线性回归分析的残差累计概率图中，数据点围绕基准线还存在一定的规律性，但标准化残差的非参数检验结果表明标准化残差与标准正态分布不存在显著差异，可以认为残差满足了线性模型的前提要求。 4. 立项课题数多元线性回归分析的残差图中随着标准化预测质的变化，残差点在0线周围随机分布，但残差的等方差性并不完全满足，方差似乎有增大的趋势。计算残差与预测值的spearman等级相关系数为-0.176，且检验并不显著，因此认为异方差现象并不明显。南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业班级学号姓名成绩实验地点实验性质：演示性 Ö 验证性综合性设计性实验项目名称聚类分析（层次聚类）指导教师李晓辉一、实验目的掌握利用SPSS软件进行聚类分析的方法，并能对实验结果进行解释。二、实验内容及步骤(包括实验案例及基本操作步骤) 31个省市自治区小康和现代化指数的聚类分析。 1. 选择菜单analyze-classify-hierarchical cluster 2. 完善如下图所示三、实验结论(包括SPSS输出结果及分析解释) 结论：层次聚类分析中的凝聚状态表层次聚类的冰挂图 _ 层次聚类分析的树形图 * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ D商厦 4 òûòòòòòòòòòòòòòø E商厦 5 ò÷ ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø C商厦 3 òòòòòòòòòòòòòòò÷ ó A商厦 1 òòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ B商厦 2 1. 层次聚类分析中的凝聚状态表中，第一列表示聚类分析的第几步；第二列、第三列表示本步聚类中那两个样本或小类聚成一类；第四列是个体距离或小类距离；第五列、第六列表示本步聚类中参与聚类的是个体还是小类，0表示样本，非0表示由第n步聚类生成的小类参与本步聚类；第七列表示本步聚类的结果将在以下第几步中用到。 2. 层次聚类的冰挂图可知，D商厦与E商厦的距离越近，首先合并成一类；其次合并的是A商厦和B商厦，他们间的距离大于D，E商厦间的距离；再次是C商厦与（D商厦，E商厦）合并；最后所有个体聚成一类，此时类间的距离已经非常大了。 3. 层次聚类分析的树形图中，当聚成4类时，D,E商厦为一类，其他各商厦自成一类；当聚成3类时，A,B商厦为一类，D,E商厦为一类，C商厦自成一类；当聚成2类时，A,B商厦为一类，C,D,E商厦为一类。 4. 层次聚类又称系统聚类，简单的讲是指聚类过程是按照一定层次进行的。层次聚类有两种类型，分别是Q型聚类和R型聚类两种；层次聚类的聚类方式又分为两种，分别是凝聚方式和分解方式聚类两种。南昌航空大学经济管理学院学生实验报告实验课程名称：统计软件及应用专业市场营销班级学号姓名成绩实验地点 G805 实验性质：演示性 Ö 验证性综合性设计性实验项目名称因子分析指导教师李晓辉一、实验目的掌握利用SPSS软件进行因子分析的方法，并能对实验结果进行解释。二、实验内容及步骤(包括实验案例及基本操作步骤) （1）选择菜单analyze-data reduction-factor （2）完善如下表所示三、实验结论(包括SPSS输出结果及分析解释) 结论：原有变量的相关系数矩阵巴特利特球度检验和KMO检验因子分析中的变量共同度（一）因子解释原有变量总方差的情况因子的碎石图因子载荷矩阵 Component Score Covariance Matrix Component 1 1 1.000 Undefined error #11401 - Cannot open text file "spss.err": No such file or directory Undefined error #11408 - Cannot open text file "spss.err": No such file or directory Undefined error #11418 - Cannot open text file "spss.err": No such file or directory 1. 收集到某年全国31个省市自治区各类经济单位包括国有经济单位、集体经济单位、联营经济单位、股份制经济单位、外商投资经济单位、港澳台经济单位和其他经济单位的年人均收入数据，现希望对全国各地区间年人均收入的差异性和相似性进行研究。 2. 原有变量的相关系数矩阵可以看到：大部分的相关系数都较高，各变量呈较强的线性相关，能够从中提取公共因子，适合进行因子分析。 3. 巴特利特球度检验和KMO检验可知：巴特利特球度检验统计量的观测值为182.913，相应的概率P-值接近0.如果显著性水平ɑ为0.05，由于概率P-值小于显著性水平ɑ，则以拒绝原假设，认为相关系数矩阵与单位矩阵有显著差异。同时，KMO值为0.882，根据kaiser给出的KMO度量标准可知原有变量适合进行因子分析。 4. 因子分析中的变量共同度（一）中，显示了所有的变量共同度数据。第一列数据是因子分析初始解下的变量共同度，它表明：如果对原有7个变量采用主要成分分析法提取所有特征值，那么原有变量的所有方差都可被解释，变量的共同度均为一，事实上，因子个数小于原有变量的个数才是因子分析的目标，所以不可提取所有特征值。第二列数据是在按指定提取条件提取特征值时的共同度。 5. 因子解释原有变量总方差的情况中，第一列是因子编号，以后三列组成一组，每组中数据项的含义依次是特征值、方差贡献率和累计方差贡献率。 6. 因子的碎石图中，横坐标为因子数目，纵坐标为特征值。可以看到：第一个因子的特征值很高，对解释原有变量的贡献最大；第三个以后的因子特征值都较小，对解释原有变量的贡献很小，已经成为可被忽略的“高山脚下的碎石”，因此提取两个因子是合适的。 7. 因子载荷矩阵可知：7个变量在第一个因子上的载荷都很高，意味着他们与第一个因子的相关程度高，第一个因子很重要；第二个因子与原有变量的相关性均较小，他对原有变量的解释作用不显著。另外还可以看到：这两个因子的实际含义比较模糊。 8. 因子分析的基本步骤：因子分析的前提条件，因子提取，使因子具有命名解释性，计算各样本的因子得分。

展开阅读全文