统计学试题答案.doc_咨信网zixin.com.cn

资源描述

统计学试题一、填空 1、根据尺度的不同，数据可以分为分类数据、顺序数据、区间数据比例数据。 2、假设检验中第一类错误是弃真错误，第二类错误是取伪错误。 3、方差分析是研究分类型自变量对数值型因变（样本）量的影响的分析方法。 4、相关关系按相关程度可分为完全相关、不完全相关和不相关。 5、统计学大体分为描述统计学和推断统计学。 6、统计数据按来源可分为第一手（直接）数据和第二手（间接）数据。 7、方差分析中SST=SSA + SSE；F=MSA /MSE。 8、相关关系按变量多少可分为单相关和复相关。 9、假设检验中一般要进行原假设和备择假设。 10、方差分析实际就是比较计算组间误差和组内误差的大小。 11、平均数按度量方法不同可分为数值平均和位置平均。 12、根据收集时间，数据可分为截面（横向）数据和时间（纵向）数据。 13、同一时间不同空间的数据叫截面数据，同一空间不同时间段数据叫时间数据。 14、集中趋势的代表性度量是均值，离散程度的代表性度量是方差。 15、参数估计有点估计和区间估计两种方法。 16、问卷的问题类型分为开放式和封闭式两种。 17、ANOVA分为单因数方差分析、双因数方差分析和多因数方差分析。 18、标志分为品质标志和数量标志两种类型。 19、标志是描述的总体单位特征，而指标是描述的总体特征。 20、在参数估算中，事先给定的α称为风险值（概率值），在假设检验中，它代表发生第一类错误（弃真错误）的概率 21、样本容量总体分布 σ已知 σ未知大样本正态 X±Zα/2×σ/n0.5 X±Zα/2×S/n0.5 非正态小样本正态 X±tα/2,（n-1)×S/n0.5 二、选择题 1、当数据分布有偏向时，位于中间的是（ 5 ）。 1）均值 2）调和平均值 3）众数 4）几何平均值 5）中位数 2、统计上α一般代表（ 2 ） 1）置信水平 2）显著性水平 3）拒绝域 4）临界值 5）P值 3、统计上显著时（ 2 ） 1）P值> 0.05 2)P值 < 0.05 3)F>1.96 4)F<1.96 5) Z>1.96 4、在EXCEL的函数中 FREQUENCY函数是求（ 1 ） 1）频度 2）F值 3）随机数 4）P值 5）标准差 5、随机抽样是指（ 2 ） 1）随便抽样 2）等概率抽样 3）方便的抽样 4）用机器抽样 5）随时抽样 6、ANOVA是指（ 4 ） 1）回归分析 2）相关分析 3）正态分布 4）方差分析 5）均值比较 7、在方差分析中所要检验的对象成为因子，因子的不同表现称为（ 3 ） 1）因素 2)方差 3)处理（水平） 4)观测值 5)等级 8、两个班成绩的比较可以通过那个方法进行（ 5 ） 1）比较平均值 2）回归分析 3)ANOVA 4）相关分析 5）t-test 9、在假设检验中第I类错误和第II类错误（ 1 ） 1）不能同时减小2）可同时减小3）可同时增大4）只能同时增大5）无关 10、均方的计算是平方和除以相应的（ 3 ） 1)误差个数 2）数据个数 3）自由度 4）标准差 5）总体数 11、在方差分析中衡量不同水平样本数据间的误差称为（ 2 ） 1）组内误差 2）组间误差 3）组内平方 4）组间平方 5）残差 12、检验两个总体的方差比值时所用的分布是（ 3 ） 1）N分布 2）t 分布 3）F 分布 4）卡方分布 5）均匀分布 13、对总体参数的具体数值所做的陈述称为（ 5 ） 1）描述统计 2）参数估算 3）假设检验 4）双侧检验 5) 假设 14、在置信区间估算中，临界值1.96所对应的置信水平上（ 3 ） 1）85% 2）90% 3）95% 4）99.7% 5）90% 15、统计上所谓显著的，是指（ 3 ） 1）很重要的 2）很明显的 3）非偶然的 4）偶然的 5）有差别的 16、查F分布表时，需要知道的条件是（ 2 ） 1）一个自由的 2）两个自由度 3）不需要自由度 4）P值 5）方差 17、方差所代表的是数据的（ 3 ） 1）集中趋势 2）中心趋势 3）离散程度 4）复杂程度 5）差别程度 18、组内误差只包含（ 1 ） 1）随机误差 2）系统误差 3）条件误差 4）方差 5）残差 19、估计一个正态总体的方差使用费分布为（ 3 ） 1）正态分布 2)t分布 3) χ2 分布 4)F分布 5)N分布 20、数据的离散程度越大，集中趋势测度对该数组的代表性（ 1 ） 1)越差 2）越好 3）不变 4）无法判断 5）越不对称 21、对名类尺度进行分析的统计量主要是（ 2 ） 1）众数 2）频率 3）均值 4）标准值 5）方差 22、标准分数为1.96，表示该数值位于距离均值（ 2 ）倍标准差的位置。 1）2 2）1.96 3）95% 4）置信区间 5) 90% 三、简答题 1、请简述参数、统计量、样本、总体之间的关系。总体：所要调查的对象的全体统计量：反映总体的特征的概括性度量样本：按一定概率从总体中抽出来，反映总体特征的集合参数：反映样本的特征的概括性度量 2、如何实施焦点座谈（FGI）焦点座谈是将一组被调查者集中在调查现场，让他们对调查的主题发表意见，从而获取资料的方法，具体实施方法为： (1)主持人要熟悉访谈技术 (2)6-12人参加 (3)2小时左右 (4)气氛轻松 (5）做好记录 (6）谈话内容不宜偏了主题 3、总体方差与样本方差有什么不同？总体方差计算时自由度是总体数n,而样本方差计算时自由度是样本数n-1 4、假设检验规程中，我们如何控制检验误差？不可能同时控制第一类检验误差（α误差）与第二类检验误差（β误差）两类误差的最小发生概率。因此控制更为严重的误差，即第一类误差的概率α，即进行显著性检验 5、简述4种尺度的关系。 4种尺度为：名类尺度、顺序尺度、区间尺度、比例尺度。其关系为：（1）高级尺度涵盖低级吃尺度的功能，即所含信息更多。（2）尺度越高级，可实施的统计分析也越丰富。（3）尺度越高级，其信赖度越低。 6、中心极限定理的内容和在统计学中的用处是什么？中心极限定理是指任意分布的总体中，当样本容量为n时，X～N（μ，σ2/n), 的分布随着n的增加，趋近与N (0，1)一般n >30, 即可认为是标准正态分布。中心极限定理说明从正态分布的总体中抽取样本或非正态分布的总体样本的 n足够大，样本均值这一统计量都趋于正态分布。 7、参数与统计量的区别？参数是用来描述总体特征的概括性数字度量。统计量是用来描述样本特征的概括性数字度量。 8、一元线性回归分析与相关分析的区别是什么？（1）相关分析中变量x变量y处于平等的地位，回归分析中变量y称为因变量，处在被解释的地位，变量x称为自变量，用于预测因变量的变化。（2）相关分析中所涉及的变量 x 和 y 都是随机变量；回归分析中，因变量 y 是随机变量，自变量 x 是非随机的确定变量（3）相关分析主要是描述两个变量之间线性关系的密切程度；回归分析不仅可以揭示变量 x 对变量 y 的影响大小，还可以由回归方程进行预测和控制。 9、方差分析是比较多个群体间方差是否有差别的分析，这观点是否正确？为什么？不正确，因为方差分析是检验多个总体或样本之间的均值是否相等的统计方法，即分类型自变量对数值型因变量是否有影响的问题。 10、问卷中人口统计学变量是指什么？请例举说明。人口统计学变量是指在人口统计过程中的设定项。例如：性别、年龄、民族、受教育程度、健康、收入、亲属状况等。 11、请简述二手资料的特征和用处。二手资料是来源于别人调查或实验的资料。二手资料中各种形式的统计数据可以被用来做统计分析。 12、简述方差分析有何用处方差分析是检验多个总体或样本之间的均值是否相等的统计方法，即分类型自变量对数值型因变量是否有影响的问题。 13、请简述均值、中数、众数之间的关系。他们都是表示数据的集中趋势的度量。均值是数据的标准总量与总体个数的比值。中数是数据从小到大排列有居于中间的数值。众数是数据内出现次数最多的数。均值是数值平均数，而后两者为位置平均数。无论数据如何分布，中数总是据中。 14、如果总体呈正态分布，那样本分布有如何特征。如果总体呈正态分布，那么样本也呈正态分布，样本均值与总体均值相等，方差为总体方差的1/n。 15、请简述标志与指标的区别与联系。区别：标志是用来说明总体单位的特征，指标是用来说明总体的数量特征的。统计标志中的数量标志可以用数值表示，而品质标志不可用数值表示；但所有的指标都可用数值表示。联系：标志和指标都可以称为变量。有些指标的数值是在总体单位的数量标志值的基础上汇总得到的，在一定条件下，二者可以相互转化。 16、统计量t和χ2 各自适用与什么条件的参数估算或假设检验？统计量t适用于总体服从正态分布方差σ2未知的小样本的总体均值的区间估计或检验。统计量χ2适用于总体服从正态分布的总体方差的区间估计或检验。四、计算题 1、填空并计算（计算题列简式） No. X Y D(X) D(Y) D(X)^2 D(Y)^2 XY D(X)D(Y) 1 3 4 -0.6 -0.4 0.36 0.16 12 -0.48 2 5 6 1.4 1.6 1.96 2.56 30 3.92 3 6 3 2.4 -1.4 5.76 1.96 18 -0.48 4 2 2 -1.6 -2.4 2.56 5.76 4 1.92 5 2 7 -1.6 2.6 2.56 6.76 14 3.52 Sum 18 22 0 0 13.2 17.2 78 -1.2 mean 3.6 4.4 0 0 2.64 3.44 15.6 -0.24 （1）E(X) = 3.6 （2）E(XY) = 15.6 （3）Var(Y) = 3.44 （4）Cov(XY) = -0.24 2、统计学考试全班平均75分，标准差为9分，分数呈正太分布。全班只有5% 的学生能够得到A+。问要得A,至少要考多少分？（hint：one-tail） X - μ Z =-------- =1.64, X = 1.64*9+75=89.76 σ 3、边际误差E=5，σ=40，要估计总体均值μ的95%的置信区间，需要的样本是多少？ N=（1.96×40/5）^2=246 4、某药品每一袋重量应该是100克，已知药包装重量呈正态分布，且总体方差应该控制在100以内。该厂质检部门从生产的10000袋中抽25袋进行检验，结果平均每袋重量为103.5克。试问在95%的置信水平这一批产品是否合格。 X - μ 103.5-100 Z =-------- = ---------- =1.75<1.96 σ/n0.5 10/5 5、一制药厂因引进新的包装机要对某种药进行抽样检测。药盒标每包注重量50 克。随机抽了100份，平均重量为50.03g,标准差为0.1g。请进行假设经验。（建立假设，求统计量，得出结论）假设：H0：μ=50 H1：μ≠50 过程：Z=（50.03-50）×0.1/10 = 3>1.96, 结论：拒绝原假设H0；而不得不接纳对立假设H1 即这批新的包装机合格。 6、感冒冲剂每包定量为12克，超重或过轻都不合格。从过去的经验得知产品重量服从正太分布，而且σ为0.6克。质检员抽25袋进行检验，平均重量为12.25克。请进行置信水平为95%的经验（建立假设，求统计量，得出结论）假设：H0：μ=12 H1：μ≠12 过程：Z=（12.25-12）×0.6/5 = 2.08>1.96, 结论：拒绝原假设H0；而不得不接纳对立假设H1 即这批感冒冲剂并不合格。 7、三个班的外语成绩如下表。通过EXCEL的单元素方差统计分析结果，进行假设检验（建立假设，求统计量，得出结论）。 3个小组的外语成绩　成员 1组 2组 3组 1 80 88 84 2 91 98 80 3 86 90 81 4 88 99 79 5 79 100 78 6 79 97 81 7 81 89 82 8 80 90 90 分析结果 SUMMARY 组观测数求和平均方差 1组 8 664 83 21.71429 2组 8 751 93.875 25.55357 3组 8 655 81.875 14.125 方差分析差异源 SS df MS F P-value F crit 组间 702.75 2 351.375 17.17016 3.81E-05 3.4668 组内 429.75 21 20.46429 总计 1132.5 23 　　　　假设：H0：3个班的成绩都相等，μ1=μ2=μ3 H1：3个班成绩不都相等，即至少有一个班与其他班不等过程：F=17.17016 > Fc=3.4668 或 P-value=3.8E-05 远远小于α=0.05 结论：拒绝原假设H0，而不得不接纳对立假设H1 即3个班成绩从统计学的角度上说不都相等。（注：专业文档是经验性极强的领域，无法思考和涵盖全面，素材和资料部分来自网络，供参考。可复制、编制，期待你的好评与关注）

展开阅读全文