1、统计学简答题参考答案第一章 绪论1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2简要说明统计数据的来源。答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。3.简要说明抽样误差和非抽样误差。答:统计调查误差可分为非抽样误差和抽样误差。非抽
2、样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。 推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章 统计数据的描述1描述次数分配表的编制过程。答:分二个步骤:(1) 按照统计研究的目的,将数据按分组标志进行分组。按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。按数量标志进行分组,可分为单项式分组与组距式
3、分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。统计分组应遵循“不重不漏”原则(2) 将数据分配到各个组,统计各组的次数,编制次数分配表。2. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。3.怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起
4、到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。4. 简述众数、中位数和均值的特点和应用场合。答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。6.描述茎叶图和直方图,箱线图的画法,并说明它们的用途(P41、4
5、2) 答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作 为树茎,而且树叶上 只保留该数值的最后一个数字。通过茎叶图可以看出数据的分布形状及数据的离散状况。 直方图的绘制方法:在平面直角坐标系上,将分组标志作为横轴,并将各组次数作为纵轴,绘出的长方形图即直方图。通过直方图 可以看出数据的分配特征。 箱线图是由一个箱子和两条线段组成的。其绘制方法是:首先找出一组数据的五个特征值,即数据的最大值、最小值、中位数和两 个四分位数;然后连接两个四分位数画出箱子;再将两个极值点与箱子相连接。通过箱线图可以看出数据分布的特征。7.设计一张规范的统计表应该注
6、意哪些问题? 答:1、统计表一般为横长方形,上下两端封闭且为粗线,左右两端开口。 2、统计表栏目多时要编号,一般主词部分按甲、乙、丙;宾词部分按(1)(2)等次序编号。 3、统计表总标题应简明扼要,符合表的内容。 4、主词与宾词位置可互换。各栏排列次序应以时间先后、数量大小、空间位置等自然顺序编排。 5、计量单位一般写在表的右上方或总栏标题下方。 6、表内资料需要说明解释部分,如:注解、资料来源等,写在表的下方。7、填写数字资料不留空格,即在空格处划上斜线。统计表经审核后,制表人和填报单位应签名并盖章,以示负责。第三章 概率、概率分布与抽样分布1.解释总体分布、样本分布和抽样分布的含义答:总体
7、分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象。从总体中随机抽取容量为n的样本,它的分布称为样本分布。由样本的某个函数所形成的统计量,它的分布称为抽样分布(如样本均值、样本方差的分布)2.重复抽样与不重复抽样相比,抽样均值抽样分布的标准差有什么不同?答:重复抽样和不重复抽样下,样本均值的标准差分别为: 因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数3.解释中心极限定理的含义答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理为均值的
8、抽样推断奠定了理论基础。4.简述系统抽样组织方式组织实施的基本步骤(P98) 答:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n个 单位形成一个样本。5.整群抽样的优缺点是什么?(P98) 答:整群抽样的优点:可以简化抽样框的编制。样本单元比较集中,实施调查便利,且能节约费用。 整群抽样的缺点:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差 ,抽样误差较大。6.什么是必要的样本容量,其影响因素有哪些? 答:是指一个样本的必要抽样单位数目。在组织抽样调查时,抽样误差的大小直接影响
9、样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一影响因素:(1) 研究对象的变化程度;(2) 所要求或允许的误差大小(即精度要求);(3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。第四章 参数估计1简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数的估计量有和,如果,称是无偏估计量;如果和是无偏估计量,且小于,则比更有效;如果当样本容量,则是相合估计量。2简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本
10、容量的确定公式为例:样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。第五章 假设检验1理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有:(1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。2第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?答:第I类错误指,当原假设为真时,作出
11、拒绝原假设所犯的错误,其概率为。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为。在其他条件不变时,增大,减小;增大,减小。3什么是显著性水平?它对于假设检验决策的意义是什么?答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。4什么是p值?p值检验和统计量检验有什么不同?答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计
12、算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平,来控制犯第一类错误的上限,p值可以有效地补充提供地关于检验可靠性的有限信息。值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。5什么是统计上的显著性?答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的。第七章 相关与回归分析1.相关分析与回归分析的区别与联系是什么?答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两个或两个
13、以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法,不能揭示现象之间的本质关系。2.什么是总体回归函数和样本回归函数?它们之间的区别是什么?答:以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数:,或。总体回归函数是确定的和未知的,是回归分析所估计的对象。样本回归函数是根据样本数据所估计出的因变量与自变量之间的函数关系:或。回归分析的目的是用样本回归函数来估计总体回归函数。它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是
14、随样本波动而变化;总体回归函数的参数是确定的,而样本回归函数的系数是随机变量;总体回归函数中的误差项不可观察的,而样本回归函数中的残差项是可以观察的。3. 什么是随机误差项和残差?它们之间的区别是什么?答:随机误差项表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设。残差项指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的。它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系可有下式:4.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定?答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一
15、些基本的假定。只有在一系列的经典假定下,最小二乘估计量才是BLUE。5. 为什么在多元回归中要对可决系数进行修正?答:在样本容量一定下,随着模型中自变量个数的增加,可决系数会随之增加,模型的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,用修正的可决系数来判断增加自变量的合适性。6在多元线性回归中,对参数作了t检验后为什么还要作方差分析和F检验?答:t检验仅是对单个系数的显著性进行检验,由于自变量之间存在着较为复杂的关系,因此有必要对回归系数进行整体检验,方差分析和F检验就是对回归方程的整体统计显著性进行的检验方法。7.函数关系与相关关系有何不同? 答:(1)
16、函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的。可以在一定范围内变动;(2)函数关系变 量之间的依存可以用一定的方程y=f(x)表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示。函数关 系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系。8.什么是标准差和标准误差,两者有和差别?答:标准差作为随机误差 的代表,是随机误差绝对值的统计均值。在抽样试验(或重复的等精度测量) 中, 常用到样本平均数的标准差,亦称样本平均数的标准误或简称标准误。区别:标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密
17、度的衡量指标;而标准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小 ,是量度结果精密度的指标。第八章 时间序列分析与预测1.从要素分解的角度,时间序列可分解成哪四个要素? 答:一个时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。趋势:是时间序列在长时期内呈现出来的持续向上或持续向下的变动。季节变动:是时间序列在一年内重复出现的周期性波动。它是诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素影响的结果。循环波动:是时间序列呈现出得非固定长度的周期性变动。循环波动的周期可能会持续一段时间,但与趋势不同,它不是朝着单一方向的持续变动,而是涨落相同的交替波动。
18、不规则波动:是时间序列中除去趋势、季节变动和周期波动之后的随机波动。不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。只含有随机波动的序列也称为平稳序列。 2.什么是季节变动?测定季节变动的“趋势循环”剔除法的基本步骤和原理是什么? 答:季节变动是指客观现象因受自然因素或社会因素的影响,而形成的在一年内有规则的周期性变动。(P275) 步骤和原理:求出原数列中的趋势值或趋势-循环值;以原数列各项数值分别除以其对应的趋势值或趋势-循环值,目的是为了剔除数列中的趋势或趋势-循环因素 将剔除趋势或趋势-循环因素的数据,求其各年同期(月或季)的平均数,并使其平均为1得到季节
19、比率 调整季节比率(P277).3.测定季节变动的“原始资料平均法”的基本步骤和原理是什么? 答:A基本步骤1计算各年同期的平均数,为了消除各年同季数据的不规则变动2,计算全部数据的总平均数,找出整个数列的水平趋势3 计算季节指数 B原理是不考虑长期趋势影响,根据原始数据直接计算季节指数测定季节变动4.为什么平均发展速度要用几何平均法计算,计算平均发展速度的几何平均法的特点是什么? 答:现象发展的平均速度,一般用几何平均法计算。平均速度是总速度的平均,但现象发展的总速度不等于各年发展速度之和,而等于 各年环比发展速度的连乘积,所以求平均发展速度要用几何平均法。 几何平均法的实质是要求从最初水平
20、出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水平,这种方法可以只 根据最初水平与最末水平计算而不考虑中间水平的变化,其侧重点在于考虑最末一期发展水平。5.时间序列有哪些速度分析指标?他们之间的关系是什么?答:发展速度:报告期发展水平与基期发展水平之比,用于描述现象在观察期内的发展变化程度 增长速度:也称增长率,是增长量与基期水平之比,用于描述现象的相对增长程度。按照采用基期的不同,增长速度可分为定基增长速度与环比增长速度,两者之间没有直接的换算关系,在由环比增长速度推算定基增长速度时,可先将各环比增长速度加1后连乘,再将结果减1,即得定基增长速度 平均发展速度:各个时期环比发
21、展速度的平均数,用于描述现象在整个观察期内平均发展变化的程度 平均增长速度(平均增长率):用于描述现象在整个观察期内平均增长变化的程度,它通常用平均发展速度减1来求得第九章 统计指数 1.同度量因素固定的固定的一般原则?答:在编制数量指标指数时,用质量指标指数作为同度量因素,并把这个同度量因素固定在基期。在编制质量指标指数时,用数量指标做同度量因素,并且把这个同度量因素,并且把这个同度量因素固定在报告期。2.同度量因素的作用?答:不仅起着同度量的作用;同时还起着对指标“加权”的作用3.拉氏指数与帕氏指数同度量因素固定的原则?答:拉氏指数:以基期的质量指标作为同度量因素 帕氏指数:以报告期的数量
22、指标作为同度量因素4.指数体系的概念,用公式写出指数体系的两个涵义(相对数与绝对数涵义),指数体系有何作用?(P305) 答:广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数所结成的体系。狭义的指数体系仅指几个指数在一定的经济基础上所结成的较为严密的数量关系式。相对指标:相对指标又称相对数,是用两个有联系的指标进行对比的比值来反映社会经济现象数量特征和数量关系的综合指标。公式:相对数=总体中某一部分数值/总体全部数值X100% 绝对指标:统计中常用的总量指标就是绝对数。它是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标。公式:相对数=比较数值(比数)/基础数值(基数) 作用:因素分析,即分析现象的总变动中各有关因素的影响程度;指数推算,即根据已知的指数推算未知的指数