资源描述
统计学考试题型
(单项选择题 名词解释 简答题 计算题)
二。简答题
1. 简要区别描述统计与推断统计 P2
描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。
2. 一组数据的分布特征可以从哪几个方面进行测度?P94
(1)集中趋势:众数、平均值、中位数;(2)离散程度:方差、标准差、异众比率、四分位差、极差、平均差、离散系数;(3)数据分布的形状:偏态、峰态
3. 在列联分析中,简述统计量的计算步骤?P143
提出假设;观察频数,计算f0—fe;计算(f0—fe)平方;计算(f0—fe)平方/fe;计算X2=∑(f0-fe)平方/fe;统计决策:比较检验的临界值,若小于,不能拒绝原假设,若大于,则拒绝。
4. 简述单因素方差分析的基本步骤?P241
提出假设、构造检验的统计量(计算各样本均值;计算全部观测值的总均值;计算各误差平方和:总平方和SST、组间平方和SSA、组内平方和SSE;均方=平方和/自由度,计算统计量F=MSA/MSE~F(k—1,n—k))、统计决策:大于,则拒绝;小于则不拒绝。
5. 简述双因素方差分析的基本步骤?P253
提出假设(分别对行因素和列因素提);构造检验的统计量(分别确定检验行因素和列因素的统计量);统计决策(分别)
6. 简述方差分析的基本思路和原理?P237
为分析分类型自变量对数值型因变量的影响,需对数据误差来源的分析入手.
图形描述(散点图:均值连接而成的折线),仅从散点图还不能提供充分的证据证明因变量之间有显著差异,需要有更准确的方法来检验,从而进行方差分析。而判断均值之间是否有差异需借助方差。同一总体下,样本的观测值不同,存在随机因素造成的随机误差(组内误差);而不同总体之间的观测值也不同,存在组间误差。所以用方差分析来进行误差分析。原理:基本假定:每个总体都服从正态分布;各个总体方差相同;观测值是独立的。基于假定成立条件下,要分析自变量对因变量是否有影响,就转化为检验自变量的各个水平(总体)的均值是否相等。
7. 简述分布、t分布、F分布及正态分布之间的关系? 第六章
这三个分布都是由正态分布变形得到的,在实际中用来做假设检验。
如果随机变量X服从t(n)分布,则X平方服从F(1,n)的F分布
卡方分布用于总体方差的区间估计;t分布用于正态总体小样本且方差未知的均值区间估计;F分布用于两个总体方差比的区间估计。
8. 回归分析主要解决哪几方面的问题?P274
(1)从一组样本数据出发,确定变量之间的数学关系式;
(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;
(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
9。回归分析与相关分析的区别?
1、在回归分析中,y被称为因变量;而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;
2、相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;
3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。
10.简述一元线性关系的检验步骤?P283
11.什么叫指数?指数有什么作用?+1 P363
指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法.广义上讲,任何两个数值对比形成的相对数都可以称为指数;狭义上将,指数是用于测定多个项目在不同场合下综合变动的一种相对数.
作用:1、综合反映社会经济现象总变动方向及变动幅度2、分析现象总变动中各因素变动的影响方向及影响程度3、反映同类现象变动趋势。
12.简述回归系数b的检验步骤P306
提出假设。H0:=0;H1:=/0。计算检验的统计量t;做出统计决策。给定显著性水平,根据自由度=n—k-1,查t分布表。若绝对值大于,则拒绝;若小于,则不拒绝原假设。
三.名词解释
1.拉氏价格指数:在计算一组商品价格指数时将作为权数的同度量因素(销售量)固定在基期计算的指数。
2.帕氏价格指数:在计算一组商品价格指数时将作为权数的同度量因素(销售量)固定在报告期计算的指数。
3.集中趋势:是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
4。置信区间:由样本统计量所构造的总体参数的估计区间.
5.置信水平:也称为置信度或置信系数,它是将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例。
6。弃真错误:原假设为真却在检验中将原假设放弃,用“啊发错误”表示,啊发表示其概率。
7。取伪错误:原假设为伪却在检验中未拒绝原假设,用“贝塔错误"表示,贝塔表示其概率。
8。多重共线性:回归模型中两个或两个以上的自变量彼此相关.
9。趋势:时间序列在长期内呈现出某种持续向上或持续下降的变动,趋势可以是线性的,也可以是非线性的。
10.线性趋势:
11。回归方程:描述因变量y的期望值如何依赖于自变量x的方程。一元线性回归方程的形式为E(y)= + x.
12.最小二乘估计:使因变量的观察值yi与估计值yi^之间的离差平均和达到最小来估计贝塔0和贝塔1的方法,也称最小平方法.
13.判定系数:回归平方和占总平方和的比例,用R^2表示,它是对估计的回归方程拟合优度的度量。
14.估计标准误差:度量各实际观测点在直线周围的散布状况的一个统计量,是均方残差(MSE)的平方根,用Se表示.
15。残差:因变量的观测值yi与根据估计的回归方程求出的预测值yi^之差,用e表示。对于第i个观测值,残差为ei=yi—yi^.
16.拟合优度:是指回归直线对观测值的拟合程度.表达因变量与所有自变量之间的总体关系。
17.无偏性:估计量抽样分布的数学期望等于被估计的总体参数。
18.统计量:描述样本特征的概括性数字度量。
19.参数:用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
20,异众比率:非众数组的频数占总频数的比例。
21,离散系数:也称变异系数,一组数据的标准差与其相应的平均数之比,是测度数据离散程度的相对值。
22、次序统计量:设有样本(X1、X2……Xn),若有满足如下条件的函数:每当样本得到一组观测值x1、x2……xn时,其由小到大的排序x(1)<=x(2)……〈=x(i)〈=……<=x(n)中,第i个值x(i)就作为统计量X(i)的观测值,而X(1)、X(2)……X(n)称为次序统计量。
23、渐近分布:当样本量n趋于∞时,统计量T(X1、X2……、Xn)的极限分布。
24、有效性:对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。
25、峰度:测度峰态的统计量。峰态:对数据分布平峰或尖峰程度的测度。
26、偏度:测度偏态的统计量。偏态:对数据分布对称性的测度。
附:27回归模型:描述因变量y如何依赖于自变量x和误差项的方程.只涉及一个自变量的一元线性回归模型可表示为y= + x+ 。
28。组内误差:来自水平内部的数据误差称为组内误差,用SSE表示。
29。组间误差:来自不同水平之间的数据误差称为组间误差,SSA。
30.系统误差:组间误差是随机误差和系统误差的总和。
计算题:(找课本课后题练习)
1、 利润额的平均数和标准差;分布的偏态系数和峰态系数
2、 求置信区间+3(Z分布第6、7章);求样本容量(要达到某比率需抽取多大样本)
3、 比较两者间有无显著差异(给出了t分布,Sp平方的值)
4、 问产品是否达到规定要求(X平方分布)
5、 建立消费支出的回归直线;估计标准误差;计算判定系数,说明方程的拟合优度P303
6、 抽样调查,比较分析哪组差异大
7、 计算相关系数(P270);回归方程;根据回归方程,某因素增加XX,某因素的变动情况 P287
8、 总指数及因XX变动而增减的XX;指数及增减变动;从相对数和绝对数两方面验证某几个指数的相互关系。 P365
9、 计算众数、中位数、四分位数、(P77第四章)平均数、标准差、峰态系数、偏态系数;对分布特征进行综合分析。
10、 计算判定系数R平方(P249&281)和标准误差并分别解释其意义。
11、 显著性检验P305
展开阅读全文