统计学(整理主要题目1).doc

资源描述

统计学考试题型 (单项选择题名词解释简答题计算题) 二。简答题 1. 简要区别描述统计与推断统计 P2 描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。 2. 一组数据的分布特征可以从哪几个方面进行测度?P94 （1）集中趋势:众数、平均值、中位数；(2）离散程度：方差、标准差、异众比率、四分位差、极差、平均差、离散系数；(3）数据分布的形状：偏态、峰态 3. 在列联分析中，简述统计量的计算步骤？P143 提出假设；观察频数，计算f0—fe;计算（f0—fe）平方；计算（f0—fe）平方/fe；计算X2=∑（f0-fe）平方/fe；统计决策:比较检验的临界值，若小于，不能拒绝原假设,若大于，则拒绝。 4. 简述单因素方差分析的基本步骤？P241 提出假设、构造检验的统计量（计算各样本均值；计算全部观测值的总均值;计算各误差平方和：总平方和SST、组间平方和SSA、组内平方和SSE;均方=平方和/自由度，计算统计量F=MSA/MSE～F(k—1,n—k）)、统计决策：大于，则拒绝；小于则不拒绝。 5. 简述双因素方差分析的基本步骤？P253 提出假设(分别对行因素和列因素提）；构造检验的统计量（分别确定检验行因素和列因素的统计量);统计决策（分别) 6. 简述方差分析的基本思路和原理?P237 为分析分类型自变量对数值型因变量的影响，需对数据误差来源的分析入手. 图形描述（散点图:均值连接而成的折线)，仅从散点图还不能提供充分的证据证明因变量之间有显著差异，需要有更准确的方法来检验，从而进行方差分析。而判断均值之间是否有差异需借助方差。同一总体下，样本的观测值不同，存在随机因素造成的随机误差（组内误差）；而不同总体之间的观测值也不同,存在组间误差。所以用方差分析来进行误差分析。原理：基本假定:每个总体都服从正态分布；各个总体方差相同;观测值是独立的。基于假定成立条件下，要分析自变量对因变量是否有影响，就转化为检验自变量的各个水平（总体）的均值是否相等。 7. 简述分布、t分布、F分布及正态分布之间的关系？第六章这三个分布都是由正态分布变形得到的，在实际中用来做假设检验。如果随机变量X服从t（n）分布,则X平方服从F（1，n）的F分布卡方分布用于总体方差的区间估计；t分布用于正态总体小样本且方差未知的均值区间估计；F分布用于两个总体方差比的区间估计。 8. 回归分析主要解决哪几方面的问题？P274 （1）从一组样本数据出发,确定变量之间的数学关系式； (2）对这些关系式的可信程度进行各种统计检验，并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的，哪些是不显著的； (3）利用所求的关系式，根据一个或几个变量的取值来估计或预测另一个特定变量的取值，并给出这种估计或预测的可靠程度。 9。回归分析与相关分析的区别? 1、在回归分析中，y被称为因变量；而在相关分析中，x与y处于平等的地位，即研究x与y的密切程度和研究y与x的密切程度是一致的； 2、相关分析中，x与y都是随机变量，而在回归分析中，y是随机变量，x可以是随机变量，也可以是非随机的,通常在回归模型中,总是假定x是非随机的； 3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小，还可以由回归方程进行数量上的预测和控制。 10.简述一元线性关系的检验步骤?P283 11．什么叫指数？指数有什么作用?+1 P363 指数，或称统计指数，是分析社会经济现象数量变化的一种重要统计方法.广义上讲，任何两个数值对比形成的相对数都可以称为指数;狭义上将，指数是用于测定多个项目在不同场合下综合变动的一种相对数. 作用：1、综合反映社会经济现象总变动方向及变动幅度2、分析现象总变动中各因素变动的影响方向及影响程度3、反映同类现象变动趋势。 12．简述回归系数b的检验步骤P306 提出假设。H0：=0；H1：=/0。计算检验的统计量t；做出统计决策。给定显著性水平，根据自由度=n—k-1，查t分布表。若绝对值大于，则拒绝;若小于，则不拒绝原假设。三.名词解释 1.拉氏价格指数：在计算一组商品价格指数时将作为权数的同度量因素（销售量)固定在基期计算的指数。 2.帕氏价格指数：在计算一组商品价格指数时将作为权数的同度量因素（销售量）固定在报告期计算的指数。 3.集中趋势:是指一组数据向某一中心值靠拢的程度，它反映了一组数据中心点的位置所在。 4。置信区间:由样本统计量所构造的总体参数的估计区间. 5.置信水平：也称为置信度或置信系数，它是将构造置信区间的步骤重复多次，置信区间中包含总体参数真值的次数所占的比例。 6。弃真错误：原假设为真却在检验中将原假设放弃,用“啊发错误”表示，啊发表示其概率。 7。取伪错误:原假设为伪却在检验中未拒绝原假设，用“贝塔错误"表示,贝塔表示其概率。 8。多重共线性：回归模型中两个或两个以上的自变量彼此相关. 9。趋势：时间序列在长期内呈现出某种持续向上或持续下降的变动,趋势可以是线性的，也可以是非线性的。 10.线性趋势: 11。回归方程：描述因变量y的期望值如何依赖于自变量x的方程。一元线性回归方程的形式为E(y）= + x. 12.最小二乘估计：使因变量的观察值yi与估计值yi^之间的离差平均和达到最小来估计贝塔0和贝塔1的方法，也称最小平方法. 13.判定系数：回归平方和占总平方和的比例，用R^2表示,它是对估计的回归方程拟合优度的度量。 14.估计标准误差：度量各实际观测点在直线周围的散布状况的一个统计量,是均方残差（MSE)的平方根，用Se表示. 15。残差:因变量的观测值yi与根据估计的回归方程求出的预测值yi^之差，用e表示。对于第i个观测值，残差为ei=yi—yi^. 16.拟合优度：是指回归直线对观测值的拟合程度.表达因变量与所有自变量之间的总体关系。 17．无偏性：估计量抽样分布的数学期望等于被估计的总体参数。 18．统计量：描述样本特征的概括性数字度量。 19．参数：用来描述总体特征的概括性数字度量，是研究者想要了解的总体的某种特征值。 20，异众比率：非众数组的频数占总频数的比例。 21,离散系数：也称变异系数，一组数据的标准差与其相应的平均数之比，是测度数据离散程度的相对值。 22、次序统计量：设有样本（X1、X2……Xn）,若有满足如下条件的函数:每当样本得到一组观测值x1、x2……xn时，其由小到大的排序x（1)<=x（2)……〈=x(i)〈=……<=x（n)中，第i个值x（i）就作为统计量X（i）的观测值，而X(1)、X（2）……X（n）称为次序统计量。 23、渐近分布：当样本量n趋于∞时,统计量T（X1、X2……、Xn）的极限分布。 24、有效性:对同一总体参数的两个无偏估计量，有更小标准差的估计量更有效。 25、峰度：测度峰态的统计量。峰态：对数据分布平峰或尖峰程度的测度。 26、偏度：测度偏态的统计量。偏态：对数据分布对称性的测度。附：27回归模型：描述因变量y如何依赖于自变量x和误差项的方程.只涉及一个自变量的一元线性回归模型可表示为y= + x+ 。 28。组内误差：来自水平内部的数据误差称为组内误差，用SSE表示。 29。组间误差：来自不同水平之间的数据误差称为组间误差，SSA。 30.系统误差：组间误差是随机误差和系统误差的总和。计算题:(找课本课后题练习） 1、利润额的平均数和标准差；分布的偏态系数和峰态系数 2、求置信区间+3（Z分布第6、7章)；求样本容量（要达到某比率需抽取多大样本) 3、比较两者间有无显著差异（给出了t分布，Sp平方的值) 4、问产品是否达到规定要求(X平方分布） 5、建立消费支出的回归直线；估计标准误差；计算判定系数，说明方程的拟合优度P303 6、抽样调查，比较分析哪组差异大 7、计算相关系数（P270）;回归方程；根据回归方程,某因素增加XX，某因素的变动情况 P287 8、总指数及因XX变动而增减的XX；指数及增减变动;从相对数和绝对数两方面验证某几个指数的相互关系。 P365 9、计算众数、中位数、四分位数、(P77第四章)平均数、标准差、峰态系数、偏态系数；对分布特征进行综合分析。 10、计算判定系数R平方（P249&281）和标准误差并分别解释其意义。 11、显著性检验P305

展开阅读全文