1、统计学各章计算题公式及解题方法 统计学各章计算题公式及解题方法 第四章 数据的概括性度量 1. 组距式数值型数据众数的计算:确定众数组后代入公式计算: 下限公式:;上限公式:,其中,L为众数所在组下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距 2. 中位数位置的确定:未分组数据为;组距分组数据为 3. 未分组数据中位数计算公式: 4. 单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位数所在的组-对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布) 5. 组距
2、式数列的中位数计算公式: 下限公式:;上限公式:,其中,为中位数所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的累积频数 6. 四分位数位置的确定: 未分组数据:;组距分组数据: 7. 简单均值: 8. 加权均值:,其中,为各组组中值 9. 几何均值(用于计算平均发展速度): 10. 四分位差(用于衡量中位数的代表性): 11. 异众比率(用于衡量众数的代表性): 12. 极差:未分组数据:;组距分组数据: 13. 平均差(离散程度):未分组数据:;组距分组数据: 14. 总体方差:未分组数据:;分组数据: 15. 总体标准差:未分组数据:;分组数
3、据: 16. 样本方差:未分组数据:;分组数据: 17. 样本标准差:未分组数据:;分组数据: 18. 标准分数: 19. 离散系数: 第七章 参数估计 1. 的估计值: 置信水平 α 90% 0。1 0。05 1。654 95% 0.05 0。025 1。96 99% 0。01 0.005 2.58 2. 不同情况下总体均值的区间估计: 总体分布 样本量 σ已知 σ未知 正态分布 大样本(n≥30) 小样本(n〈30) 非正态分布 大样本(n≥30) 其中,查p448 ,查找时需查n-1的数值 3
4、 大样本总体比例的区间估计: 4. 总体方差在置信水平下的置信区间为: 5. 估计总体均值的样本量:,其中,E为估计误差 6. 重复抽样或无限总体抽样条件下的样本量:,其中π为总体比例 第八章 假设检验 1. 总体均值的检验(已知或未知的大样本)[总体服从正态分布,不服从正态分布的用正态分布近似] 假设 双侧检验 左侧检验 右侧检验 假设形式 统计量 已知 未知 拒绝域 值决策 ,拒绝 2. 总体均值检验(未知,小样本,总体正态分布) 假设 双侧检验 左侧检验 右侧检验 假设形式
5、 统计量 已知 未知 拒绝域 值决策 ,拒绝 注:已知的拒绝域同大样本 3. 一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中为假设的总体比例) 假设 双侧检验 左侧检验 右侧检验 假设形式 统计量 拒绝域 值决策 ,拒绝 4. 总体方差的检验(检验) 假设 双侧检验 左侧检验 右侧检验 假设形式 统计量 拒绝域 值决策 ,拒绝 5. 统计量的参考数值 0.1 0。05 0。01 双侧检验 1.65
6、 1。96 2。58 单侧检验 1。28 2。65 2.33 第九章 列联分析 1. 期望频数的分布(假定行变量和列变量是独立的) 一个实际频数 的期望频数 ,是总频数的个数乘以该实际频数 落入第行 和第j列的概率,即: 2. 统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的相关程度,为列联表中第i行 第j列的实际频数,为列联表中第i行 第j列的期望频数 1) 检验多个比例是否相等 检验的步骤 提出假设H0:p1 = p2 = … = pj;H1: p 1 , p2 , …,pj 不全相等;计算检验的统计量;进行决策:根据显著性水平a和自由度
7、r—1)(c-1)查出临界值,若c2〉,拒绝H0;若c2〈,不拒绝H0 2) 利用样本数据检验总体比例是否等于某个数值 检验的步骤 提出假设H0:p1 = ,p2 = ,… ;H1:原假设的等式中至少有一个不成立;计算检验的统计量;进行决:根据显著性水平a和自由度(r—1)(c-1)查出临界值ca2;若c2〉,拒绝H0;若c2<,不拒绝H0 3) 检验列联表中的行变量与列变量之间是否独立 检验的步骤 提出假设H0:行变量与列变量独立;H1:行变量与列变量不独立;计算检验的统计量;进行决策:根据显著性水平a和自由度(r—1)(c-1)查出临界值,若c2³,拒绝H0;若c2〈,不拒绝
8、H0 3. j 相关系数:测度2´2列联表中数据相关程度;对于2´2 列联表,j 系数的值在0~1之间 ,其中,n为实际频数总个数,即样本容量 4. 列联相关系数(C系数)用于测度大于2´2列联表中数据的相关程度 ,其中,C 的取值范围是 0C<1;C = 0表明列联表中的两个变量独立;C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较 5. V相关系数 ,其中,V 的取值范围是 0≤V≤1; V = 0表明列联表中的两个变量独立;V=1表明列联表中的两个变量完全相关;不同行和列的列联表计算的列联系数不便于比
9、较;当列联表中有一维为2,min[(r—1),(c—1)]=1,此时V= 第十章 方差分析 1. 单因素方差分析的要点: 1) 建立假设的表述方法: ,自变量对因变量没有显著影响 不全相等,自变量对因变量有显著影响 2) 决策: i. 根据给定的显著性水平,在F分布表中查找与第一自由度、第二自由 相应的临界值 ii. 若F〉,则拒绝原假设,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响 iii. 若F〈,则不拒绝原假设,不能认为所检验的因素对观察值有显著影响 3) 单因素方差分析表的结构: 2. 方差分析中的多重比较(步骤):采用Fisher提出的最小显著差
10、异方法,简写为LSD 1) 提出假设: (第个总体的均值等于第个总体的均值) (第个总体的均值不等于第个总体的均值) 2) 计算检验统计量: 3) 计算LSD: 4) 决策: 若,则拒绝;若,则不拒绝 3. 双因素方差分析: 1) 无交互作用的双因素方差分析表结构: 2) 有交互作用的双因素方差分析表结构: 4. 关系强度测量:变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映,根据平方根R进行判断 第十一章 一元线性回归 1. 样本的相关系数: 2. 相关系数的显著性检验步骤: 1) 提出假设: 2)
11、 计算检验统计量: 3) 确定并决策:,拒绝;,不拒绝 3. 一元回归模型: 4. 一元线性回归方程形式:,其中是直线方程在y轴上的截距,是当=0时,y的期望值;是直线的斜率,称为回归系数,表示当每变动一个单位时y的平均变动值 5. 一元线性回归中,估计的回归方程:,其中是估计的回归直线在y轴上的截距,是直线的斜率,它表示对于一个给定的的值,是y的估计值,表示当每变动一个单位时y的平均变动值 6. 根据最小二乘法求以及的公式: 7. 误差平方和之间的关系:,即: 8. 判定系数(回归平方和占离差平方和的比例): 9. 估计标准误差(实际观察值与回归估计值离差平方和的均方根)
12、 10. 线性关系的显著性检验: 1) 提出假设:,线性关系不显著;,有线性关系 2) 计算检验统计量: 3) 确定显著性水平,并根据分子自由度1和分母自由度n—2找出临界值 4) 决策:若,拒绝;,不拒绝 11. 回归系数的显著性检验: 1) 提出假设:,线性关系不显著;,有线性关系 2) 计算检验统计量: 3) 确定显著性水平并决策:若; 12. 置信区间估计:在置信水平下的置信区间: 其中,为估计标准误差,为的自由度 13. 预测区间估计:在置信水平下的预测区间: 14. 回归分析表的结构: 15. 几点说明: 1) 判定系数测度了回归直线对
13、观测数据的拟合程度,若所有观测点都落在直线上,残差平方和SSE=0,=1,拟合是完全的 2) 在一元线性回归中,相关系数r实际上是判定系数的平方根 3) 相关系数r与回归系数是同号的 第十三章 时间序列预测和分析 1. 环比增长率:报告期增长率与前一期水平之比减1: 2. 定基增长率:报告期水平与某一固定时期水平之比减1 ,其中,表示用于对比的固定基期的观察值 3. 平均增长率:序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果(描述现象在整个观察期内平均增长变化的程度) 1) 当时间序列中的观察值出现0或负数时,不宜计算增长率 2) 在有些情况下,不宜
14、单纯就增长率论增长率,要注意增长率与绝对水平的结合分析 4. 时间序列预测的步骤: 1) 确定时间序列所包含的成分,也就是确定时间序列的类型 2) 找出适合此类时间序列的预测方法 3) 对可能的预测方法进行评估,以确定最佳预测方案 4) 利用最佳预测方案进行预测 5. 均方误差:通过平方消去正负号后计算的平均误差,用MSE表示 6. 简单平均法:根据过去已有的t期观察值来预测下一期数值。设时间序列已有的其观察值为则期的预测值为: 有了的实际值,则预测误差为: 期的预测值为: 7. 简单移动平均法:将最近k期的数据加以平均,作为下一期的预测值 设移动间隔为k(1
15、 16、于描述以几何级数递增或递减的现象
1) 一般形式:, a、b为未知常数,若b>1,增长率随着时间t的增加而增加,若b<1,增长率随着时间t的增加而降低,若a〉0,b<1,趋势值逐渐降低到以0为极限
2) 将一般形式转换为对数直线形式,由最小二乘法求得:
3) 求出及,取反对数
11. 修正指数曲线:描述初期增长迅速,随后增长率逐渐降低,最终则K为增长极限现象
1) 一般形式:, K、a、b 为未知常数,K>0,a≠0,0〈b≠1
2) 趋势值K无法事先确定时采用;将时间序列观察值等分为三个部分,每部分有m个时期;令趋势值的三个局部总和分别等于原序列观察值的三个局部总和
i. 17、 设观察值的三个局部总和分别为:,;;
ii. 根据三和法求得:
12. Gompertz曲线:描述初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平线现象
1) 一般形式:,K、a、b为未知常数;K〉0,0〈a≠1,0
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818