1、统计学各章计算题公式及解题方法统计学各章计算题公式及解题方法第四章 数据的概括性度量1. 组距式数值型数据众数的计算:确定众数组后代入公式计算:下限公式:;上限公式:,其中,L为众数所在组下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距2. 中位数位置的确定:未分组数据为;组距分组数据为3. 未分组数据中位数计算公式:4. 单变量数列的中位数:先计算各组的累积次数(或累积频率)根据位置公式确定中位数所在的组-对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布)5. 组距式数列的中位数计算公式: 下限公式
2、:;上限公式:,其中,为中位数所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的累积频数6. 四分位数位置的确定:未分组数据:;组距分组数据:7. 简单均值:8. 加权均值:,其中,为各组组中值9. 几何均值(用于计算平均发展速度):10. 四分位差(用于衡量中位数的代表性):11. 异众比率(用于衡量众数的代表性):12. 极差:未分组数据:;组距分组数据:13. 平均差(离散程度):未分组数据:;组距分组数据:14. 总体方差:未分组数据:;分组数据:15. 总体标准差:未分组数据:;分组数据:16. 样本方差:未分组数据:;分组数据:17. 样本标准差:未分组数据:;分
3、组数据:18. 标准分数:19. 离散系数:第七章 参数估计1. 的估计值:置信水平900。10。051。654950.050。0251。9699%0。010.0052.582. 不同情况下总体均值的区间估计:总体分布样本量已知未知正态分布大样本(n30)小样本(n30)非正态分布大样本(n30)其中,查p448 ,查找时需查n-1的数值3. 大样本总体比例的区间估计:4. 总体方差在置信水平下的置信区间为:5. 估计总体均值的样本量:,其中,E为估计误差6. 重复抽样或无限总体抽样条件下的样本量:,其中为总体比例第八章 假设检验1. 总体均值的检验(已知或未知的大样本)总体服从正态分布,不服
4、从正态分布的用正态分布近似假设双侧检验左侧检验右侧检验假设形式统计量已知未知拒绝域值决策,拒绝2. 总体均值检验(未知,小样本,总体正态分布)假设双侧检验左侧检验右侧检验假设形式统计量已知未知拒绝域值决策,拒绝注:已知的拒绝域同大样本3. 一个总体比例的检验(两类结果,总体服从二项分布,可用正态分布近似)(其中为假设的总体比例)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝4. 总体方差的检验(检验)假设双侧检验左侧检验右侧检验假设形式统计量拒绝域值决策,拒绝5. 统计量的参考数值0.10。050。01双侧检验1.651。962。58单侧检验1。282。652.33第九章 列联分
5、析1. 期望频数的分布(假定行变量和列变量是独立的)一个实际频数 的期望频数 ,是总频数的个数乘以该实际频数 落入第行 和第j列的概率,即:2. 统计量(用于检验列联表中变量间拟合优度和独立性;用于测定两个分类变量之间的相关程度,为列联表中第i行 第j列的实际频数,为列联表中第i行 第j列的期望频数1) 检验多个比例是否相等检验的步骤提出假设H0:p1 = p2 = = pj;H1: p 1 , p2 , ,pj 不全相等;计算检验的统计量;进行决策:根据显著性水平a和自由度(r1)(c-1)查出临界值,若c2,拒绝H0;若c2,不拒绝H02) 利用样本数据检验总体比例是否等于某个数值检验的步
6、骤提出假设H0:p1 = ,p2 = , ;H1:原假设的等式中至少有一个不成立;计算检验的统计量;进行决:根据显著性水平a和自由度(r1)(c-1)查出临界值ca2;若c2,拒绝H0;若c2,不拒绝H03) 检验列联表中的行变量与列变量之间是否独立检验的步骤提出假设H0:行变量与列变量独立;H1:行变量与列变量不独立;计算检验的统计量;进行决策:根据显著性水平a和自由度(r1)(c-1)查出临界值,若c2,拒绝H0;若c2,不拒绝H03. j 相关系数:测度22列联表中数据相关程度;对于22 列联表,j 系数的值在01之间 ,其中,n为实际频数总个数,即样本容量4. 列联相关系数(C系数)用
7、于测度大于22列联表中数据的相关程度,其中,C 的取值范围是 0C1;C = 0表明列联表中的两个变量独立;C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大;根据不同行和列的列联表计算的列联系数不便于比较5. V相关系数,其中,V 的取值范围是 0V1; V = 0表明列联表中的两个变量独立;V=1表明列联表中的两个变量完全相关;不同行和列的列联表计算的列联系数不便于比较;当列联表中有一维为2,min(r1),(c1)=1,此时V=第十章 方差分析1. 单因素方差分析的要点:1) 建立假设的表述方法: ,自变量对因变量没有显著影响不全相等,自变量对因变量有显著影响2) 决策:
8、i. 根据给定的显著性水平,在F分布表中查找与第一自由度、第二自由 相应的临界值ii. 若F,则拒绝原假设,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响iii. 若F,则不拒绝原假设,不能认为所检验的因素对观察值有显著影响3) 单因素方差分析表的结构:2. 方差分析中的多重比较(步骤):采用Fisher提出的最小显著差异方法,简写为LSD1) 提出假设:(第个总体的均值等于第个总体的均值)(第个总体的均值不等于第个总体的均值)2) 计算检验统计量:3) 计算LSD:4) 决策:若,则拒绝;若,则不拒绝3. 双因素方差分析:1) 无交互作用的双因素方差分析表结构:2) 有交互作用的
9、双因素方差分析表结构:4. 关系强度测量:变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映,根据平方根R进行判断第十一章 一元线性回归1. 样本的相关系数:2. 相关系数的显著性检验步骤:1) 提出假设:2) 计算检验统计量:3) 确定并决策:,拒绝;,不拒绝3. 一元回归模型:4. 一元线性回归方程形式:,其中是直线方程在y轴上的截距,是当=0时,y的期望值;是直线的斜率,称为回归系数,表示当每变动一个单位时y的平均变动值5. 一元线性回归中,估计的回归方程:,其中是估计的回归直线在y轴上的截距,是直线的斜率,它表示对于一个给定的的值,是y的
10、估计值,表示当每变动一个单位时y的平均变动值6. 根据最小二乘法求以及的公式:7. 误差平方和之间的关系:,即:8. 判定系数(回归平方和占离差平方和的比例):9. 估计标准误差(实际观察值与回归估计值离差平方和的均方根): 10. 线性关系的显著性检验:1) 提出假设:,线性关系不显著;,有线性关系2) 计算检验统计量:3) 确定显著性水平,并根据分子自由度1和分母自由度n2找出临界值4) 决策:若,拒绝;,不拒绝11. 回归系数的显著性检验:1) 提出假设:,线性关系不显著;,有线性关系2) 计算检验统计量:3) 确定显著性水平并决策:若;12. 置信区间估计:在置信水平下的置信区间: 其
11、中,为估计标准误差,为的自由度13. 预测区间估计:在置信水平下的预测区间: 14. 回归分析表的结构:15. 几点说明:1) 判定系数测度了回归直线对观测数据的拟合程度,若所有观测点都落在直线上,残差平方和SSE=0,=1,拟合是完全的2) 在一元线性回归中,相关系数r实际上是判定系数的平方根3) 相关系数r与回归系数是同号的第十三章 时间序列预测和分析1. 环比增长率:报告期增长率与前一期水平之比减1:2. 定基增长率:报告期水平与某一固定时期水平之比减1,其中,表示用于对比的固定基期的观察值3. 平均增长率:序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果(描述现象在整个
12、观察期内平均增长变化的程度)1) 当时间序列中的观察值出现0或负数时,不宜计算增长率2) 在有些情况下,不宜单纯就增长率论增长率,要注意增长率与绝对水平的结合分析4. 时间序列预测的步骤:1) 确定时间序列所包含的成分,也就是确定时间序列的类型2) 找出适合此类时间序列的预测方法3) 对可能的预测方法进行评估,以确定最佳预测方案4) 利用最佳预测方案进行预测5. 均方误差:通过平方消去正负号后计算的平均误差,用MSE表示6. 简单平均法:根据过去已有的t期观察值来预测下一期数值。设时间序列已有的其观察值为则期的预测值为:有了的实际值,则预测误差为:期的预测值为:7. 简单移动平均法:将最近k期
13、的数据加以平均,作为下一期的预测值设移动间隔为k(11,增长率随着时间t的增加而增加,若b1,增长率随着时间t的增加而降低,若a0,b0,a0,0b12) 趋势值K无法事先确定时采用;将时间序列观察值等分为三个部分,每部分有m个时期;令趋势值的三个局部总和分别等于原序列观察值的三个局部总和i. 设观察值的三个局部总和分别为:,;ii. 根据三和法求得: 12. Gompertz曲线:描述初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平线现象1) 一般形式:,K、a、b为未知常数;K0,0a1,0b12) 求解系数方法:i. 将其改写为对数形式:ii. 仿照修正指数曲线的常数确定方法,求出、b;取和的反对数求得和令:,,则有:第十四章 指数1. 简单综合指数:(误差太大)(质量指标);(数量指标)2. 加权综合指数:1) 拉氏数量指标指数(同度量因素固定在基期): 2) 帕氏质量指标指数(同度量因素固定在报告期):3. 指数体系:式中为报告期总量指标,为基期总量指标,q为数量指标,p为质量指标 因素影响差额之间的关系:4. 居民消费价格指数:,式中代表规格品个体指数或各层的类指数,为相应的消费支出比重5. 股票价格指数:11
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100