资源描述
统计学复习
第一章
1。“统计”的三个涵义:统计工作、统计资料、统计学
2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系;
统计资料和统计学是实践与理论的关系
3。统计学的特点:数量性,总体性,具体性,社会性(广泛性)
4。统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段
5。总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。)
6。标志:总体单位所具有的属性或特征。
A品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩
B数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高
指标:反映社会经济现象总体数量特征的概念及其数值。
指标名称体现事物质的规定性,指标数值体现事物量的规定性
统计报表
专门调查
普查
抽样调查
典型调查
重点调查
按调查的组织方式不同分为
按调查时间是否连续分为
按调查单位的范围大小分为
全面调查
非全面调查
一次性调查
经常性调查
第二章
1.统计调查种类
2。统计调查方案包括六项基本内容:
1)确定调查目的;(为什么调查)
2)确定调查对象与调查单位;(向谁调查)
调查对象——社会现象的总体
调查单位——调查标志的承担者(总体单位)
填报单位-—报告调查内容,提交统计资料
3)确定调查项目、拟定调查表格;(调查什么)
4)确定调查时间和调查期限
5)制定调查的组织实施计划;
6)选择调查方法。
3.调查问卷的结构主要由封面信、指导语、问题与答案、编码等几个部分组成
4.统计调查的组织形式:普查、抽样调查、重点调查、典型调查、统计报表制度
5.分组标志选择的依据:
1) 根据研究问题的目的来选择
2) 要根据最能反映被研究现象本质特征的标志作为分组标志
3) 要结合现象所处的具体历史条件或经济条件来选择
6。统计分组的方法有:
简单分组——只按一个标志进行分组
复合分组——选择两个或两个以上标志层叠起来进行分组
分组体系——采用一系列相互联系、相互补充的标志对现象进行多种分组
7.分配数列是统计分组的一种重要形式,它可以反映总体的结构分布状况和分布特征。构成要素为标志的具体表现、次数和频率。
例: 某班学生的性别构成情况
按性别分组
绝对数人数
分
类
变量数列
品质数列
异距数列
等距数列
组距数列
单项数列
比重(%)
男
女
30
10
75
25
合计
40
100
标志 次数 频率
8.组中值(计算题)
组中值=(上限+下限)/2
缺上限的开口组组中值=下限+邻组组距/2
缺下限的开口组组中值=上限—邻组组距/2
第三章
1。总类指标的种类划分:
根据其反映的内容不同,分为总体单位总量(总数)和总体标志总量(总额).
根据其反映的时间状况不同,分为时期指标(商品销售额)和时点指标(商品库存额)。
2。相对指标的种类和计算
★计划完成相对指标的计算
A.计划任务数表现为绝对数时
1)短期计划完成情况的检查
⑴ 计划数与实际数同期时,直接应用公式:
⑵ 考察计划执行进度情况:
2)长期计划完成情况的检查
(1)累计法:计划指标按计划期内各年的总和规定任务
(2)水平法:计划指标按计划末期应达到的水平规定任务
B. 计划任务数表现为相对数时
★ 另外五种相对指标的区别:
1)结构相对指标:用来分析现象总体的内部构成状况。
2)比例相对指标:用来反映组与组之间的联系程度或比例关系.
3) 比较相对指标:用来说明现象发展的不均衡程度。
4)强度相对指标:用来表明现象的强度、密度和普遍程度。
5)动态相对指标:用来反映现象的数量在时间上的变动程度。
3.算术平均数、调和平均数、几何平均数三个数值平均数的计算:
A算术平均数的基本形式
简单算术平均数:
加权算术平均数:
B调和平均数:将各标志值倒数,算术平均数计算,再倒数
简单调和平均数:
加权调和平均数:
调和平均数的运用(其中m是特定权数,不是各组变量值
出现的次数而是各组标志总量)→
★ 求解比值平均数的方法:
比值
由于比值(平均数或相对数)不能直接相加,求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比。
C几何平均数(平均比率和平均速度)是N项变量值连乘积的开N次方根
简单几何平均数——适用于总体资料未经分组整理尚为原始资料的情况
加权几何平均数-—适用于总体资料经过分组整理形成变量数列的情况
4.众数和中位数的含义
众数M0:指总体中出现次数最多的变量值,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平
中位数Me:总体各单位标志值按大小顺序排列后,处数列中间位置的标志值
数值平均数计算公式的选用顺序
算术平均法
求解比值的平均数的方法
是
几何平均法
几何平均法
各个比率或速度的连乘积是否等于总比率或总速度
否
是
否
是否为其它比值
其他比值
否
是否为比率或速度
是
指标
5.正确运用平均指标的原则(简答题)
1)平均指标只能运用于同质总体。只有在同质总体中,总体各单位才具有共同的特征,从而才能计算它们的平均数来反映现象的一般水平。
2)用组平均数补充说明总平均数。通过计算组平均数对总平均数作补充说明,来揭示现象内部结构组成的影响,从而克服认识上的片面性。
3)用分配数列补充说明平均数。平均数只是说明现象的共性,为了比较深入地说明问题,还要结合原来的分配数列进行分析。
6.简单标准差和方差的计算(其中某个数值改变,标准差和方差如何改变,改变多少?)
简单标准差-适用于未分组资料
简便公式
第四章
1.动态数列的两个基本构成要素:一是资料所属的时间,另一个是各时间上的统计指标数值。
2.动态数列的总类
1)绝对动态数列:时期数列+时点数列
2)相对动态数列
3)平均数动态数列
3.动态数列的编制原则(简答题)
q 时期长短应该统一
q 总体范围应该统一
q 指标的经济内容应该相同
q 计算口径应该统一
4。反映动态数列水平(现象发展水平)的指标有:发展水平、平均发展水平、增长量、平均增长量。(计算题)
序时平均方法
总量指标
时期数列
简单算术平均
时点数列
连续时点
连续变动
简单算术平均
非连续变动
加权算术平均
间断时点
间隔相等
简单序时平均
间隔不等
加权序时平均
相对指标、平均指标
视情况选用:先平均再相除、先加总再相除、加权算术平均、加权调和平均等
★平均发展水平的计算
★增长量的计算指报告期水平与基期水平之差。
逐期增长量
累计增长量
年距增长量:本期发展水平与去年同期水平之差,目的是消除季节变动的影响
逐期增长量与累计增长量的关系是:逐期增长量之和等于累计增长量
★平均增长量的计算即逐期增长量的序时平均数.
5反映国民经济速度的主要指标有:发展速度和增长速度,平均发展速度和平均增长速度。(计算题)
1) 发展速度指报告期水平与基期水平的比值,说明现象的变动程度
环比发展速度
定基发展速度
环比发展速度与定基发展速度的关系:
u 定基发展速度等于环比发展速度的连乘积.
u 两个相邻时期的定基发展速度之比,等于它们的环比发展速度.
年距发展速度是报告期发展水平与上年同期发展水平之比。
2)增长速度指增长量与基期水平的比值,说明报告期水平较基期水平增长的程度
增长速度与发展速度直接的关系:
注:发展速度大于1,则增长速度为正值,说明社会经济现象增长的程度时用“增加了”表示;反之,发展速度小于1,则增长速度为负值,说明社会经济现象降低的程度时用“降低了”表示。
q 发展速度与增长速度性质不同。前者是动态相对数,后者是强度相对数;
q 定基增长速度与环比增长速度之间没有直接的换算关系。
环比增长速度
定基增长速度
年距增长速度
3) 平均发展速度的计算(几何平均法侧重点是最末水平)
4)
平均增长速度的计算(说明现象逐期增长的平均程度)
计算步骤:计算递增或是递减速度;计算总发展速度;查表。
6。最小平方法的计算(针对线性方程):过数学方法对时间数列配合一条理想的趋势方程 ,使其与原数列曲线达到最优拟合。
1)趋势方程必须满足最基本的要求,即原有数列的实际数值与趋势方程的估计数值的离差平方之和为最小。
7.季节比率的特点
月资料的季节比率之和应等于1200%,季资料的季节比率之和应等于400%
季节比率近似100%,说明不存在季节变动,季节比率明显大于或小于100%,则该现象存在季节比率。
第五章
1。指数的种类
1)按照说明对象的范围不同,分为个体指数和总指数
2)按照统计指标的内容不同,分为数量指标指数和质量指标指数
3)按照指数表达形式不同,可分为综合指数、平均指标指数和平均指标对比指数
4) 按照指数所说明的因素多少,可分为两因素指数和多因素指数
5)按照在一个指数数列中所采用的基期不同,指数可分为定基指数和环比指数
2.综合指数(计算题)
结论:在综合指数中,编制质量指标指数往往用报告期数量指标作同度量因素较好。
综合考虑同度量因素、研究目的、资料等问题,在实际应用中通常用基期质量指标(价格)作同度量因素来计算数量指标综合指数;而用报告期数量指标(销售量)作同度量因素来计算质量指标综合指数.
3。平均指标指数(加权算术平均数指数的公式形式+特征)
指数名称
综合指数
公式
加权算术
平均指数公式
数量指标
总指数
质量指标
总指数
4。平均指标对比指数是两个平均指标在不同时间上对比的相对指标指数(计算题)
一般公式:
5.指数体系(计算指数—建体系—分析)
综合指数体系的一般形式:
总量动态指标=数量指标指数*质量指标指数
6。指数体系中的因素推算。(例题236页第3题)
第六章
1。抽样平均误差(计算题)
抽样平均误差概念:指样本指标与总体指标之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差.
注:偏差在进行抽样调查时应该设法避免,它不属于抽样误差。
抽样误差就是指随机误差。
抽样平均数的抽样平均误差
重复抽样抽样平均数的抽样平均误差
不重复抽样抽样平均数的抽样平均误差
2.影响抽样评价误差的因素:
1)全及总体标志的变动程度
2)抽样单位数的多少
3)抽样组织的方式
3.全及指标的推断(计算题) △=tu
抽样平均误差u表明抽样估计的准确度;抽样极限误差△表明抽样估计准确程度的范围,t为置信度。
T=1 概率68。27% T=2 概率95.45% T=3 概率99。73% T=1.96 概率 95%
4。抽样调查的组织形式
n 简单随机抽样(纯随机抽样)
n 类型抽样(分层抽样)
n 等距抽样(机械抽样或系统抽样)
n 整群抽样(集团抽样)
n 多阶段抽样
5.必要抽样单位数的确定(计算n)最终算的n取零整
6。确定单位抽样数的依据
首先,决定于调查者对一项抽样推断的可靠程度和精确程度的要求。
其次,抽样单位数决定于总体标志的变异程度。
再次,抽样单位数决定于不同的抽样组织方法。
最后,还要结合调查的人力、物力和财力等情况。
第七章
1.相关系数的密切程度 相关系数r的取值范围:—1≤r≤1
r>0 为正相关,r < 0 为负相关;
|r|=0 表示不存在线性关系;
|r|=1 表示完全线性相关;
0<|r|<1表示存在不同程度线性相关:
0.3 ≤ |r| < 0.5 为低度线性相关;
0.5≤ |r| <0.8为显著性线性相关;
0.8≤|r| <1.0为高度显著性线性相关。
2。直线回归分析 (课本359页)
展开阅读全文