资源描述
中级经济基础知识 基础精讲班
第四部分 统计
包括五章:
第21章 统计与统计数据
第22章 抽样调查
第23章 相关与回归分析
第24章 时间序列
第25章 统计指数
近五年的分值均为21分(包括11题单选11分,5题多选10分)
第二十一章 统计与统计数据
本章基本内容框架
统 1.统计学
计 2。变量和数据 均值和中位数-测度数据的集中趋势
与 3。常用的数据特征测度 方差和标准差-测度数据的离散趋势
统 观测数据和实验数据
计 4。数据的来源 一手数据和二手数据
数 统计调查的概念与分类
据 5.统计调查 统计调查的方式
年份
单项选择题
多项选择题
合计
2013年
3题3分
2题4分
5题7分
一、统计学
(一)统计学的含义(了解):
1.统计学是关于收集、整理、分析数据和从数据中得出结论的科学
(二)统计学有两个分支:描述统计和推断统计
类型
含义
内容包括
描述统计
是研究数据收集、整理和描述的统计方法
(1)如何取得所需要的数据;
(2)如何用图表或数学方法对数据进行整理和展示;
(3)如何描述数据的一般特征
推断统计
研究如何利用样本数据推断总体特征的统计方法
(1)参数估计:利用样本信息推断总体特征
(2)假设检验:利用样本信息判断对总体假设是否成立
【例1·单选题】统计学包括描述统计和( )两个分支.
A。数据统计 B。调查统计 C。调查统计 D.推断统计
答案:D
【例2•单选题】为了解与居民生活相关的商品及服务价格水平的变动情况,收集统计局发布的CPI数据,利用统计图形展示CPI的变化,利用增长率计算CPI的走势,这种统计方法是( )
A.描述统计 B。推断统计 C。推断统计 D。调查统计
答案:A
【例3·多选题】(2013年)下列统计分析中,需要采用推断统计方法的有()。
A.用样本信息估计总体特征
B.用图表对数据进行展示
C。描述一组数据的集中趋势
D。用样本信息检验对总体的假设是否成立
E。描述一组数据的离散趋势
答案:AD
二、变量和数据
(一)变量
含义
变量是研究对象的属性或特征,它是相对于常数而言的
常数只有一个固定取值,变量可以有两个或更多个可能的取值
分类
定量变量
(数量变量)
变量的取值是数量,其取值表现为具体的数值
如企业销售额、注册员工数
定性变量
分类变量
变量的取值表现为类别(如企业所属行业、员工性别)
顺序变量
变量的取值表现为类别且有一定顺序
(如员工受教育水平)
(二)数据
1、含义:数据是对变量进行测量、观测的结果,数据根据需要可以是数值、文字或者图像等形式
2、分类:
类型
测量内容
表现为
定量数据
(数值型数据)
是对定量变量的观测结果
其取值表现为具体的数值
(例如:销售金额为100万元)
定性数据
分类数据
是对分类变量的观测结果
表现为类别,一般用文字表述,也可用数字表示,不区分顺序(如用1表示“男性”,2表示“女性”)
顺序数据
是对顺序变量的观测结果
表现为类别,一般用文字表述,也可用数字表示,但有顺序(如用1表示硕士及以上,2表示本科,3表示大专及以下)
【例4·多选题】(2009年考题)下列变量中属于定量变量,其取值通常表现为具体的数值的是( )。
A。商品销售额 B.上班出行方式 C。家庭收入
D.居住地区 E.年龄
答案:ACE
【例5·单选题】当变量的取值表现为类别且有一定顺序的,则该变量为( )。
A。定量变量 B。分类变量 C.顺序变量 D。类别变量
答案:C
【例6·单选题】(2012年考题改编)( )其取值表现为具体的数值。
A.定量数据 B。分类数据 C.顺序数据 D。定性数据
答案:A
【例7·单选题】(2013年)下列统计变量中,属于顺序变量的是()。
A.原油价格 B.年末总人口 C.员工受教育水平 D。学生年龄
答案 :C
解释:去年课后练习单选题第7题。
三、常用的数据特征测度
对收集来的数据经过整理与显示,可以对数据的分布特征有一个初步认识和了解.
其中常用于分析数据分布特征的测度,主要从三个方面进行:
(1)分布的集中趋势
反映数据向其中心值靠拢或聚集的程度
(2)分布的离散程度
反映各数据远离其中心值的趋势
(3)分布的偏态和峰度
反映数据分布的形状
(一)均值和中位数——测度数据的集中趋势
集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在.
集中趋势的测度也就是寻找数据一般水平的代表值或中心值。
1、均值
含义
均值也叫平均数,就是数据组中所有数值的总和除以该组数值的个数
计算公式
示例
【教材例题】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日平均销售额。
【计算过程】
平均销售额=元
地位
均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平
适用范围
主要适用于数值型数据,但不适用于分类数据和顺序数据
特点
易受极端值的影响,极端值的出现,会使平均数的真实性受到干扰。
【例8·单选题】(2003年)集中趋势最主要的测度值是( )。
A.众数 B。中位数 C.均值 D。方差
答案:C
解析:算术平均数是全部数据的算术平均,又称均值,是集中趋势中最主要的测度值。
(二)中位数
含义
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用Me表示。
中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数
计算思路
数据排序→确定中位数的位置→确定中位数的具体数值
n为数据的个数
(1)当n为奇数:中位数位置是,该位置所对应的数值就是中位数数值
(2)当n为偶数:中位数位置是介于和(+1)之间,中位数数值就是所对数值和(+1)所对应数值的平均数。
示
例
1
【教材例题】某地级市下辖9个县,每个县的面积如下,计算中位数:
1455 2019 912 1016 1352 1031 2128 1075 2000
计算思路:
(1)先排序:912 1016 1031 1075 1352 1455 2000 2019 2128
(2)确定中位数的位置(9+1)÷2=5,
(3)该位置所对应的数值就是中位数数值中位数1352
示
例
2
【教材例题】某地级市下辖10个县,每个县的面积如下,计算中位数:
912 1000 1016 1031 1075 1352 1455 2000 2019 2128
计算思路:
(1)先排序:题目中数据已经从小到大排好序
(2)确定中位数的位置(10+1)÷2=5。5
(3)即第5位数和第6位数所对应数值的平均数就是中位数,即:
Me=1213.5
特点
中位数是一个位置代表值,不受极端值的影响,抗干扰性强,尤其适用于收入类偏斜分布的数值型数据。
适用范围
主要用于顺序数据和数值型数据,但不适用于分类数据。
【例9·单选题】(2007年改编)某连锁超市6个分店的职工人数由小到大排序后为57人、58人、58人、60人、63人、70人其平均数、中位数分别为( )。
A.59、58 B.61、58 C.61、59 D.61、70
答案:C
解析:
1、平均数=(57+58+58+60+63+70)/6=61人
2、中位数
(1)先排序:题目中数据已经从小到大排好序
(2)确定中位数的位置(6+1)÷2=3.5
(3)即第3位数和第4位数所对应数值的平均数就是中位数,即(58+60)÷2=59
【例10·单选题】(2011年)2010年某省8个地市的财政支出(单位:万元)分别为:59000 50002 65602 66450 78000 78000 78000 132100这组数据的中位数是( )万元.
A。78000 B。72225 C。66450 D.75894.25
答案:B
解析:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数.把题干中的数据按顺序排列就是50002,59000,65602,66450,78000, 78000,78000,132100。
由于所给数据是8个,所以中位数的位置是第4个和第5个数据的平均数。
中位数就是(66450+78000)÷2=2=72225。
【例11·单选题】(2013年)在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是()。
A.中位数 B.均值 C。标准差 D。方差
答案: A
【例12·单选题】(2013年)在某企业中随机抽取7名员工来了解2013年上半年职工请假情况。这7名员工2013年上班年请假天数分别为: 1 5 3 10 0 7 2 这组数据的中位数是( ).
A.3 B.10 C。4 D.0
答案:A
【解析】先从小到大排序0 1 2 3 5 7 10,确定中位数的位置(7+1)÷2=4,第4个数就是中位数.
(二)方差和标准差—-测度数据的离散趋势
离散程度反映的是各变量值远离中心值的程度
集中趋势与离散程度的关系
(1)数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差
(2)数据的离散程度越小,集中趋势的测度值对该组数据的代表性就越好
【例13·单选题】(2010年)集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性( ).
A。越好 B.越差 C。始终不变 D.在一定区间内反复变化
答案:B
1、方差
含义
方差是数据组中各数值与其均值离差平方的平均数,它能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值
方差与均值的关系
方差越小,说明数据值与均值的平均距离越小,均值的代表性越好
公式
对于样本数据,常用的方差公式为:
s2 =
【教材164页例题】
某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日销售额的样本方差
【计算过程】
(1)计算均值(平均数)
(520+600+480+750+500)÷5=570元
(2)计算各数值与均值的差
520—570=-50;600-570=30;480—570=90;750—570=180;500—570=—70
(3)计算差平方和
(-50)2+(30)2+(90)2+(180)2+(-70)2
(4)计算方差
=
=12200
2、标准差:
含义
即方差的的平方根
公式
对于样本数据,常用的方差公式为:
s =
示例
上例题算出方差后,开平方根即可
样本标准差==110.45
特点
标准差不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位
地位
标准差与方差是应用最广泛的统计离散程度的测度方法
适用范围
但是标准差与方差只适用于数值型数据。
此外与均值一样,它们对极端值也很敏感
【总结】常用的数据特征测度
指标
(测得值)
是否受极端值影响
数值型数据
(定量数据)
分类数据
顺序数据
测度数据的集中趋势
均值
受影响
适用
不适用
不适用
中位数
不受影响
适用
不适用
适用
测度数据的离散趋势
方差
受影响
适用
不适用
不适用
标准差
【例14·单选题】(2009年考题改编)下列指标中,用于描述数据集中趋势,并且易受极端值影响的是().
A。平均数 B.中位数 C。方差 D。标准差
答案:A
解析:均值、方差、标准差都容易受极端值影响,但是用于描述数据集中趋势的指标是均值(即平均数),方差和标准差是描述数据离散趋势的指标,因此正确答案为A
【例15·单选题】(2010年)下列指标中,适于测度顺序数据的指标有( )。
A。均值 B.中位数 C. 方差 D.标准差
答案:B
四、数据的来源
1、按收集方法分为
类型
含义
内容
示例
观测数据
通过直接调查或测量而收集的数据
观测数据是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的统计数据都是观测数据
如GDP、CPI、房价
实验数据
通过在实验中 控制实验对象以及其所处的实验环境收集到的数据
自然科学领域的数据大多都是实验数据
如一种新产品使用寿命的数据;一种新药疗效的数据
2、从使用者的角度看,数据的来源有两种
类型
内容
来源
一手数据
直接的调查和科学实验,对使用者来说,这是数据的直接来源,称为直接数据或一手数据
有两个:一是调查或观察,二是实验
社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式
二手数据
来源于别人的调查或实验的数据,对使用者来说这是数据的间接来源
来自国家和地方的统计部门以及各种报刊媒介公开出版或报道的社会经济统计数据.
报纸、杂志、广播、电视、历史文献及著作、网络等也是获得第二手数据的重要渠道
【例16·单选题】在不对事物施加人为控制因素的条件下,直接调查或测量而收集到的数据,称为( )。
A.间接数据 B.二手数据 C。实验数据 D。观测数据
答案:D
【例17·多选题】下列选项中属于观测数据的是().
A.一种新药疗效的数据 B.GDP C。CPI D。房价 E.一种新产品使用寿命的数据
答案:BCD
解析:AE属于实验数据.
【例18·多选题】(2013年)下列统计数据中,属于一手数据的有()。
A.通过临床试验获得的新药疗效数据
B.通过查阅统计年鉴获得的居民消费价格指数
C。通过房地产管理部门数据库获得的房价数据
D.通过入会调查得到的家庭月收入数据
E.通过网络调查得到的网民对某项政策的支持率数据
答案:ADE
五、统计调查
(一)统计调查的概念与分类
1、概念:统计调查是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地搜集信息资料的过程.
2、统计调查过程有两个重要特征:一是调查是一种有计划、有方法、有程序的活动;二是调查的结果表现为搜集到的数据。
3、统计调查可以按不同的标志分类
(1)按调查对象的范围不同分为:全面调查和非全面调查
分为
含义
包括
示例
全面调查
对构成调查对象的所有单位进行逐一的、无一遗漏的调查
全面统计报表和普查
人口普查
经济普查
非全面调查
对调查对象中的一部分单位进行调查
包括非全面统计报表、抽样调查、重点调查和典型调查
(1)为了研究城市居民家庭的生活水平,只对一定数量的住户进行调查;
(2)为了掌握进出口商品的质量,抽取一部分商品做检验
【例19·多选题】(2008年)下列调查方式中,属于非全面调查的有( )。
A。重点调查 B.抽样调查 C.典型调查 D.普查 E.全面报表
答案:ABC
解析:选项DE属于全面调查.
(2)按调查登记的时间是否连续分为:连续调查和不连续调查
分为
含义
示例
连续调查
观察总体现象在一定时期内的数量变化,说明现象的发展过程,目的是为了解社会现象在一段时期的总量。
如工厂的产品生产、原材料的投入、能源的消耗、人口的出生、死亡等。
不连续调查
间隔一个相当长的时间所作的调查,为了对总体现象在一定时点上的状态进行研究。
如生产设备拥有量、耕地面积等。
(二)统计调查的方式
我国统计调查的方式主要有统计报表、普查、抽样调查、重点调查和典型调查
1、统计报表
含义
是按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式.
特点
四统一:统计报表要以一定的原始数据为基础,按统一的表式、统一的指标、统一的报送时间、统一的报送程序进行填报
分类
按调查对象范围的不同可分为全面报表和非全面报表
(目前的大多数统计报表都是全面报表)
2、普查
含义
为某一特定目的而专门组织的一次性全面调查
示例
人口普查、经济普查、农业普查
适用情形
主要用于了解处于某一时点状态上的社会经济现象的基本全貌,为国家制定有关政策提供依据
特点
(1)普查通常是一次性的或者周期性的;
(2)一般需要规定统一的标准调查时间,以免调查数据重复或遗漏
(3)普查的数据一般比较准确,规范化程度也较高,可以为抽样调查或其他调查提供基本依据
(4)普查的使用范围比较窄,只能调查一些最基本及特定的现象
【例20·多选题】(2010年)与抽样调查相比,普查的特点有( ).
A.时效性强 B.使用范围比较窄 C.通常是一次性或周期性的
D。规定统一的标准调查时间 E。经济性
答案:BCD
解析:普查具有的特点有:
(1)一次性的或周期性的;
(2)规定统一的标准调查时间,以免数据重复或遗漏;
(3)数据一般比较准确,规范化程度也较高;
(4)普查的使用范围比较窄,只能调查一些最基本及特定的现象。
3、抽样调查
含义
从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查
地位
是实际中应用最广泛的一种调查方式和方法
特点
①经济性:调查的工作量小,可节省大量的人力、物力、财力和时间。是抽样调查的一个最显著优点。
②时效性强:可以迅速、及时的获得所需要的信息,提高数据的时效性.
③适应面广:适用于对各个领域、各种问题的调查.如产品质量检验、农产品试验、医药的临床实验
④准确性高:由于工作量小,可使各环节的工作做得更仔细,误差往往很小
【例21·多选题】(2009年)相对于普查而言,抽样调查的特点包括( )。
A.经济性 B.时效性强 C。适应面广 D。周期性 E。准确性高
答案:ABCE
4、重点调查
含义
是一种非全面调查,从所要调查的总体中选择一部分重点单位进行调查
地位
重点单位虽然只是全部单位中的一部分,但是就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况
示例
(1)为及时了解全国城市零售物价的变动趋势,对全国35个大中型城市的零售物价的变化进行调查就是重点调查。
(2)要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可.大中型工业企业数不到5%,但这些大中型企业的增加值和资产总额却占全国工业的60%以上
特点
(1)能以较少的投入、较快的速度取得某些现象主要标志的基本情况或变动趋势。
(2)调查单位不是随机抽取的,调查结果不能推断总体
【例22·单选题】(2012年)在进行重点调查时,应选择的调查单位是()。
A。就调查标志值来说在总体中占绝大比重的单位
B。有典型意义的单位
C.主动参与调查的单位
D。随机抽取的单位
答案:A
解析:选项B属于典型调查。选项C属于干扰的选项。选项D属于抽样调查。
5、典型调查
含义
是一种非全面调查,从调查对象的全部单位中有意识地选择若干具有典型意义或有代表性的单位进行的调查.
作用
(1)弥补全面调查的不足
(2)在一定条件下可以验证全面调查数据的真实性
特点
调查单位不是随机抽取的,调查结果不能推断总体
【例23·单选题】(2009年)为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验选择10个有代表性的企业进行深入细致的调查。这类调查方法属于( )。
A。专家调查 B。重点调查 C。系统调查 D。典型调查
答案:D
抽样调查与重点调查、典型调查的比较
相同点
都是非全面调查
不同点
1、抽样调查是随机抽取调查单位,可以根据抽样结果推断总体的数量特征
2、重点调查和典型调查的单位不是随机抽取的,具有一定的主观性,调查结果不能推断总体
【例24·单选题】(2006年)能够根据样本结果推断总体数量特征的调查方式是( )。
A。重点调查 B。抽样调查 C。典型调查 D。所有非全面调查
答案:B
解析:抽样调查是随机抽取调查单位,可以根据抽样结果推断总体的数量特征.
【总结】本章主要考点:
1、统计学的两大分支(描述统计和推断统计的含义及内容)
2、变量和数据的含义及类型(数值型数据是对定量变量的观测结果;分类数据是对分类变量的观测结果;顺序数据是对顺序变量的观测结果)
3、测度数据集中趋势的指标(均值和中位数);
4、测度数据离散趋势的指标(方差和标准差)
5、数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差
6、均值、中位数的计算
7、均值、中位数、方差、标准差的适用范围,是否受极端值的影响
8、数据按收集方法分为观测数据和实验数据;按来源分为一手数据和二手数据
9、统计调查的分类(按调查对象的范围分为全面调查和非全面调查;按调查登记的时间是否连续,分为连续调查和不连续调查,及其含义)
10、统计调查的方式(统计报表、普查、抽样调查、重点调查和典型调查,含义、特点)
展开阅读全文