资源描述
第二章
1、 简述记录数据的两個来源,及其互相关系。
從记录数据的观测登记方式和记录数据自身的属性看,记录数据存在著两种不壹样的来源:壹是专门组织的记录调查;二是科學试验、生产试验和交易活動的观测数据。
從使用者的角度看,记录数据存在两种不壹样的来源。
壹是直接的来源,使用者所应用是由自已亲自观测登记获得的记录数据,属于第壹手的记录数据,称為初级数据;
二是间接的来源,使用者所应用是由他人观测登记获得的记录数据,属于第二手的记录数据,称為次级数据。
任何第二手记录数据都是来源于他人观测登记所获得的第壹手记录数据。归根究竟,专门组织的记录调查,科學试验和生产试验的观测数据是记录数据的来源所在,是第壹性的,决定著记录数据的质量。
2、 简述普查、抽样调查的特點和联络。
普查:為了特定目的而专门组织的壹次性或周期性的全面调查,调查在某壹原则時间上的社會經济現象的总量。
普查具有如下特點:
(1)普查是壹种全面调查。
(2)普查是壹种壹次性或周期性的调查。
(3)普查是壹种调查在某壹原则時间上的社會經济現象总量的调查。
抽查:根据随机原则和详细的抽样技术的规定,從总体中抽取部分個体构成样本,并根据样本信息推断总体数量特性的非全面调查。
1)抽样调查是壹种按照随机原则抽取样本的调查。
2)抽样调查是壹种可以事先估计和控制抽样误差的调查。
3)抽样调查是壹种非全面调查。
4)抽样调查是壹种精确性高的调查。
5)抽样调查是壹种具有广泛合用性的调查。
3、 记录调查方案设计的重要内容。
1.调查任务和目的
2.调查對象、调查單位和填报單位
3.调查项目和调查指標
4.调查時间
5.调查措施
6.调查误差的控制措施
7.调查数据的汇总处理措施
8.调查表和调查問卷设计
9. 制定调查工作的组织实行计划
4、 問卷设计的重要内容。
a問卷构造 問卷构造由問卷的開始,主体和結束三個部分构成。
b封闭性問題及备选答案
c問題排列
5、 数据的登记性误差和代表性误差。
1. 登记性误差。
登记性误差是指在调查過程中由于调查者和被调查者的人為原因形成的误差。例如,调查者的人為原因重要有总体界定錯误、调查單位缺失、计量和测量误差、记录失误、抄录錯误、汇总差錯;被调查者的人為原因重要有故意识地提供虚假数据、無意识地提供有误数据。從理论上說登记性误差属于可以消除的误差。
2.代表性误差。
代表性误差是指运用样本数据推断总体参数時产生的误差。分為随机性误差和系统性误差。
(1)随机性误差是由于随机性原因形成的代表性误差,它是服從于某壹概率分布的随机变量。随机性误差是不可以消除的误差,只要运用样本数据推断总体参数,就必然存在著随机性误差。随机性误差的取值伴随样本容量的增大而減小。
(2)系统性误差是由于非随机性原因形成的代表性误差。重要原因有抽样框過于陈旧导致的抽样框偏误、非随机样本、無回答問題、辅助数据偏误等。系统性误差属于代表性误差,也是在运用样本数据推断总体参数時产生的误差,不過系统性误差不會伴随样本容量的增大而減小,不能通過增大样本容量来实現對系统性误差的控制。
6、什么是记录数据质量的三點原则?
時效性,精确性、壹致性
第三章
1、 什么是数据的审核,详细有什么内容和方式?
数据审核是指在進行数据整顿之前對原始数据的审查和查對。
内容
记录数据的時效性,精确性、壹致性三個方面的原则就是数据审核的基本内容。
(1)记录数据的時效性审核。检查与否在规定的记录调查時间内完毕数据搜集,采集的数据与否為规定的调查時點上,或规定的调查時段内的数量特性。
(2)记录数据的精确性审核。從数据的完整性、真实性和精确性角度進行审核。
(3)记录数据的壹致性审核。检查记录数据在時间和空间上的持续性和可比性。
方式:逻辑检查和技术检查
2、 非数值型数据分组和数值型数据分组有那些差异?
非数值型数据的分组也称為分类。定类数据和定序数据都是對事物质的属性的描述,两者都是壹种分类性质的数据,只在分类划分的無序和有序上存在差异。
反应事物自然属性的非数值型数据的分组壹般比较简朴,只要進行合适的细分或合并,以及选择恰當的分组標志即可。
反应事物社會經济属性的非数值型数据的分组壹般比较复杂,往往是人們對事物数量特性進行深入地记录分析之後形成的壹种质的划分,這种质的划分体現了人們认识活動對与事物由量变到质变的把握,壹般采用国標、行业原则或者企业原则等原则化的形式确定下来,并借助记录报表和记录调查方案等方式加以明确,以此来规范和指导後续的记录活動。
数值型数据分组可以分為單变量分组和组距分组。
單变量分组是指每個分组只用壹种变量值表达的分组形式,又称為單项分组。單变量分组壹般在分组標志為离散变量,且变量的取值范围不是太大的状况下使用。
组距分组是指每個分组用壹种数据取值区间表达的分组形式。组距分组合用于按持续变量分组或变量的取值范围较大的离散变量的場所。
3、 简述数值型数据分组的详细方式有那些?
4、 怎样确定等距分组中组距、组数和各组上限、下限?
5、 频数、频数分布的概念和意义。
频数(Frequence)是落在某壹特定分组中的数据個数
频数分布(Frequence Distribution)是由各组的频数构成的壹种数组。
频数与频数分布总是在详细的分组设置前提下的對总体数据分布特性的描述
6、 组中值的意义和计算措施。
组距分组中处在各组取值范围中點位置上的数值。
代表性的数值,用来代表该组数据取值的壹般水平。
7、 绝對数的概念、种类和计量單位。
绝對数是反应总体绝對规模和绝對水平的测度,是通過数据汇总直接得到的测度。
1.总值和频数。
2.時期数据和時點数据
3.截面数据和時间序列数据。
计量單位:实物單位、货币單位及時间單位
8、 登记表的构成和绘制规定。
构成
從形式上看,登记表由表頭、行標題、列標題和数据4個重要部分内容构成。此外,在需要時做某些阐明時,可以在表的上下端加上附注。
9、直方图、折线图的概念和绘制措施。
第四章
1、 应從哪几方面對数据分布特性進行度量,為何?
数据分布特性的度量包括三個方面:
壹是数据分布的集中趋势,反应总体中各個單位的数值水平向其汇集,或者集中的中心数值;
二是数据分布的离散趋势,反应总体中各個單位的数值水平偏离中心数值的综合程度;
三是数据分布的偏态和峰度,反应各個总体單位的数值水平的分布形态是對称或偏倚,平坦或尖耸的详细数值。
2、 度量数据分布集中趋势的测度重要有那些?
众数
频数最大的变量值,直观地反应了数据的集中趋势。众数是度量定类数据集中趋势的测度
频数最大的数据的数值来反应集中趋势
當数值型数据中具有极小值和极大值時,使用众数来度量数据的集中趋势,前提是数据的频数分布存在明显的集中态势。
中位数
有序数据正中间位置上的变量值,中位数用其特殊的位置属性直接地体現了集中趋势的中心数值特性
均值
3、 均值的特性、计算措施、数學性质,及其在度量数据分布特性中的地位
计算措施:壹组数值型数据之和除以该组数据总数的商,即同壹组数据的总值与其频数的商。
计算均值的数据需要具有数值型数据的属性,均值是壹种数值型的集中趋势测度。通過计算均值的运算過程,首先将各個数据之间的数量差异抽象掉了,以壹种抽象性的综合测度概括地反应事物的集中趋势。另壹方面将不壹样总体的总量规模抽象掉了,体現出来的只是壹种壹般性的代表水平,有助于不壹样规模的同类总体在不壹样空间和時间上的广泛比较。
1. 简朴均值
2.加权均值 运用各组频数作為权数對各组数值水平進行加权计算出来的均值。
(1)單变量值分组加权均值
(2)采用组均值计算加权均值
(3)采用组中值计算加权均值
3.权数与加权构造
均值的数學性质:
(1)各個变量值与其均值的离差和為零,即
(2)各個变量值与其均值平均数的离差平方和為最小,即
當取均值作為集中趋势的测度時,各個数据的取值与集中趋势测度的离差平方和為最小值。均值的這壹数學性质是度量离散程度,進行误差分析和最小二乘估计等记录措施的基础。
4、调和平均数
简朴调和平均数:倒数的平均数的倒数
加权调和平均数:
5、几何平均数
是指各项数据的连乘积開其项多次方的算术根
4、 均值、调和平均数和几何平均数的比较。
對于同壹组数据,仅從数值比较的角度,有均值不小于等于几何平均数,几何平均数不小于等于调和平均数
5、 怎样运用均值、众数和中位数的数值特性分析数据分布的偏态?
l 均值是唯壹的数值型测度。均值壹般采用算术平均措施计算的集中趋势测度,對极端数值的反应比较敏感,在数据的分布出現偏倚時,均值受到的影响最大。
l 众数和中位数都是位置型的集中趋势测度,其详细取值不受极端数值的影响。其中众数是對应于最大频数的数值,中位数是居于有序数据中间位置上的数值。
因此,若数据的分布是對称的,有均值、众数和中位数三個集中趋势测度的取值相等。
當数据分布呈左偏态時,壹般有均值的取值最小,另壹方面是中位数,众数的取值最大。 在频数分布图上,众数壹直對应于峰顶,均值和中位数偏在峰顶的左边,均值又在中位数左边;
當数据分布呈右偏态時,壹般有均值的取值最大,另壹方面是中位数,众数的取值最小。在频数分布图上,众数還是处在對应于峰顶的位置,均值和中位数偏在峰顶的右边,并且均值偏在最右边。
6、 度量数据分布离散趋势的测度重要有那些?
异众比率(Variation Ratio)是非众数所在组的频数之和占总频数的比率
异众比率数值越大,越趋近于1,阐明众数所在组的频数占总频数的比率越低,众数的代表性越弱,反应数据的频数分布不存在明显集中的态势,無法借助众数来反应数据的集中趋势;异众比率数值越小,越趋近于0,阐明众数所在组的频数占总频数的比率越高,众数作為集中趋势测度的代表性越强。
四分位差
取值范围
取值范围的计算只使用了数值变量中的最大与最小两個数值,具有计算简洁,意义明确,易于理解的特點,不過没有充足运用数据的所有信息,是壹种粗略的,简朴的,尤其是轻易受到极端数值影响的测度。
平均差
所有变量值与其均值的离差的绝對值的均值,也称為平均离差,用A.D.表达
方差和原则差
方差:指所有变量值与其均值的离差的平方的均值。
原则差,方差的算数平方根
7、 為何要计算离散系数?
离散系数:原则差与均值的比值。
计算离散系数的重要目的就是消除原则差的量纲和数值水平上的差异,使其成為壹种抽象的,纯粹反应数据分布离散程度的测度,壹种具有广泛的直接的可比性的离散程度测度。從形式上看,离散系数是壹种相對的比值,壹种相對数。
8、 原则化值的意义和用途?
以变量值与其均值的差除以同壹数据的原则差的比值,也称為原则分数,
消除原则化值的量纲和绝對水平,剔除不壹样的数据分布离散程度在量纲和数值水平上的差异,使离散程度不壹样的数据之间具有了广泛的可比性。使数据具有了普遍的可加性和直接的可比性。
9、偏态系数和峰度系数的意义?
数据分布偏倚的方向和程度
数据分布平峰或尖峰的程度,也称為峰态。
第五章
1、 什么是指数?
從内涵角度,指数是反应研究對象某壹数量特性在時间上,或空间上差异的方向和程度的测度。從外延角度,指数可以從广义和狭义两個概念上去理解。狭义的指数是指度量多种项目综合变動的方向和程度的测度,壹般称為总指数。广义的指数是指任意两個数值的對比,泛指反应数量差异的各类相對数,既包括狭义的指数,也包括只反应單项事物变動的個体指数。
2、 相對数的分类,及其特點?
构造相對数、動态相對数、比较相對数、比例相對数、强度相對数、计划完毕状况相對数
通過两個有关联的数据對比的方式来反应現象之间联络的测度。
以某個数据(相對数的基数)作為参照系来观测所研究現象的数量特性。
相對数的计量單位有無名数和复合量纲两种形式。
A计划完毕相對数
、
B构造相對数
C比例相對数
D比较相對数
不壹样总体的同类数据之间的互相對比
F强度相對数
两個有亲密联络的,性质不壹样总体的数据的對比,以反应事物发展的强度、密度、普遍程度或經济效益高下的测度
G動态相對数
两個有联络的数据在空间上的比较,動态相對数则是两個有联络的数据在時间上的比较
3、 强度相對数与均值的区别?
强度相對数是两個有亲密联络的,性质不壹样总体的数据的對比,以反应事物发展的强度、密度、普遍程度或經济效益高下的测度。强度相對数重要用于分析不壹样現象之间的数量关系。
有些强度相對数也使用“平均”的字眼,但它不是同壹总体的总值与其频数的商,而是两個不壹样总体的数据的比值,同均值存在本质的区别。
4、 指数分為哪几类?
1.数量指数和质量指数
2. 時间性指数和区域性指数
3.個体指数和总指数
4.简朴指数和加权指数
5.综合指数和平均指数
5、 拉氏指数公式和帕氏指数公式的特點?
拉氏:将权数原因固定在基期
帕氏:将权数原因固定在汇报期
5、 权数原因在指数中的作用?
将不壹样度量的指標转化為同度量的指標,可以将多种产品的价值量加总起来
6、 综合指数与平均指数的联络和区别?
联络:①综合指数与平均指数都是总指数,其經济内容是壹致的;②平均指数在使用全面调查资料時,实质上就是综合指数的壹种变形形式。
区别:①计算措施不壹样。综合指数 “先综合,後對比”,平均指数 “先對比,後平均”;②资料来源不壹样。综合指数采用的是全面调查资料,平均指数则壹般采用抽样调查资料。③综合指数的分子与分母之差具有壹定的經济内容,即阐明由于指数化原因变動带来的价值总量指標的增減量,而平均指数的分子与分母之差却不具有价值总量指標增減的經济内容。尤其是采用固定权数的平均指数,只有相對数的意义。因此,纵然平均指数有許多長处,也不能完全取代综合指数的应用。
7、 指数体系分析的特點?
指数体系是指由若干個在經济意义上互相联络的指数所构成的整体。
壹般将数量指数的权数固定在基期,即采用拉氏公式;将质量指数的权数固定在汇报期,即采用帕氏公式。
8、 我国商品零售价格指数和工业品出廠价格指数的编制措施?
零售价格指数
1.选择调查商店(农贸市場)。
2.选择代表规格品。
3.平均价格的计算
4.权数的计算。
5.价格指数的编制措施
在對商品進行科學分类基础上选择各类别商品的代表规格品;采用加权算术平均形式计算总指数;采用代表规格品的全社會综合平均价作為计算的根据。
我国工业品出廠价格指数的编制措施
1.选择代表产品。
2.权数确实定。
3.工业品出廠价格指数的计算。
10、怎样应用居民消费价格指数分析經济問題?
居民消费价格指数是反应壹定期期内城镇居民所购置的生活消费品价格和服务项目价格变動趋势和程度的指数。
是观测和分析消费品的零售价格和服务价格变動,及其對城镇居民实际生活费支出的影响程度的重要测度。
1.反应居民生活消费品和服务项目价格变動趋势和程度。
2.测定通货膨胀程度。
阐明壹定期期内商品价格变動幅度的重要测度
3.度量货币购置能力。壹般采用货币购置能力指数来表达。
与居民消费价格指数呈反比关系。
4.计算实际工资水平。居民的实际消费水平,不仅受到名义工资增減的影响,還要受到居民消费价格指数的制约。可以运用居民消费价格指数将居民的名义工资转换為实际工资,来反应居民的实际消费水平。
5.剔除价格变動影响。
任何以货币單位為量纲的数据都不可防止的要受到价格水平波動的影响,當進行不壹样步间上的時间序列数据计算和分析時,需要使用居民消费价格指数,来剔除不壹样步间上货品和服务單位价格水平的差异。运用居民消费价格指数来剔除价格变動影响的方式称為缩減或平減,通過居民消费价格指数缩減,剔除了价格变動影响之後的数据,称為缩減数据,或缩減指標。
第六章
1、 什么是总体、样本、样本容量、估计量、估计值?
总体(Population)是指所研究的事物及其現象的全体,由该事物及其現象的所有個体构成。
样本(Sample)是指從总体抽取的若干個体构成的集合。
样本容量(Sample size)是指构成样本的所有個体的数量。
2、 什么是點估计和区间估计?
在总体分布形式為已知,從该总体中抽取壹种样本,對未知参数所作的壹种数值點的估计,称為参数的點估计
区间是在點估计的基础上,給出在壹定的置信程度下确定总体参数取值区间的措施和過程。
3、 什么是总体分布、样本分布和抽样分布?
总体分布是指由客观存在的,构成总体的個体所形成的频数分布,及其有关参数数值。
样本分布是指由构成样本的個体所形成样本的频数分布,以及计算出来的有关记录量。
抽样分布(Sampling Distribution)是指從同分布总体中,独立抽取的相似样本容量的样本记录量的概率分布。因此,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究對象。
4、 什么是大数定律和中心极限定理?
大数定律
在對客观事物及其現象進行观测和试验中,伴随观测或试验的次数增多,事件发生的频率和均值逐渐地趋于某個常数。
中心极限定理
在客观現实中,有許多随机变量是由大量的互相独立的随机原因的综合影响而形成的,任何壹种原因在总的影响中的作用都是微小的,這种随机变量往往近似地服從正态分布。
中心极限定理反应了随机变量近似地服從正态分布的特性。中心极限定理是大样本推断的理论基础。
6、 样本均值和样本方差有那些分布?
样本均值
.大样本場所下的样本均值抽样分布
在反复抽取容量相似的独立同分布样本条件下,所得到的样本均值的概率分布称為样本均值的抽样分布。在样本容量充足大的状况下,即大样本場所,样本均值根据中心极限定理趋于正态分布。
小样本場所下的样本均值抽样分布
在小样不满足中心极限定理對于样本容量充足大的规定,样本均值不趋于正态本場所,分布,而是趋于t分布
样本方差
在反复抽取容量相似的独立同分布样本条件下,所得到的样本方差的概率分布称為样本方差的抽样分布。
在服從正态分布的同分布总体中,样本方差与总体方差的比值服從于自由度n-1為的卡方分布。
卡方分布仅在第壹象限取值,因此分布的取值永遠為正数。卡方分布壹般為右偏态的偏峰分布,偏倚形态取决于其自由度的数值,自由度的数值越小,偏倚的程度越大,并且伴随自由度的数值增大,分布的形态逐渐趋于對称,正态分布是卡方分布的极限分布。
7、 什么是點估计的矩估计法和最大似然法?
用样本的矩,估计总体的矩的参数估计措施。矩是在数學期望基础上定义的数字特性,可以分為k阶原點矩和k阶中心矩两类。
8、 什么是點估计量的壹致性、無偏性和有效性?
壹致性
當样本容量趋于無穷大時,估计量依概率收敛于总体参数。即
壹致估计量伴随样本容量的增大,其数值越来越靠近被估计的总体参数
無偏性
指估计量的数學期望等于未知的总体参数真值。
有效性
采用均方误差對估计量精确程度的测定,壹般体現為两個估计量的均方误差之比。
9、 解释置信区间和置信水平的联络。
置信区间反应的是区间估计的精确程度,置信水平反应的是区间估计的可靠程度,對于某同样本容量已定的详细样本而言,這两方面是互為消長的。
當通過缩小置信区间来提高對总体参数的估计精确程度時,就需要減少置信水平,減少對总体参数估计的可靠程度;若是要提高区间估计的可靠程度,势必會增大置信区间,減少對总体参数估计的精确程度。因此,需要根据详细状况和实际需要合适地选择置信水平的数值,進而确定置信区间。
若既要提高区间估计的精确程度,又要提高区间估计的可靠程度,就需要采用增長样本容量,以及通過更有效的抽样和估计措施来实現。
第拾章
1、 什么是時间序列?
時间序列是指按照時间先後依次排列的观测值所构成的数列,因而也称為時间数列,或動态数列。
2、 時间序列有哪几种类型?
按照時间序列中依次排列的观测值的属性不壹样,将時间序列分為绝對数時间序列、相對数時间序列和平均数時间序列三种。
其中绝對数時间序列又详细分為時期序列和時點序列两种。
時期序列是由時期绝對数数据所构成的時间序列,其中每個数值反应現象在壹段時间内发展過程的总量。
時點序列是由時點绝對数数据所构成的時间序列,其中的每個数值反应現象在某壹時點上所到达的水平。
3、 计算序時平均数的公式有几种,应用条件是什么?
序時平均数,又是平均发展水平
准時间序列是時期還是時點序列,序列中各项数据的時期長度与否壹致,有4种平均发展水平的计算公式
時期数列,時期長度壹致&時點数列,時點数据的间隔長度
4、 有哪两种计算平均发展速度的措施?
5、 時间序列的原因有那些?
長期趋势( T )現象在较長時期内受某种主线性原因作用而形成的总的变動趋势 季节变動( S )現象在壹年内伴随季节的变化而发生的有规律的周期性变動 循环变動( C )現象以若干年為周期所展現出的波浪起伏形态的有规律的变動 不规则变動(I )是壹种無规律可循的变動,包括严格的随机变動和不规则的突发性影响很大的变動两种类型
6、 移動平均法的思想和特點。
基本原理,通過移動平均消除時间序列中的不规则变動和其他变動,從而揭示時间序列的長期趋势。特點:當時间数列的变動趋势為线性状态時,可采用移動平均法進行描述和分析。该措施是通過扩大原時间数列的時间间隔,并按壹定的间隔長度逐期移動,分别计算壹系列移動平均数,由這些平均数形成的新的時间数列對原時间数列的波動起到壹定的修匀作用,減弱了原数列中短期偶尔原因的影响,從而展現出現象发展的变動趋势。
7、 時间序列趋势模型与回归模型有那些区别?
使用移動平均数值作為预测值是将壹种平均数值,人為地前移之後,作為t+1時刻的预测数值,存在著壹种固有滞後問題。在許多場所需要采用模型拟合法對長期趋势進行预测和分析。對于長期趋势的模型拟合是采用数學方程的形式,来模拟客观存在的事物及其現象的某壹数量特性的基本的、稳定的、長期的增長规律性,因此又统称為趋势模型,或增長模型。
趋势模型与回归模型的共同點均可采用回归的措施来估计模型的参数,不過趋势模型并不揭示事物及其現象之间的因果联络,只是反应事物及其現象的某壹数量特性依時间推移所展現出来的某种变動的规律性。因而趋势模型也被称為非因果关系的定量模型。
8、 计算季节指数的特點和环节
當時间序列具有明显長期趋势,又没有剔除長期趋势变動影响時,長期趋势就會参杂在季节变動之中,使计算出来的反应季节原因变動的季节指数中具有明显的系统性偏误。
因此实行季节分析之前,必须對時间序列進行分析,當時间序列存在明显的長期趋势時,就必须首先對该時间序列進行長期趋势的剔除,為對的地计算季节指数奠定基础。
在剔除了長期趋势之後的時间序列中,除了季节变動(S),還包括循环变動(C)、和不规则变動(I)。
(1)分别将每年各月(季)的数值加总,计算各年月(季)的总数。
(2)根据各年同月(季)的总数,计算各年月(季)的平均数。
(3)将各個月(季)的平均数加总,计算各年总的月(季)平均数。
(4)将若干年内同月(季)的平均数与总的月(季)平均数相比,即求得用百分数表达的各月(季)的季节比率,又称季节指数(S.I.)。
9、 采用剩余法進行循环变動分析的特點和环节。
壹般采用基于乘法公式的剩余法来测定和度量循环变動。
所谓的剩余法是指從原時间序列中依次剔除長期趋势(T)和季节变動(S)原因之後,所剩余的部分為循环变動(C)和不规则变動(I),再通過移動平均的措施来剔除不规则变動(I),最终剩余的则為循环变動(C)。
展开阅读全文