1、2024/5/9 周四1在终极的分析中,一切知识都是历史在抽象的意义下,一切都是科学数学在理性的基础上,所有的判断都是统计学 C.R.劳应用统计学.2024/5/9 周四21 统计学是什么nStatisticsisthescienceofcollecting,organizing,presenting,analyzing,andinterpretingnumericaldatatoassistinmakingmoreeffectivedecisions.n统计学是关于下列活动的方法和程序:采集数据,例如问卷调查 呈现数据,例如绘制图表 概括数据,例如计算均值 分析数据,例如区间估计 做出决策,
2、例如假设检验.2024/5/9 周四3无处不在的统计n在诺贝尔经济学获奖者中,2/3以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。n1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。.2024/5/9 周四4无处不在的统计(续)n大仲马的作品多曲折感人,而他又多私生子。取笑讥讽他的人
3、,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准。果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内”。听众哄堂大笑。.2024/5/9 周四5统计的应用n学者不能离开统计而研究n政治家不能离开统计而施政n企业家不能离开统计而执业 -马寅初.2024/5/9
4、 周四62 如何学统计学nCultivateyourstatisticalawarenessinyourdailylife.numeric information on newspaper,TV program,websnReadsomegoodbooksonstatistics books magazinesnPracticestatisticalskillsbyexercisesandcomputersoftware.Excel Spss Sas.2024/5/9 周四73 教材及参考文献n应用统计学,施金龙、吕洁,南京大学出版社,2005n统计学,贾俊平、何晓群、金勇进,中国人民大学出版
5、社,2002n统计学概论,曾五一,首都经济贸易大学出版社,2003n统计学的世界,戴维S穆尔,中信出版社,2003nTheBasicPracticeofStatistics,DavidS.Moore,W.H.FreemanCompany出版社,2004.2024/5/9 周四84 课程成绩评定n期末书面考试成绩(70%)n平时各项表现成绩(30%)课堂参与(10%)作业完成(20%).2024/5/9 周四95 课程主要内容 第一章 绪论 第二章 统计调查 第三章 统计整理 第四章 综合指标 第五章 变异与均衡指标 第六章 时间数列.2024/5/9 周四10 课程主要内容(续)第七章 指数
6、第八章 抽样分布 第九章 参数估计 第十章 假设检验 第十一章 方差分析 第十二章 相关分析.2024/5/9 周四11第一章 绪论n一、统计涵义n二、统计工作n三、统计资料n四、统计科学那些默默无闻的统计学家们已经改变了我们的世界,不是由发现新的事实或技术,而是改变了我们推理和试验的方法,以及我们对这个世界的观念的形成方式。哈克英.2024/5/9 周四12一、统计涵义Statistics:(1)Numericdata,whenusedaspluralofstatistic.(2)Ascientificprocedureusedinthestudyandevaluationofnumeric
7、data.统计:(1)统计工作(2)统计资料(3)统计科学.2024/5/9 周四13二、统计工作工作任务:调查、分析,服务、监督工作职能:信息,咨询,监督工作过程:设计,调查,整理,分析工作组织:集中、分散,综合、专业.2024/5/9 周四14三、统计资料n数据计量:定类、定序,定距、定比。n定类尺度是按照客观现象的某种属性对其进行分类。例如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。定类尺度的主要数学特征是“=”或“”。n定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。例如,学生成绩可以分为优、良、中、及格和不及格等五类。定序尺度的主要数学特征是“”。.2024/5
8、/9 周四15数据计量n定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“”。统计中的总量指标就是运用定距尺度计量的。n定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“”或“”。
9、.2024/5/9 周四16数据类型nQuantitative(ormeasurement)datanQualitative(orcategorical)datanDiscretedata,Continuousdatan横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。数据信息知识智慧.2024/5/9 周四17四、统计科学n1 统计学发展简史n2 统计学对象方法n3 统计学基本概念.2024/5/9 周四181 统计学发展简史英国(1690),威廉配第,政治算术德国(
10、1749),阿亨瓦尔,国势学比利时(19世纪中),凯特勒,数理统计德国(19世纪中),恩格尔,社会统计.2024/5/9 周四19理论统计学和应用统计学n历经300多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。n统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。n从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。n现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另
11、一类是以各个不同领域的具体数量为研究对象的应用统计学。.2024/5/9 周四20统计学学科体系 统计学家未必是经济学家,统计学家未必是经济学家,经济学家也未必是统计学家。经济学家也未必是统计学家。但经济统计学家应当但经济统计学家应当-既是统计学家又是经济学家。既是统计学家又是经济学家。.2024/5/9 周四212 统计学对象方法对象:实质性学科与方法论学科 理论统计学与应用统计学方法:特殊方法论与通用方法论 描述统计学与推断统计学 大量观察,平均分析,归纳推断.2024/5/9 周四22统计学家与数学家的对话n一名统计学家遇到一位数学家,统计学家调侃数学家,说道:“你们不是说若且,则吗,那
12、么想必你若是喜欢一个女孩,那个女孩喜欢的男生你也会喜欢了?”n数学家想了一下,反问道:“如果你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里,想来你也没事吧!因为它们平均不过是五十度而已!”.2024/5/9 周四23DescriptiveandInferentialStatisticsn描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。n推断统计:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行表书的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。.2024/
13、5/9 周四243 统计学基本概念n总体、个体、样本n标志、指标、变量n同质、变异、分布n统计量、参数 同质性是总体的前提 变异性是统计的前提。样样本本总总体体.2024/5/9 周四25第二章 统计调查n一、统计调查概述 n二、统计调查方案n三、统计调查体系数据胜过自封的专家。戴维穆尔.2024/5/9 周四26一、统计调查概述n调查概念:直接搜集资料n调查要求:准确、及时、系统、方便n调查用意:为研究提供素材 对表现进行衡量 用数据阐明问题.2024/5/9 周四27DataSources数据数据来源来源直接来源直接来源间接来源间接来源试验试验出版物出版物(或者网上或者网上)问卷问卷观察观
14、察.2024/5/9 周四28调查方法n观察法:现场,直接n询问法:采访,问卷,通讯,网上n报告法:行政,向上n实验法:随机,双盲,重复.2024/5/9 周四29二、统计调查方案n目的、任务:为什么调查n对象、单位:向谁调查n项目、表格:调查什么n时间、期限:什么时候调查 什么时候的资料.2024/5/9 周四30QuestionnaireDesignn问题内容n问题措辞n问题次序n答问方式n版面设计 .2024/5/9 周四31 普查全面报表抽样调查重点调查典型调查周期性调查一次性调查普查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调 查范围调 查
15、时间组 织形式统计调查种类统计调查种类.2024/5/9 周四32三、统计调查体系n统计报表:定报,年报n普 查:一次,专门n抽样调查:随机,推断n重点调查:重点,大体n典型调查:典型,细致.2024/5/9 周四33统计调查体系改革n我国长期以来,基本上依靠全面统计报表采集统计资料。改革开放后,抽样调查等非全面调查虽然有所发展,但应用的领域不很广泛。这种以全面统计报表为主的统计调查体系,面对日益发展的多种经济成分、多种经营方式等复杂多样的调查对象已经难以适应。n统计调查体系改革的目标模式是:建立以必要的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学推算等为补充的多种方式综合运用的统
16、计调查体系。.2024/5/9 周四34第三章 统计整理n一、整理程序n二、统计分组n三、频数分布n四、统计图表数字不会说谎,但说谎的人会想出办法。格罗夫纳 .2024/5/9 周四35一、整理程序n审核:计算审核,逻辑审核n分组:分类,分组n汇总:手工汇总,电子汇总n表现:列表,图示.2024/5/9 周四36 二、统计分组n概念:划分一个总体为若干组n原则:穷尽,互斥n作用:划分类型,研究结构,分析关系n方法:品质标志分组,数量标志分组.2024/5/9 周四37 三、频数分布n概念:总体单位在各组的分布状况n种类:品质数列,变量数列 单项数列,组距数列n编制:全距,组距,组限,频数n类型
17、:钟型,U型,J型.2024/5/9 周四38 组距数列编制举例 某生产车间50名工人日加工零件数如下:117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121.2024/5/9 周四39n第一步,对数据进行排序,计算全距(R)107108108110112112113114135137139139 n第二步,确定组数(k)和组距(i)k=4i=Rki=
18、10k=1+3.3LgN n第三步,设置组限(u,l)离散变量与连续变量的不同要求n第四步,计算各组次数(f)组距数列编制举例(续1).2024/5/9 周四40组距数列编制举例(续2)50名工人日产零件数.2024/5/9 周四41分布数列类型-钟型分布日产量日产量 (件件).2024/5/9 周四42分布数列类型-型分布.2024/5/9 周四43 分布数列类型-J型分布(1)价格需求.2024/5/9 周四44分布数列类型-J型分布(2)价格供应.2024/5/9 周四45四、统计图表n统计表:主词栏、宾词栏 简单表、分组表、复合表n统计图:分布图、条形图、圆形图 .2024/5/9 周
19、四46统计表举例主词总标题横行标题纵栏标题数字资料宾词.2024/5/9 周四47统计图举例直方图.2024/5/9 周四48 统计图举例(续1)条形图.2024/5/9 周四49 统计图举例(续2)19982002年我国进出口总额(亿美元)复合条形图.2024/5/9 周四50统计图举例(续3)圆形图.2024/5/9 周四51ErrorsinPresentingDatanChartJunk 垃圾数图表nNoRelativeBasis 无相对基准nCompressingVerticalAxis 压缩纵轴nNoZeroPointonVerticalAxis 纵轴无零点.2024/5/9 周四5
20、2垃圾数图表差的表示好的表示1960:$1.001970:$1.601980:$3.101990:$3.80最低工资最低工资0241960197019801990$.2024/5/9 周四53无相对基准好的表示按年级统计的A按年级统计的A差的表示0100200300大一大一大二大二 大三大三 大四大四频数频数0%10%20%30%大一大一大二大二 大三大三 大四大四%.2024/5/9 周四54压缩纵轴好的表示季度销售季度销售差的表示025501季季2季季3季季 4季季$01002001季季 2季季3季季 4季季$.2024/5/9 周四55纵轴无零点好的表示月销售量月销售量差的表示02040
21、60一一 三三 五五 七七 九九 十一十一$36394245一一 三三 五五 七七 九九 十一十一$.2024/5/9 周四56第四章 综合指标n一、总量指标n二、相对指标n三、平均指标统计学家通常醉心于平均数,而不着迷于更广泛的考虑。这一点很像一些英格兰人对瑞士的回忆:如果可以将它的山脉扔进它的湖泊,那么两种讨厌的东西将立即去除。高尔顿.2024/5/9 周四57一、总量指标n概念:反映总体规模、水平;绝对数n分类:时期指标、时点指标n计量:实物单位,价值单位n计算:直接计算、间接推算.2024/5/9 周四58总量指标举例n国内生产总值简称GDP,是由本国常住单位所创造的社会最终产品的价值
22、总量,同时又是全社会各常住单位所创造的增加值的总和。nGDP(各部门总产出该部门中间消耗)各部门的增加值nGDP总消费总投资净出口nGNP GDP付给国外的要素收入+来自国外的要素收入 GDP+来自国外的要素收入净额.2024/5/9 周四59二、相对指标n1 相对指标意义n2 相对指标形式n3 相对指标种类n4 相对指标原则.2024/5/9 周四601 相对指标意义n相对指标是将两个性质相同或互有关联的指标数值通过对比求得的商数或比率;用以反映事物内部的结构、比例,事物发展的程度、强度,事物之间的联系、区别。n对比是统计分析的基本方法。通过对比显示事物的相对水平,可以更深入地说明事物发展的
23、程度和差别,弥补总量指标的不足;提供事物之间共同的比较基础,便利对事物的鉴别和分析。所以说,相对指标具有说明和比较两大作用。.2024/5/9 周四612 相对指标形式n相对指标的指标数值大多是相对数,或称无名数。无名数是一种抽象化的数值,分为系数、倍数、成数、百分数、干分数等。n相对指标是由两个指标分别作为分子项与分母项对比而成的,其分母项作为比较的基础,故称为基数。系数和倍数是将基数抽象为l而计算出来的相对数。成数、百分数、干分数是将基数抽象为10、100、1000计算的相对数,其中百分数最常用。n像人口密度、人均国民生产总值这类相对指标,将其分子项与分母项的计量单位同时使用,即以(人平方
24、公里)、(元人)作为数值形式,此称有名数或名数。.2024/5/9 周四623 相对指标种类n计划完成相对指标n结构相对指标n比例相对指标n比较相对指标n动态相对指标n强度相对指标.2024/5/9 周四634 相对指标原则n保持可比性 n结合绝对数 n运用多指标.2024/5/9 周四64 三、平均指标n 意义 一般水平,坐落位置n 种类 静态平均数,动态平均数 n 作用 说明,比较,判断n计算 数值平均数,位置平均数.2024/5/9 周四65 1数值平均数n算术平均数n调和平均数n几何平均数.2024/5/9 周四66某车间200名工人日产量资料:算术平均数计算举例.2024/5/9 周
25、四67 算术平均数n基本公式:标志总量/总体总量n计算形式:简单平均,加权平均n数学性质:离差、离差平方之和n是非标志:成数是特殊的平均数 .2024/5/9 周四68 两个平均数是否矛盾.2024/5/9 周四69 调和平均数n概念:倒数平均数n应用:算术平均数的变形n结论:对逆指标求平均.2024/5/9 周四70 某局所属的三个企业的资料:调和平均数计算举例.2024/5/9 周四71 两个平均数是否矛盾(续).2024/5/9 周四72 几何平均数n概念:对数平均数n性质:受极端值影响小n结论:对比率、速度求平均.2024/5/9 周四73某企业三个连续作业车间的合格率:几何平均数计算
26、举例.2024/5/9 周四74 2 位置平均数n众数n中位数n四分位数.2024/5/9 周四75 众数n概念:频数最大的标志值n计算:单项数列,组距数列n公式:上限公式,下限公式 .2024/5/9 周四76 众数计算举例.2024/5/9 周四77 中位数n概念:序列正中间的标志值n计算:单项数列,组距数列n公式:上限公式,下限公式.2024/5/9 周四78 四分位数n四分位数:数据分为四份n十分位数:数据分为十份n百分位数:数据分为百份.2024/5/9 周四79 平均指标的关系和原则n 关系 数值平均数之间的关系 数值平均数与位置平均数的关系n 原则 正视同质性 补充组平均 运用多
27、指标.2024/5/9 周四80第五章 变异与均衡指标n一、变异指标n二、偏度峰度n三、均衡指标当事实改变时,我就改变主意。你呢?凯恩斯.2024/5/9 周四81一、变异指标n概念 反映总体内部差异程度或离散程度n作用 评价平均指标的代表性 测度现象发展过程的均衡性、稳定性 揭示总体分布的离中趋势.2024/5/9 周四82n全距 n四分位差n平均差 n方差n标准差 n标准差系数变异指标种类代表着国内军舰建造最高水平的171“海口”号导弹驱逐舰.2024/5/9 周四83标准差计算举例.2024/5/9 周四84标准差系数计算举例甲组日产量(件):60、65、70、75、80乙组日产量(台)
28、:2、5、7、9、12.2024/5/9 周四85二、偏度峰度n1 统计动差n2 偏度指标n3 峰度指标.2024/5/9 周四861 统计动差n动差(又称矩),原是物理学上用以表示力与力臂对重心关系的术语。统计学上标志值与权数对平均数的关系,与此种关系十分相似。因此,统计学借用动差概念,描述次数分布的某些性质或特征。n一般地说,标志值与任意数(A)之差的K次方的算术平均数,称为标志值关于的K阶动差。n一阶原点动差即为算术平均数,二阶中心动差即为方差(标准差的平方)。所以,次数分布的集中趋势和离中趋势等特征,皆可由动差描述。.2024/5/9 周四872 偏度指标n笼统地说,偏度是指频数分布的
29、非对称形态及程度。频数分布的非对称形态依算术平均数与众数的大小关系分为两种:一为右偏态分布,简称右偏或正偏;一为左偏态分布,简称左偏或负偏。左、右偏缘于频数分布曲线向左、右方拖长尾巴,正、负偏缘于算术平均数与众数之差为正、负值。n严格地说,偏度是指偏态分布(包括正偏、负偏)的偏斜程度。而偏度的描述或测定,就是运用适当的指标或方法,度量分布偏斜程度的大小,揭示分布的形态特征。.2024/5/9 周四88 偏度指标计算n皮尔逊指标 以标准差为单位的算术平均数与众数的离差。n三阶中心动差 分布负偏,三阶中心动差为负数;分布正偏,则为正数。为消除三阶中心动差立方单位的影响,也为不同水平数列偏度的直接比
30、较,须将三阶中心动差除以标准差的三次方,以获得数列偏度的相对度量。.2024/5/9 周四89频数分布(非)对称状况Right-Skewed右偏的Left-Skewed左偏的Symmetric对称的 均值均值=中位数中位数 =众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值.2024/5/9 周四903 峰度指标n峰度是频数分布的一种性质或特征。这一特征是指,某一数列的分布曲线与正态分布曲线相比较,是尖顶,还是平顶,其尖顶或平顶的程度如何。n峰度通常分为三种:尖顶峰度、正态峰度和平顶峰度。当标志值的次数,更密集分布于众数左右,使分布曲线较正态分布曲线更为尖耸的,为尖顶峰
31、度;当标志值的次数,完全符合正态分布的规律,分布曲线与正态分布曲线完全一致,为正态峰度,又称为标准峰度;当标志值的次数,更离散分布于众数左右,使分布曲线较正态分布曲线更为平坦的,为平顶峰度。.2024/5/9 周四91峰度指标计算n偶数阶中心动差有一特点,即不论数列的离差为正或负,经偶数次乘方后,皆为正值。由于离差经偶数次乘方后,必加重较大离差的分量,能使它在度量分布的峰度中发挥作用。n可以取数列的偶数阶中心动差,作为分布峰度的测度指标。偶数阶中心动差只能作为峰度的绝对度量,还必须经适当处理,形成一种峰度的相对度量的指标。n可以证明,正态分布的四阶中心动差与其标准差的四次方之比值为3。所以,通
32、常以数列的四阶中心动差与其标准差的四次方之比,作为测度峰度的指标。.2024/5/9 周四92尖顶与平顶n峰度指标=3,分布为正态峰度,当峰度指标3时,表示频数分布比正态分布更集中,分布呈尖峰状态,3)(=3)(F,则拒绝原假设H0,表明平均数值之间的差异是显著的,所检验的因素(A)对观察值有显著影响。若FF ,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响。.2024/5/9 周四239多重比较多重比较是通过对总体平均数之间的配对比较来进一步检验到底哪些均值之间存在差异。Fisher提出的最小显著差异方法(LSD)可用于判断到底哪些均值之间有差异。LSD方法是对检验两个总体
33、平均数是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的。.2024/5/9 周四240多重比较的步骤提出假设:H0:i=j(第i个总体的平均数等于第j个总体的平均数)H1:i j(第i个总体的平均数不等于第j个总体的平均数)计算检验统计量:做出决策:若|t t|t t,拒绝H H0 0;若|t t|F3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响;FB2.100846F3.2592,接受原假设H0,说明销售地区对彩电的销售量没有显著影响.2024/5/9 周四250第十二章 相关分析n一、基本问题n二、相关系数n三、回归方程有其父必有其子。中国谚语.2024
34、/5/9 周四251一、基本问题n概念:函数关系、相关关系n类型:简单相关、复杂相关n任务:相关分析、回归分析.2024/5/9 周四252函数关系n一一对应的确定关系。n设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x。当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量。n各观测点落在一条上。x xy y.2024/5/9 周四253相关关系 变量间关系不能用函数关系精确表达。一个变量的取值不能由另一个变量唯一确定。当变量 x 取某个值时,变量 y 的取值可能有几个。各观测点分布在
35、直线周围。x xy y.2024/5/9 周四254 相关关系类型相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关.2024/5/9 周四255相关分析任务n对经济、管理现象之间相关关系的统计研究,主要解决两个方面的问题,或完成两个方面的任务:n其一,测定相关关系的密切程度,一般称为相关分析;n其二,揭示相关变量的互动规律,一般称为回归分析。.2024/5/9 周四256二、相关系数n概念:对两个变量之间线性相关程度和相关方向的度量。n公式:n举例:下页。.2024/5/9 周四257相关系数举例为为研研究究我我国国人人均
36、均消消费费水水平平的的问问题题,把把人人均均消消费费额额记记为为y y,把把人人均均国国民民收收入入记记为为x x。收收集集到到1981198119931993年年的的样样本本数数据据(x xi i ,y yi i),i i=1,2,=1,2,,1313,数据见下表。试计算相关系数。,数据见下表。试计算相关系数。.2024/5/9 周四258相关关系计算结果n根据样本相关系数的计算公式有n人均国民收入与人均消费金额之间的相关系 数为 0.9987。.2024/5/9 周四259相关系数取值及其意义r的取值范围是-1,1|r|=1,为完全相关 r=1,为完全正相关 r=-1,为完全负相关 r=0
37、,不存在线性相关关系 -1r0,为负相关 0 t t,拒绝拒绝H H0 0 若若 t t =64.9809t t(13-2)=2.201(13-2)=2.201,拒绝,拒绝H H0 0,人均,人均 消费金额与人均国民收入之间的相关关系显著。消费金额与人均国民收入之间的相关关系显著。.2024/5/9 周四262三、回归方程n概念:对变量之间互动规律的具体模式的量化描述。n类型:一元回归,多元回归。n举例:下页。n评价:判定系数,估计标准误差。.2024/5/9 周四263回归方程类型一个自变量一个自变量两个及以上自变量两个及以上自变量回归方程回归方程多元回归多元回归一元回归一元回归线性线性回归
38、回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归.2024/5/9 周四264回归方程举例 根据前例数据,配合人均消费金额对人均国民收入的一元线性回归方程,并以最小平方法求解方程中的两个参数,得y=54.22286+0.52638x.2024/5/9 周四265回归方程图示y=54.22286+0.52638x.2024/5/9 周四266判定系数 回归平方和占总离差平方和的比例评价回归直线的拟合程度取值范围在0,1之间 r21,说明回归方程拟合得越好r20,说明回归方程拟合得越差判定系数等于相关系数的平方,即r2(r)2.2024/5/9 周四267估计标准误差 估计标准误差是实
39、际观察值与回归估计值离差平方和的均方根,反映实际观察值在回归直线周围的分散状况。它从另一个角度说明了回归直线的拟合程度。其计算公式为:上例的计算结果为14.949678.2024/5/9 周四268利用回归方程进行估计或预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值的一个估计值E(y0),这就是估计或预测。前例子中,当人均国民收入为 2000元时,我们可以估计人均消费金额的的平均值为.2024/5/9 周四269相关分析与回归分析的区别n相关分析中,变量x变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x称为自变量,用于预测因变
40、量的变化。n相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。n相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。.2024/5/9 周四270正确运用相关分析n相关分析只是一种重要的研究工具、分析手段,在运用它于具体研究对象时,必须以有关的科学理论、专业知识为指导。n变量间的相随变动或共同变动,可能确实彼此之间存有因果关系或互为因果,也可能没有直接关系。例,由于观察资料的偶然巧合,可能会出现诸如某地白酒消费量与自杀者人数同时增
41、加、卷烟销售量与患肺病人数同时上升的数据。其实,它们之间并无直接关联。所以,必须在定性分析的基础上,正确运用相关分析方法。.2024/5/9 周四271第十三章 统计综合评价n一、综合评价概述 n二、评价指标选择n三、指标权重确定n四、综合评价结果.2024/5/9 周四272一、综合评价概述n单项评价是利用一个统计指标对事物的某一个方面作出判断。n综合评价,则是根据研究的目的,建立一个统计指标体系,对事物的各个方面进行定量分析,得出概括性的结论,从而揭示事物的本质及其发展规律。n综合评价的基本步骤:建立评价指标体系量化处理评价指标确定评价指标权重综合最终评价结果。.2024/5/9 周四27
42、3二、评价指标选择n定性选择方法有综合法和分析法:综合法一般是通过研讨会或征询意见的方式,集中专家们的意见,以确定评价指标。分析法是将评价的对象划分为若干个组成部分或不同的侧面,对每一侧面分别选用一个或若干个指标以反映评价对象的特征。n定量选择方法有试算法和系统聚类法:(下页).2024/5/9 周四274 n试算法是通过历史资料的试算来判断指标的有效性。n系统聚类法是通过判断指标之间的相似程度来筛选指标的一种方法。n系统聚类法的具体操作步骤:度量指标(类)间的相似程度度量指标(类)间的距离确定最具有代表性的指标(类)。试算法、系统聚类法.2024/5/9 周四275三、量化处理评价指标n在综
43、合评价中,有些评价指标本来属于定性评价,对这些指标应进行量化处理。n量化处理常用的方法是:先对评价的各等级赋予不同的分值,再聘请足够数量的评议者,请评议者对评价对象进行评议,在所列的评语等级中选择一个他认为最恰当的等级,而后计算各等级得票数,再用得票数对比总票数,计算出得票频率。n对定量指标,必要时应进行同度量处理。主要有相对化处理、标准化处理、功效系数法处理。.2024/5/9 周四276 相对化处理n进行相对化处理,必须先对每个评价指标确定一个标准值,而后计算实际值与标准值之比。n指标有“正”、“逆”之分,对于正指标,以实际值对比标准值;对于逆指标,以标准值对比实际值。n标准值的选择:可用
44、参加评价单位某一时期的平均值或最优值作为标准值,也可选择国际先进水平、历史最高水平或计划规定水平等作为标准值。.2024/5/9 周四277 标准化处理n进行标准化处理的基本前提是变量必须服从正态分布。n将变量值(指标值)转化为数学期望为0、方差为1的标准化数值。n经标准化处理后的数值围绕着0上下波动,数值大于0的说明高于平均水平,数值小于0的说明低于平均水平。.2024/5/9 周四278 功效系数法处理n功效系数法借助功效系数,把确定要评价的各项指标值转化为可以度量的评判分数。n利用功效系数法进行消除量纲影响的处理,必须对评价的指标确定一对阈值,包括一个下限值(不容许值)和一个上限值(满意
45、值)。n可采用历年来最差值、最优值作为不容许值、满意值;或以第i项指标数列中较差(好)的10%的数值平均数确定。.2024/5/9 周四279功效系数计算公式n功效系数n式中,为第i个指标实际值;为第i个指标的不容许值;为第i个指标的满意值,为第i 项指标单项评分。.2024/5/9 周四280三、指标权重确定n在综合评价的一个论域中,对目标值起权衡轻重作用的数值即权重,也称权数。确定权重的方法有:n统计平均法。根据专家们对各评价指标所赋予的相对重要性系数分别求其算术平均数,所得的平均数作为各指标的权重。n最大组中值法。评价指标体系U中含有u1,u2,un个指标,请有关专家(m30人组成)根据
46、权数分配表,对U中的各项指标,提出自己认为最合适的权数。再根据专家估测的资料,进行单因素的权数统计。.2024/5/9 周四281 指标权重确定方法n确定权重的方法还有:n层次分析法(AnalyticHierarchyProcess,AHP)。将复杂的评价对象表示为一个有序的递阶层次结构的整体,通过人们在各个评价项目间进行两两的比较、判断,进而计算各个评价项目的相对重要性系数,即权数。n变异系数法。在评价指标体系中,指标取值差异越大的也就是越难实现的指标。差异越大的指标越重要,因为它更能反映出参加评价的各单位的差距。.2024/5/9 周四282四、综合评价结果n综合评价结果的方法有:n总分评
47、定法 定序尺度、定距尺度、定比尺度的指标n加权平均法 算术平均、几何平均n最优值距离法 正指标、逆指标.2024/5/9 周四283 总分评定法n总分评定法是通过将变量值转化为分值,而后将各个评价对象的分值加总的方法。n对于以定距尺度或定比尺度计量的评价指标,例如动态对比指标,以报告期值对比基期值,可采用三档记分:报告期对比基期增加者,记满分;报告期与基期持平者,减半记分;报告期比基期下降者计零分。n对于以定序尺度计量的评价项目,一般把该项目划分为若干个评分等级,并对不同等级赋予适当的分值,然后请足够多的评判者按预定的评分等级对该项目评分。n最后综合评判结果,即把各指标(或各项目)得分加总,得
48、到该评价对象的总分。.2024/5/9 周四284 加权平均法n加权算术平均法n加权几何平均法 n 左式中,评价指标体系的容量为nn xi为已经经同度量处理过的第i个评价指标的相对值n wi为各项指标的权重。n i=1,2,n.2024/5/9 周四285 最优值距离法n最优值距离法是以各项评价指标的实际值与最优值(或标准值)之间距离的大小来衡量评价对象效益的高低。对评价指标体系中的各评价指标进行相对化处理后,运用距离法进行综合,其综合值反映了各评价指标与相应的最优值(或标准值之间的距离)。n计算公式是Sj=.2024/5/9 周四286Sj 值的含义nSj值越小,与最优值越接近,表明效益越佳
49、;Sj值越大,越远离最优值,表明效益越低。n上式中,xij=Xij/Xi0,为经相对化处理后的变量值。Xij 为第j个参评单位的第i个评价指标的实际值;Xi0为第i项指标的最优值或标准值,它们可以是全国的先进水平或历史的最高水平,也可以根据经济发展规划而确定。权数Wi是根据各项评价指标在社会再生产过程中的重要程度分别确定相应的权数。n进行相对化处理时,对于正指标,以实际值对比标准值;对于逆指标,以标准值对比实际值。.2024/5/9 周四287第十四章 国民经济统计概述n一、国民经济统计基本内容n二、国民经济统计主要分类n三、国民经济统计基础指标n四、国民经济统计分析指标.2024/5/9 周
50、四288一、国民经济统计基本内容n1 国民经济核算n2国民经济核算体系n3我国国民经济核算体系n4 国民经济核算基本原则.2024/5/9 周四2891 国民经济核算n国民经济是由全社会各单位、各部门构成的有机整体,同时又是社会再生产各环节的总和,是一个不断循环的宏观经济运行过程。n“国民经济统计”也称“国民经济核算”,它是以国民经济整体为对象而进行的一种统计核算,藉此从数量角度研究国民经济运行的条件、过程、结果及其内在联系。.2024/5/9 周四2902 国民经济核算体系n国民经济核算体系是国家或国际组织为统一规范国民经济核算而制定的一套宏观核算制度。n世界上曾经存在着两种不同模式的国民经
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100