收藏 分销(赏)

应用统计学PPT课件.ppt

上传人:pc****0 文档编号:13755736 上传时间:2026-04-10 格式:PPT 页数:317 大小:3.97MB 下载积分:10 金币
下载 相关 举报
应用统计学PPT课件.ppt_第1页
第1页 / 共317页
应用统计学PPT课件.ppt_第2页
第2页 / 共317页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Jinlong,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Jinlong,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Jinlong,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Jinlong,*,2026/4/10 周五,1,在终极的分析中,一切知识都是历史在抽象的意义下,一切都是科学数学在理性的基础上,所有的判断都是统计学,C.R.,劳,应用统计学,2026/4/10 周五,2,1,统计学是什么,Statistics is the science of collecting,organizing,presenting,analyzing,and interpreting numerical data to assist in making more effective decisions.,统计学是关于下列活动的方法和程序:,采集数据,例如问卷调查,呈现数据,例如绘制图表,概括数据,例如计算均值,分析数据,例如区间估计,做出决策,例如假设检验,2026/4/10 周五,3,无处不在的统计,在诺贝尔经济学获奖者中,,2/3,以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,经济学,12,版中特别提到:,“,在许多与经济学有关的学科中,统计学是特别重要的,”,。,1981,年,首届国际,红楼梦,研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为,从词汇上的统计论,红楼梦,作者的问题,的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对,红楼梦,后,40,回系高鹗所作这一流行看法提出异议,认为,120,回均系曹雪芹所作。,2026/4/10 周五,4,无处不在的统计,(续),大仲马的作品多曲折感人,而他又多私生子。取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准。果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:,“,所有统计数字都是撒谎的,包括有关本人的数字在内,”,。听众哄堂大笑。,2026/4/10 周五,5,统计的应用,学者不能离开统计而研究,政治家不能离开统计而施政,企业家不能离开统计而执业,-,马寅初,2026/4/10 周五,6,2,如何学统计学,Cultivate your statistical awareness in your daily life,.,numeric information on newspaper,TV program,webs,Read some good books on statistics,books magazines,Practice statistical skills by exercises and computer software.,Excel Spss Sas,2026/4/10 周五,7,3,教材及参考文献,应用统计学,,施金龙、吕洁,南京大学出版社,,2005,统计学,,贾俊平、何晓群、金勇进,中国人民大学出版社,,2002,统计学概论,,曾五一,首都经济贸易大学出版社,,2003,统计学的世界,,戴维,S,穆尔,中信出版社,,2003,The Basic Practice of Statistics,,,David S.,Moore,,,W.H.Freeman Company,出版社,,2004,2026/4/10 周五,8,4,课程成绩评定,期末书面考试成绩,(,70%,),平时各项表现成绩,(,30%,),课堂参与,(,10%,),作业完成,(,20%,),2026/4/10 周五,9,5,课程主要内容,第一章 绪论,第二章 统计调查,第三章 统计整理,第四章 综合指标,第五章 变异与均衡指标,第六章 时间数列,2026/4/10 周五,10,课程主要内容,(续),第七章 指数,第八章 抽样分布,第九章 参数估计,第十章 假设检验,第十一章 方差分析,第十二章 相关分析,2026/4/10 周五,11,第一章 绪论,一、统计涵义,二、统计工作,三、统计资料,四、统计科学,那些默默无闻的统计学家们已经改变了我们的世界,不是由发现新的事实或技术,而是改变了我们推理和试验的方法,以及我们对这个世界,的观念的形成方式。,哈克英,2026/4/10 周五,12,一、统计涵义,Statistics:,(,1,),Numeric data,when used as plural of statistic.,(,2,),A scientific procedure used in the study and evaluation of numeric data.,统计:,(,1,),统计工作,(,2,),统计资料,(,3,),统计科学,2026/4/10 周五,13,二、统计工作,工作任务:,调查、分析,服务、监督,工作职能:,信息,咨询,监督,工作过程:,设计,调查,整理,分析,工作组织:,集中、分散,综合、专业,2026/4/10 周五,14,三、统计资料,数据计量:定类、定序,定距、定比。,定类尺度是按照客观现象的某种属性对其进行分类。例如,人口按性别分为男女,用,“,1”,表示男性,用,“,0”,表示女性。定类尺度的主要数学特征是,“,=”,或,“”,。,定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。例如,学生成绩可以分为优、良、中、及格和不及格等五类。定序尺度的主要数学特征是,“,”,。,2026/4/10 周五,15,数据计量,定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是,“,+”,或,“,”,。统计中的总量指标就是运用定距尺度计量的。,定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数,(,或平均数,),,用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是,“,”,或,“,”,。,2026/4/10 周五,16,数据类型,Quantitative(or measurement)data,Qualitative(or categorical)data,Discrete data,,,Continuous data,横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。,数据信息知识智慧,2026/4/10 周五,17,四、统计科学,1,统计学发展简史,2,统计学对象方法,3,统计学基本概念,2026/4/10 周五,18,1,统计学发展简史,英国(,1690,),,威廉,配第,政治算术,德国(,1749,),,阿亨瓦尔,国势学,比利时(,19,世纪中),,凯特勒,数理统计,德国(,19,世纪中),,恩格尔,社会统计,2026/4/10 周五,19,理论统计学和应用统计学,历经,300,多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。,统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。,从横向看,各种统计学都具有上述共同点,因而能够形成一个学科,“,家族,”,。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。,现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另一类是以各个不同领域的具体数量为研究对象的应用统计学。,2026/4/10 周五,20,统计学学科体系,经,济,学,社,会,学,教,育,学,其,他,社,科,物,理,学,生,物,学,医,学,其,他,理,工,农,经,济,统,计,社,会,统,计,教,育,统,计,其,他,社,科,统,计,统,计,学,物,理,统,计,生,物,统,计,医,药,统,计,其,他,理,工,农,统,计,统计学家未必是经济学家,,经济学家也未必是统计学家。,但经济统计学家应当,-,既是统计学家又是经济学家。,2026/4/10 周五,21,2,统计学对象方法,对象:,实质性学科与方法论学科,理论统计学与应用统计学,方法:,特殊方法论与通用方法论,描述统计学与推断统计学,大量观察,平均分析,归纳推断,2026/4/10 周五,22,统计学家与数学家的对话,一名统计学家遇到一位数学家,统计学家调侃数学家,说道:,“,你们不是说若且,则吗,那么想必你若是喜欢一个女孩,那个女孩喜欢的男生你也会喜欢了,?,”,数学家想了一下,反问道:,“,如果你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里,想来你也没事吧!因为它们平均不过是五十度而已,!,”,2026/4/10 周五,23,Descriptive and Inferential Statistics,描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。,推断统计:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行表书的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。,2026/4/10 周五,24,3,统计学基本概念,总体、个体、样本,标志、指标、变量,同质、变异、分布,统计量、参数,同质性是总体的前提,变异性是统计的前提。,样本,总体,2026/4/10 周五,25,第二章 统计调查,一、统计调查概述,二、统计调查方案,三、统计调查体系,数据胜过自封的专家。,戴维,穆尔,2026/4/10 周五,26,一、统计调查概述,调查概念:直接搜集资料,调查要求:准确、及时、系统、方便,调查用意:,为研究提供素材,对表现进行衡量,用数据阐明问题,2026/4/10 周五,27,Data Sources,数据,来源,直接来源,间接来源,试验,出版物,(,或者网上,),问卷,观察,2026/4/10 周五,28,调查方法,观察法:,现场,直接,询问法:,采访,问卷,通讯,网上,报告法:,行政,向上,实验法:,随机,双盲,重复,2026/4/10 周五,29,二、统计调查方案,目的、任务:,为什么调查,对象、单位:,向谁调查,项目、表格:,调查什么,时间、期限:,什么时候调查,什么时候的资料,2026/4/10 周五,30,Questionnaire Design,问题内容,问题措辞,问题次序,答问方式,版面设计,2026/4/10 周五,31,普 查,全面报表,抽样调查,重点调查,典型调查,周期性调查,一次性调查,普 查,抽样调查,重点调查,典型调查,全面调查,非全面调查,连续,(,经常性,),调查,不连续调查,定期报表,专门调查,调查范 围,调查时 间,组织形 式,统,计调查种类,统计调查种类,2026/4/10 周五,32,三、统计调查体系,统计报表:,定报,年报,普 查:,一次,专门,抽样调查:,随机,推断,重点调查:,重点,大体,典型调查:,典型,细致,2026/4/10 周五,33,统计调查体系改革,我国长期以来,基本上依靠全面统计报表采集统计资料。改革开放后,抽样调查等非全面调查虽然有所发展,但应用的领域不很广泛。这种以全面统计报表为主的统计调查体系,面对日益发展的多种经济成分、多种经营方式等复杂多样的调查对象已经难以适应。,统计调查体系改革的目标模式是:建立以必要的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学推算等为补充的多种方式综合运用的统计调查体系。,2026/4/10 周五,34,第三章 统计整理,一、整理程序,二、统计分组,三、频数分布,四、统计图表,数字不会说谎,但说谎的人会想出办法。,格罗夫纳,2026/4/10 周五,35,一、整理程序,审核:计算审核,逻辑审核,分组:分类,分组,汇总:手工汇总,电子汇总,表现:列表,图示,2026/4/10 周五,36,二、统计分组,概念:划分一个总体为若干组,原则:穷尽,互斥,作用:划分类型,研究结构,分析关系,方法:品质标志分组,数量标志分组,2026/4/10 周五,37,三、频数分布,概念:总体单位在各组的分布状况,种类:品质数列,变量数列,单项数列,组距数列,编制:全距,组距,组限,频数,类型:钟型,,U,型,,J,型,2026/4/10 周五,38,组距数列编制举例,某生产车间,50,名工人日加工零件数如下:,117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,2026/4/10 周五,39,第一步,对数据进行排序,计算全距,(,R,),107 108 108 110 112 112 113 114 135 137 139 139,第二步,确定组数(,k,)和组距(,i,),k=4,i=Rk,i=10,k,=1+3.3 Lg N,第三步,设置组限(,u,,,l,),离散变量与连续变量的不同要求,第四步,计算各组次数(,f,),组距数列编制举例,(续,1,),2026/4/10 周五,40,组距数列编制举例,(续,2,),按零件数分组,次数,(,频数,),频率,(%),向上累计,向下累计,次数,频 率,(,%,),次数,频 率,(,%,),110,以下,3,6,3,6,50,100,110120,13,26,16,32,42,84,120130,24,48,40,80,20,40,130140,10,20,50,100,4,8,合计,50,100,50,名工人日产零件数,2026/4/10 周五,41,分布数列类型,-,钟型分布,日产量,(,件,),2026/4/10 周五,42,分布数列类型,-,型分布,2026/4/10 周五,43,分布数列类型,-,J,型分布,(1),价格,需求,2026/4/10 周五,44,分布数列类型,-,J,型分布,(2),价格,供应,2026/4/10 周五,45,四、统计图表,统计表,:,主词栏、宾词栏,简单表、分组表、复合表,统计图,:,分布图、条形图、圆形图,2026/4/10 周五,46,统计表举例,主词,总标题,横行,标题,纵栏标题,数字资料,宾词,2026/4/10 周五,47,统计图举例,直方图,2026/4/10 周五,48,统计图举例,(续,1,),条形图,2026/4/10 周五,49,统计图举例,(续,2,),19982002,年我国进出口总额,(,亿美元,),复合条形图,2026/4/10 周五,50,统计图举例,(续,3,),圆形图,2026/4/10 周五,51,Errors in Presenting Data,Chart Junk,垃圾数图表,No Relative Basis,无相对基准,Compressing Vertical Axis,压缩纵轴,No Zero Point on Vertical Axis,纵轴无零点,2026/4/10 周五,52,垃圾数图表,差的表示,好的表示,1960:$1.00,1970:$1.60,1980:$3.10,1990:$3.80,最低工资,最低工资,0,2,4,1960,1970,1980,1990,$,2026/4/10 周五,53,无相对基准,好的表示,按年级统计的,A,按年级统计的,A,差的表示,0,100,200,300,大一,大二,大三,大四,频数,0%,10%,20%,30%,大一,大二,大三,大四,%,2026/4/10 周五,54,压缩纵轴,好的表示,季度销售,季度销售,差的表示,0,25,50,1,季,2,季,3,季,4,季,$,0,100,200,1,季,2,季,3,季,4,季,$,2026/4/10 周五,55,纵轴无零点,好的表示,月销售量,月销售量,差的表示,0,20,40,60,一,三,五,七,九,十一,$,36,39,42,45,一,三,五,七,九,十一,$,2026/4/10 周五,56,第四章 综合指标,一、总量指标,二、相对指标,三、平均指标,统计学家通常醉心于平均数,而不着迷于,更广泛的考虑。这一点很像一些英格兰人,对瑞士的回忆:如果可以将它的山脉扔进,它的湖泊,那么两种讨厌的东西将立即去,除。,高尔顿,2026/4/10 周五,57,一、总量指标,概念:反映总体规模、水平;绝对数,分类:时期指标、时点指标,计量:实物单位,价值单位,计算:直接计算、间接推算,2026/4/10 周五,58,总量指标举例,国内生产总值简称,GDP,,是由本国常住单位所创造的社会最终产品的价值总量,同时又是全社会各常住单位所创造的增加值的总和。,GDP,(,各部门总产出该部门中间消耗,),各部门的增加值,GDP,总消费总投资净出口,GNP,GDP,付给国外的要素收入,+,来自国外的要素收入,GDP,+,来自国外的要素收入净额,2026/4/10 周五,59,二、相对指标,1,相对指标意义,2,相对指标形式,3,相对指标种类,4,相对指标原则,2026/4/10 周五,60,1,相对指标意义,相对指标是将两个性质相同或互有关联的指标数值通过对比求得的商数或比率;用以反映事物内部的结构、比例,事物发展的程度、强度,事物之间的联系、区别。,对比是统计分析的基本方法。通过对比显示事物的相对水平,可以更深入地说明事物发展的程度和差别,弥补总量指标的不足;提供事物之间共同的比较基础,便利对事物的鉴别和分析。所以说,相对指标具有说明和比较两大作用。,2026/4/10 周五,61,2,相对指标形式,相对指标的指标数值大多是相对数,或称无名数。无名数是一种抽象化的数值,分为系数、倍数、成数、百分数、干分数等。,相对指标是由两个指标分别作为分子项与分母项对比而成的,其分母项作为比较的基础,故称为基数。系数和倍数是将基数抽象为,l,而计算出来的相对数。成数、百分数、干分数是将基数抽象为,10,、,100,、,1000,计算的相对数,其中百分数最常用。,像人口密度、人均国民生产总值这类相对指标,将其分子项与分母项的计量单位同时使用,即以,(,人平方公里,),、,(,元人,),作为数值形式,此称有名数或名数。,2026/4/10 周五,62,3,相对指标种类,计划完成相对指标,结构相对指标,比例相对指标,比较相对指标,动态相对指标,强度相对指标,2026/4/10 周五,63,4,相对指标原则,保持可比性,结合绝对数,运用多指标,2026/4/10 周五,64,三、平均指标,意义 一般水平,坐落位置,种类 静态平均数,动态平均数,作用 说明,比较,判断,计算 数值平均数,位置平均数,2026/4/10 周五,65,1,数值平均数,算术平均数,调和平均数,几何平均数,2026/4/10 周五,66,日产量,(,公斤),工人数,f,组中值,x,日产总量,x f,30,以下,10,?,?*10,30,40,70,35,2450,40,50,90,45,4050,50,60,30,55,1650,合 计,200,8400,某车间,200,名工人日产量资料:,算术平均数计算举例,2026/4/10 周五,67,算术平均数,基本公式:,标志总量,/,总体总量,计算形式:,简单平均,加权平均,数学性质:,离差、离差平方之和,是非标志:,成数是特殊的平均数,2026/4/10 周五,68,两个平均数是否矛盾,工人,件,/,小时,分钟,/,件,甲,3,20,乙,2,30,平均,2.5,25,2026/4/10 周五,69,调和平均数,概念:倒数平均数,应用:算术平均数的变形,结论:对逆指标求平均,2026/4/10 周五,70,企,业,产值计划完成,(%),x,计划产值,(,万元,),m/x,实际产值,(,万元,),(m),甲,95,300,285,乙,105,900,945,丙,115,300,345,合计,1500,1575,某局所属的三个企业的资料:,调和平均数计算举例,2026/4/10 周五,71,两个平均数是否矛盾,(续),商品,P,1,P,0,P,1,/P,0,(%),P,0,/P,1,(%),A,8,4,200,50,B,3,6,50,200,平均,125,125,2026/4/10 周五,72,几何平均数,概念,:,对数平均数,性质,:,受极端值影响小,结论,:,对比率、速度求平均,2026/4/10 周五,73,车间,投入量,产出量,合格率,(%),x,一,1000,800,80,二,800,720,90,三,720,504,70,某企业三个连续作业车间的合格率:,几何平均数计算举例,2026/4/10 周五,74,2,位置平均数,众数,中位数,四分位数,2026/4/10 周五,75,众数,概念:频数最大的标志值,计算:单项数列,组距数列,公式:上限公式,下限公式,2026/4/10 周五,76,年人均纯收入(千元),农户数,(户),5,以下,240,56,480,67,1100,78,700,89,320,9,以上,160,合计,3000,众数计算举例,2026/4/10 周五,77,中位数,概念:,序列正中间的标志值,计算:,单项数列,组距数列,公式:,上限公式,下限公式,2026/4/10 周五,78,四分位数,四分位数:,数据分为四份,十分位数:,数据分为十份,百分位数:,数据分为百份,2026/4/10 周五,79,平均指标的关系和原则,关系,数值平均数之间的关系,数值平均数与位置平均数的关系,原则,正视同质性,补充组平均,运用多指标,2026/4/10 周五,80,第五章 变异与均衡指标,一、变异指标,二、偏度峰度,三、均衡指标,当事实改变时,我就改变主意。你呢?,凯恩斯,2026/4/10 周五,81,一、变异指标,概念,反映总体内部差异程度或离散程度,作用,评价平均指标的代表性,测度现象发展过程的均衡性、稳定性,揭示总体分布的离中趋势,2026/4/10 周五,82,全距,四分位差,平均差,方差,标准差,标准差系数,变异指,标种类,代表着国内军舰建造最高水平的,171“,海口”号导弹驱逐舰,2026/4/10 周五,83,标准差计算举例,日产量(公斤),工人数,f,组中值,x,2030,10,25,2880,3040,70,35,3430,4050,90,45,810,5060,30,55,5070,合 计,200,12190,2026/4/10 周五,84,标准差系数计算举例,组别,平均数,标准差,标准差系数,%,甲,70,(,件,),7.07,(件),10.1,乙,7,(,台,),3.41,(台),48.7,甲组日产量(件):,60,、,65,、,70,、,75,、,80,乙组日产量(台):,2,、,5,、,7,、,9,、,12,2026/4/10 周五,85,二、偏度峰度,1,统计动差,2,偏度指标,3,峰度指标,2026/4/10 周五,86,1,统计动差,动差,(,又称矩,),,原是物理学上用以表示力与力臂对重心关系的术语。统计学上标志值与权数对平均数的关系,与此种关系十分相似。因此,统计学借用动差概念,描述次数分布的某些性质或特征。,一般地说,标志值与任意数,(,A,),之差的,K,次方的算术平均数,称为标志值关于的,K,阶动差。,一阶原点动差即为算术平均数,二阶中心动差即为方差,(,标准差的平方,),。所以,次数分布的集中趋势和离中趋势等特征,皆可由动差描述。,2026/4/10 周五,87,2,偏度指标,笼统地说,偏度是指频数分布的非对称形态及程度。频数分布的非对称形态依算术平均数与众数的大小关系分为两种:一为右偏态分布,简称右偏或正偏;一为左偏态分布,简称左偏或负偏。左、右偏缘于频数分布曲线向左、右方拖长尾巴,正、负偏缘于算术平均数与众数之差为正、负值。,严格地说,偏度是指偏态分布,(,包括正偏、负偏,),的偏斜程度。而偏度的描述或测定,就是运用适当的指标或方法,度量分布偏斜程度的大小,揭示分布的形态特征。,2026/4/10 周五,88,偏度指标计算,皮尔逊指标,以标准差为单位的算术平均数与众数的离差。,三阶中心动差,分布负偏,三阶中心动差为负数;分布正偏,则为正数。为消除三阶中心动差立方单位的影响,也为不同水平数列偏度的直接比较,须将三阶中心动差除以标准差的三次方,以获得数列偏度的相对度量。,2026/4/10 周五,89,频数分布(非)对称状况,Right-Skewed,右偏的,Left-Skewed,左偏的,Symmetric,对称的,均值,=,中位数,=,众数,均值,中位数,众数,众数,中位数,均值,2026/4/10 周五,90,3,峰度指标,峰度是频数分布的一种性质或特征。这一特征是指,某一数列的分布曲线与正态分布曲线相比较,是尖顶,还是平顶,其尖顶或平顶的程度如何。,峰度通常分为三种:尖顶峰度、正态峰度和平顶峰度。当标志值的次数,更密集分布于众数左右,使分布曲线较正态分布曲线更为尖耸的,为尖顶峰度;当标志值的次数,完全符合正态分布的规律,分布曲线与正态分布曲线完全一致,为正态峰度,又称为标准峰度;当标志值的次数,更离散分布于众数左右,使分布曲线较正态分布曲线更为平坦的,为平顶峰度。,2026/4/10 周五,91,峰度指标计算,偶数阶中心动差有一特点,即不论数列的离差为正或负,经偶数次乘方后,皆为正值。由于离差经偶数次乘方后,必加重较大离差的分量,能使它在度量分布的峰度中发挥作用。,可以取数列的偶数阶中心动差,作为分布峰度的测度指标。偶数阶中心动差只能作为峰度的绝对度量,还必须经适当处理,形成一种峰度的相对度量的指标。,可以证明,正态分布的四阶中心动差与其标准差的四次方之比值为,3,。所以,通常以数列的四阶中心动差与其标准差的四次方之比,作为测度峰度的指标。,2026/4/10 周五,92,尖顶与平顶,峰度指标,=3,,分布为正态峰度,当峰度指标,3,时,表示频数分布比正态分布更集中,分布呈尖峰状态,,3,),(=3),(,F,,则拒绝原假设,H,0,,表明平均数值之间的差异是显著的,所检验的因素(,A,)对观察值有显著影响。,若,F,F,,则不能拒绝原假设,H,0,,表明所检验的因素(,A,)对观察值没有显著影响。,2026/4/10 周五,239,多重比较,多重比较是通过对总体平均数之间的配对比较来进一步检验到底哪些均值之间存在差异。,Fisher,提出的最小显著差异方法(,LSD,),可用于判断到底哪些均值之间有差异。,LSD,方法是对检验两个总体平均数是否相等的,t,检验方法的总体方差估计加以修正(用,MSE,来代替)而得到的。,2026/4/10 周五,240,多重比较的步骤,提出假设:,H,0,:,m,i,=,m,j,(,第,i,个总体的平均数等于第,j,个总体的平均数,),H,1,:,m,i,m,j,(,第,i,个总体的平均数不等于第,j,个总体的平均数,),计算检验统计量:,做出决策:,若,|,t,|,t,,,拒绝,H,0,;,若,|,t,|,F,3.4903,,,拒绝原假设,H,0,,说明彩电的品牌对销售量有显著影响;,F,B,2.100846,F,3.2592,,,接受原假设,H,0,,说明销售地区对彩电的销售量没有显著影响,2026/4/10 周五,250,第十二章 相关分析,一、基本问题,二、相关系数,三、回归方程,有其父必有其子。,中国谚语,2026/4/10 周五,251,一、基本问题,概念:函数关系、相关关系,类型:简单相关、复杂相关,任务:相关分析、回归分析,2026/4/10 周五,252,函数关系,一一对应的确定关系。,设有两个变量,x,和,y,,,变量,y,随变量,x,一起变化,并完全依赖于,x,。,当变量,x,取某个数值时,,y,依确定的关系取相应的值,则称,y,是,x,的函数,,,记为,y=f(x),,,其中,x,称为自变量,,y,称为因变量。,各观测点落在一条上。,x,y,2026/4/10 周五,253,相关关系,变量间关系不能用函数关系精确表达。,一个变量的取值不能由另一个变量唯一确定。当变量,x,取某个值时,,,变量,y,的取值可能有几个。,各观测点分布在直线周围。,x,y,2026/4/10 周五,254,相关关系类型,相关关系,非线性相关,线性相关,正相关,正相关,负相关,负相关,完全相关,不相关,2026/4/10 周五,255,相关分析任务,对经济、管理现象之间相关关系的统计研究,主要解决两个方面的问题,或完成两个方面的任务:,其一,测定相关关系的密切程度,一般称为相关分析;,其二,揭示相关变量的互动规律,一般称为回归分析。,2026/4/10 周五,256,二、相关系数,概念:对两个变量之间线性相关程度和相关方向的度量。,公式,:,举例:下页。,2026/4/10 周五,257,我国人均国民收入与人均消费金额数据,单位,:,元,年份,人均,国民收入,人均,消费金额,年份,人均,国民收入,人均,消费金额,1981,1982,1983,1984,1985,1986,1987,393.8,419.14,460.86,544.11,668.29,737.73,859.97,249,267,289,329,406,451,513,1988,1989,1990,1991,1992,1993,1068.8,1169.2,1250.7,1429.5,1725.9,2099.5,643,690,713,803,947,1148,相关系数举例,为研究我国人均消费水平的问题,把人均消费额记为,y,,把人均国民收入记为,x,。收集到,1981,1993,年的样本数据,(,x,i,,,y,i,),,,i,=1,2,,,13,,数据见下表。试计算相关系数。,2026/4/10 周五,258,相关关系计算结果,根据样本相关系数的计算公式有,人均国民收入与人均消费金额之间的相关系 数为,0.9987,。,2026/4/10 周五,259,相关系数取值及其意义,r,的取值范围是,-1,1,|,r,|=1,,,为完全相关,r,=1,,,为完全正相关,r,=-1,,,为完全负相关,r,=0,,,不存在线性相关关系,-,1,r,0,,,为负相关,0,t,,,拒绝,H,0,若,t,t,(13-2)=2.201,,,拒绝,H,0,,,人均 消费金额与人均国民收入之间的相关关系显著。,2026/4/10 周五,262,三、回归方程,概念:对变量之间互动规律的具体模式的量化描述。,类型:一元回归,多元回归。,举例:下页。,评价:判定系数,估计标准误差。,2026/4/10 周五,263,回归方程类型,一个自变量,两个及以上自变量,回归方程,多元回归,一元回归,线性回归,非线性回归,线性回归,非线性回归,2026/4/10 周五,264,回归方程举例,根据前例数据,配合人均消费金额对人均国民收入的一元线性回归方程,,并以最小平方法,求解方程中的两个参数,得,y=,54.22286,+,0.52638,x,2026/4/10 周五,265,回归方程图示,y=,54.22286,+,0.52638,x,2026/4/10 周五,266,判定系数,回归平方和占总离差平方和的比例,评价回归直线的拟合程度,取值范围在,0,1,之间,r,2,1,,,说明回归方程拟合得越好,r,2,0,,,说明回归方程拟合得越差,判定系数等于相关系数的平方,即,r,2,(,r,),2,2026/4/10 周五,267,估计标准误差,估计标准误差是实际观察值与回归估计值离差平方和的均方根,反映实际观察值在回归直线周围的分散状况。它从另一个角度说明了回归直线的拟合程度。其计算公式为:,上例的计算结果为,14.949678,2026/4/10 周五,268,利用回归方程进行估计或预测,利用估计的回归方程,对于自变量,x,的一个给定值,x,0,,求出因变量,y,的平均值的一个估计值,E,(,y,0,),,,这就是估计或预测。前例子中,当人均国民收入为,2000,元时,我们可以估计人均消费金额的的平均值为,2026/4/10 周五,269,相关分析与回归分析的区别,相关分析中,变量,x,变量,y,处于平等的地位;回归分析中,变量,y,称为因变量,处在被解释的地位,,x,称为自变量,用于预测因变量的变化。,相关分析中所涉及的变量,x,和,y,都是随机变量;回归分析中,因变量,y,是随机变量,自变量,x,可以是随机变量,也可以是非随机的确定变量。,相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量,x,对变量,y,的影响大小,还可以由回归方程进行预测和控制。,2026/4/10 周五,270,正确运用相关分析,相关分析只是一种重要的研究工具、分析手段,在运用它于具体研究对象时,必须以有关的科学理论、专业知识为指导。,变量间的相随变动或共同变动,可能确实彼此之间存有因果关系或互为因果,也可能没有直接关系。例,由于观察资料的偶然巧合,可能会出现诸如某地白酒消费量与自杀者人数同时增加、卷烟销售量与患肺病人数同时上升的数据。其实,它们之间并无直接关联。所以,必须在定性分析的基础上,正确运用相关分析方法。,2026/4/10 周五,271,第十三章 统计综合评价,一、综合评价概述,二、评价指标选择,三、指标权重确定,四、综合评价结果,2026/4/10 周五,272,一、综合评价概述,单项评价是利用一个统计指标对事物的某一个方面作出判断。,综合评价,则是根据研究的目的,建立一个统计指标体系,对事物的各个方面进行定量分析,得出概括性的结论,从而揭示事物的本质及其发展规律。,综合评价的基本步骤:建立评价指标体系,量化处理评价指标,确定评价指标权重,综合最终评价结果。,2026/4/10 周五,273,二、评价指标选择,定性选择方法有综合法和分析法:,综合法一般是通过研讨会或征询意见的方式,集中专家们的意见,以确定评价指标。,分析法是将评价的对象划分为若干个组成部分或不同的侧面,对每一侧面分别选用一个或若干个指标以反映评价对象的特征。,定量选择方法有试算法和系统聚类法:,(下页),2026/4/10 周五,274,试算法是通过历史资料的试算来判断指标的有效性。,系统聚类法是通过判断指标之间的相似程度来筛选指标的一种方法。,系统聚类法的具体操作步骤:度量指标(类)间的相似程度,度量指标(类)间的距离,确定最具有代表性的指标(类)。,试算法、系统聚类法,2026/4/10 周五,275,三、量化处理评价指标,在综合评价中,有些评价指标本来属于定性评价,对这些指标应进行量化处理。,量化处理常用的方法是:先对评价的各等级赋予不同的分值,再聘请足够数量的评议者,请评议者对评价对象进行评议,在所列的评语等级中选择一个他认为最恰当的等级,而后计算各等级得票数,再用得票数对比总票数,计算出得票频率。,对定量指标,必
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 百科休闲 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服