1、本章内容第一节第一节 统计学简介统计学简介一、统计的涵义一、统计的涵义 二、统计的过去与现在二、统计的过去与现在 三三、统计学在经济管理中的应用、统计学在经济管理中的应用第二节第二节 数据及其分类数据及其分类一、认识数据 二、二、数据类型数据类型 三、三、数据类型数据类型 四、四、数据类型数据类型III III 五、五、数据类型数据类型IVIV第三节第三节 统计总体、个体与样本统计总体、个体与样本一、一、统计总体和统计总体和个体个体 二、二、总体的总体的特点特点 三、样本第四节第四节 标志、指标与指标体系标志、指标与指标体系一、一、统计统计标志标志 二、二、统计统计指标指标 三、三、统计指标统
2、计指标体系体系第五节第五节 统计计算工具统计计算工具一、一、统计分析软件简介统计分析软件简介二、二、ExcelExcel实现数据处理的主要途径实现数据处理的主要途径一、统计的涵义一、统计的涵义1.1.统计工作统计工作(statistical workstatistical work)2.2.统计资料统计资料(statistics,statistical datastatistics,statistical data)3.3.统计学统计学(statisticsstatistics)1.1.统计工作(统计工作(statistical workstatistical work)统计工作是为了管理或认
3、识的需要,对社会经济现象和自然现象进行数量收集的活动。主要做三件事:统计数据的采集、对采集的数据进行加工处理、对加工整理过的数据进行分析 统计局系统 企业信息化2.2.统计资料(统计资料(statistics,statistical datastatistics,statistical data)统计资料是统计工作过程中所取得的各项数字资料以各项数字资料以及与之相关信息及与之相关信息的总称。统计资料是统计工作取得的能够说明所研究对象的数据。例如国内生产总值数据,说明整个国家的生产规模。这些数据经常会在报纸、杂志上出现。3 3.统计学(统计学(statisticsstatistics)统计学是在
4、统计工作的经验积累到一定程度时自然产生的,它是收集、整理、描述分析统计数据的方法和技术,为我们的决策提供“量量量量”方面的依据。不列颠百科全书对统计学的定义为:“统计学是关于收集和分析数据的科学和艺术”。二、统计的过去与现在二、统计的过去与现在(一)统计学中的各大著名学派(一)统计学中的各大著名学派1.1.国势学派国势学派 2.2.政治算术政治算术学派学派 3.3.数理统计学数理统计学派派 4.4.社会统计学派社会统计学派(二)统计学的现代格局(二)统计学的现代格局 我国早在公元前我国早在公元前2121世纪的夏朝,就有了人口与土地数字的世纪的夏朝,就有了人口与土地数字的记载,当时全国分为九州,
5、人口记载,当时全国分为九州,人口13551355万人。世界上,古代埃及、万人。世界上,古代埃及、希腊罗马的历史中,也有类似的记载。古代埃及在公元前希腊罗马的历史中,也有类似的记载。古代埃及在公元前30003000年已经有人口、居民财产统计;古代希腊据说公元前年已经有人口、居民财产统计;古代希腊据说公元前600600年就年就进行过人口普查。古代罗马在公元前进行过人口普查。古代罗马在公元前400400年建立了人口普查和年建立了人口普查和经常性人口出生、死亡登记制度。经常性人口出生、死亡登记制度。这些就是原始形态的统计。这些就是原始形态的统计。国势学派国势学派人物:【德国】康令和阿亨瓦尔贡献:提出世
6、界公认的名词统计学(Statistics)评价:“有统计之名,无统计之实”的学派 政治算术学派政治算术学派人物:【英英国国】威威廉廉.配配第第(1623-1687),和和约约翰翰.格格朗朗特特(1620-1674)。)。贡献:1676年完成的政治算术,1662年发表了关于死亡公报的自然和政治观察 开用数量方法研究社会经济现象之先河评价:“有统计之实,无统计之名”的学派 英国约克大学葛朗特 威廉配第帕齐利 数理统计学派数理统计学派人物:人人才才济济济济。如如:凯凯特特勒勒(比比利利时时中中央央统统计计局局局局长长(1796-1874),其其著著作作有有统统计计学学的的研研究究、关关于于概概率率论
7、论的的书书信信等等)、戈戈赛赛特特 、费费希希尔尔、内曼、卡尔内曼、卡尔.皮尔逊皮尔逊贡献:(1)完成统计学和概率论结合(2)建立了丰富的数理统计理论社会统计学派社会统计学派人物:【德国】克尼斯(1821-1889)、恩格尔(1821-1896)和梅尔(1841-1925)观点:统计学的研究对象是社会现象,目的在于明确社会现象的内在联系和相互之间的关系。在研究过程中,要用全面调查,也可以适量的使用抽样调查。(二)统计学的现代格局(二)统计学的现代格局格局:一是以社会经济问题为主要研究对象的社会经济统计;二是以方法和应用研究为主的数理统计。从学科的角度看:前者从属于应用经济学;后者从属于数学。趋
8、势:使用计算机统计分析软件对数据进行处理成为必然;统计学从有关领域中吸取的养分也越来越多。三、统计学在经济管理中的应用三、统计学在经济管理中的应用统计给我们智慧与力量统计学在经济领域的应用(案例1 案例2)统计学在管理领域的应用(案例1 案例2)案例11995年9月,美国斯坦福大学经济学教授刘遵义就通过实证比较,数量分析和模糊评价实证比较,数量分析和模糊评价等方法,预测出菲律宾、韩国、泰国、印尼和马来西亚有可能发生金融危机。案例22005年3月16日上证平均指数中30支股票的市盈率是21.08。东方电子集团有限公司的市盈率是17.92。这时,市盈率方面的统计信息显示:与上证指数股票的平均收入相
9、比,东方电子集团有限公司的股票价格较低。因此,投资顾问可以得出结论:东方电子集团有限公司的现行价格低估了。指数可以解决问题!指数可以解决问题!案例1 一家会计师事务所想确定客户的资产负债表中所显示的应收账款的数量是否公正地体现了实际的应收账款的数量。通常,应收账款的账目数量很大,要审查和验证每个账户既费时又费钱。怎么办?怎么办?抽样调查可以解决问题!抽样调查可以解决问题!案例2 零售付账柜台使用电子扫描仪收集数据,可供各种营销研究应用。数据挖掘数据挖掘的典型:啤酒与纸尿裤一、认识数据一、认识数据一、认识数据一、认识数据1.中国历年主要宏观经济指标数据集(中国历年主要宏观经济指标数据集(数据集数
10、据集01)2.1995年世界各国基本情况数据集(年世界各国基本情况数据集(数据集数据集02)3.公司人力资源部数据集(公司人力资源部数据集(数据集数据集03)4.企业流水线上的抽样数据集(企业流水线上的抽样数据集(数据集数据集04)现代汉语词典对数据的解释是:进行各现代汉语词典对数据的解释是:进行各种统计、计算、科学研究或技术设计等所种统计、计算、科学研究或技术设计等所依据的数值。我们提供四个数据集,让大依据的数值。我们提供四个数据集,让大家对数据有一个直观的了解。家对数据有一个直观的了解。数据集1 中国历年主要宏观经济指标数据集数据集2 1995年世界各国基本情况数据集数据集3 公司人力资源
11、部数据集数据集4 工厂流水线上的抽样数据集数据类型数据类型 1.1.分类数据分类数据(categorical datacategorical data)2.2.顺序数据顺序数据(rank datarank data)3.3.数值型数据数值型数据(metric datametric data)分类数据分类数据分类数据分类数据(categorical data)分分类类数数据据是是对对事事物物进进行行分分类类的的结结果果,数数据据的的主主要要特特征征是是采采用用文文字字、数数字字的的代代码码和和其其他他符符号号对事物进行简单的分类和分组。对事物进行简单的分类和分组。分分类类数数据据以以定定类类尺尺
12、度度(nominal scale)来来衡衡量。量。顺序数据顺序数据(rank datarank data)即:等级数据即:等级数据 是是对对事事物物进进行行分分类类的的结结果果,只只是是这这些些分分类类在在语语义义上上表表现现出出明明显显的的等等级级或或顺顺序序关关系系,例例如如,学学生生的的成成绩绩可可以以分分为为优优秀秀、良良好好、中中等等、及及格格和不及格。和不及格。顺序数据以定序尺度(顺序数据以定序尺度(ordinal scale)来衡量。)来衡量。数值型数据数值型数据 数值型数据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体数值。数值型数据有两种衡量尺度:数值型数据有两
13、种衡量尺度:一是定距尺度(一是定距尺度(interval scaleinterval scale)二是定比尺度(二是定比尺度(ratio scaleratio scale)区别:区别:“零点零点”数据类型数据类型数据类型数据类型1.时间序列数据时间序列数据(time series data)2.截面数据截面数据(cross-sectional data)3.面板数据面板数据(panel data)时间序列数据时间序列数据 时间序列数据(time series data)是在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。截面数据截面数据 截面数据(cross-sectional d
14、ata)是在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况。面板面板数据数据是对若干个单位在不同时间进行重复跟踪调查所形成的数。例如,我们连续20年收集得到的企业工人的工资、受教育程度和就业情况的数据。数据类型数据类型III III 1.绝对数绝对数(absolute number)2.相对数相对数(relative number)3.平均数平均数(average)绝对数绝对数绝对数绝对数 是统计数据的基本表现形式,是其他指标形式形是统计数据的基本表现形式,是其他指标形式形是统计数据的基本表现形式,是其他指标形式形是统计数据的基本表现形式,是其他指标形式形
15、成的基础。现象的总体规模和水平一般都以绝对数成的基础。现象的总体规模和水平一般都以绝对数成的基础。现象的总体规模和水平一般都以绝对数成的基础。现象的总体规模和水平一般都以绝对数形式表现,一个地区的总人口、国内生产总值、货形式表现,一个地区的总人口、国内生产总值、货形式表现,一个地区的总人口、国内生产总值、货形式表现,一个地区的总人口、国内生产总值、货物周转量等都是绝对数,其计量单位有实物单位、物周转量等都是绝对数,其计量单位有实物单位、物周转量等都是绝对数,其计量单位有实物单位、物周转量等都是绝对数,其计量单位有实物单位、价值单位和复合单位三种。价值单位和复合单位三种。价值单位和复合单位三种。
16、价值单位和复合单位三种。绝对数按其所反映的时间状况不同可以分为时绝对数按其所反映的时间状况不同可以分为时绝对数按其所反映的时间状况不同可以分为时绝对数按其所反映的时间状况不同可以分为时期数和时点数。时期数是反映现象在一段时期内的期数和时点数。时期数是反映现象在一段时期内的期数和时点数。时期数是反映现象在一段时期内的期数和时点数。时期数是反映现象在一段时期内的总量。如产品产量、产值、销售额等。时期数的特总量。如产品产量、产值、销售额等。时期数的特总量。如产品产量、产值、销售额等。时期数的特总量。如产品产量、产值、销售额等。时期数的特点是可以连续计数,并可以累积。时点数是反映现点是可以连续计数,并
17、可以累积。时点数是反映现点是可以连续计数,并可以累积。时点数是反映现点是可以连续计数,并可以累积。时点数是反映现象在某一瞬间时刻上的总量,如人口数、商品的库象在某一瞬间时刻上的总量,如人口数、商品的库象在某一瞬间时刻上的总量,如人口数、商品的库象在某一瞬间时刻上的总量,如人口数、商品的库存量、企业的固定资产价值等。由于时点数是反映存量、企业的固定资产价值等。由于时点数是反映存量、企业的固定资产价值等。由于时点数是反映存量、企业的固定资产价值等。由于时点数是反映现象在某一瞬间点上的水平,因而只能间断计数,现象在某一瞬间点上的水平,因而只能间断计数,现象在某一瞬间点上的水平,因而只能间断计数,现象
18、在某一瞬间点上的水平,因而只能间断计数,各时点不能累积。各时点不能累积。各时点不能累积。各时点不能累积。相相对数对数 是是是是由由由由两两两两个个个个相相相相互互互互联联联联系系系系的的的的绝绝绝绝对对对对数数数数对对对对比比比比得得得得到到到到,反反反反映映映映事事事事物物物物的相对数量。的相对数量。的相对数量。的相对数量。常常常常用用用用的的的的相相相相对对对对数数数数包包包包括括括括:结结结结构构构构相相相相对对对对数数数数、动动动动态态态态相相相相对对对对数数数数、比比比比较较较较相相相相对对对对数数数数、计计计计划划划划完完完完成成成成相相相相对对对对数数数数。结结结结构构构构相相相
19、相对对对对数数数数是是是是在在在在对对对对资资资资料料料料进进进进行行行行分分分分组组组组的的的的基基基基础础础础上上上上,以以以以总总总总体体体体的的的的总总总总量量量量作作作作为为为为比比比比较较较较的的的的标标标标准准准准而而而而得得得得到到到到的的的的相相相相对对对对数数数数。动动动动态态态态相相相相对对对对数数数数是是是是将将将将不不不不同同同同时时时时期期期期的的的的同同同同类类类类事事事事物物物物的的的的水水水水平平平平加加加加以以以以比比比比较较较较求求求求得得得得的的的的相相相相对对对对数数数数。比比比比较较较较相相相相对对对对数数数数是是是是将将将将不不不不同同同同单单单单
20、位位位位的的的的同同同同类类类类现现现现象象象象对对对对比比比比得得得得到到到到的的的的相相相相对对对对数数数数。计计计计划划划划完完完完成成成成相相相相对对对对数数数数将将将将实实实实际际际际完完完完成成成成数数数数与与与与计计计计划划划划完完完完成成成成数数数数对对对对比比比比用用用用以以以以反反反反映映映映计计计计划划划划的的的的执执执执行行行行情情情情况况况况,对对对对于于于于产产产产出出出出类类类类指指指指标标标标,如如如如产产产产量量量量,大大大大于于于于100%100%说说说说明明明明完完完完成成成成了了了了规规规规定定定定的的的的任任任任务务务务,而而而而对对对对于于于于投投投
21、投入入入入类类类类指指指指标,如成本,则小于标,如成本,则小于标,如成本,则小于标,如成本,则小于100%100%说明完成任务。说明完成任务。说明完成任务。说明完成任务。平均平均数数反映现象总体的一般水平。平均数的计算将在第四章详细介绍。五、数据类型五、数据类型IVIV 变量(变量(variable)是说明现象某个数量特征的概念。)是说明现象某个数量特征的概念。其最常见的分类是:离散型变量(其最常见的分类是:离散型变量(discrete variable)和)和连续型变量(连续型变量(continuous variable)。这两类变量获取的方)。这两类变量获取的方法不同,离散型变量一般用法不
22、同,离散型变量一般用“点数点数”的方法取得,数值往的方法取得,数值往往是整数,如职工人数、企业个数、设备台数等。连续型往是整数,如职工人数、企业个数、设备台数等。连续型变量用变量用“测量测量”取得,测量的仪器越精密,变量值就会越取得,测量的仪器越精密,变量值就会越精确,如人的身高、体重;产品的长度、重量等。精确,如人的身高、体重;产品的长度、重量等。变量按其所受因素的影响不同,还可分为确定性变量和变量按其所受因素的影响不同,还可分为确定性变量和随机变量(随机变量(random variable)。受确定性因素影响的变量)。受确定性因素影响的变量称为确定性变量。受随机性因素影响的变量称为随机变量
23、,称为确定性变量。受随机性因素影响的变量称为随机变量,所谓随机因素,是指各种不确定的、偶然性的因素,这种所谓随机因素,是指各种不确定的、偶然性的因素,这种因素对变量影响的大小和方向都是不确定的,通常是微小因素对变量影响的大小和方向都是不确定的,通常是微小的。的。总体与个体 统计总体,简称总体统计总体,简称总体PopulationPopulation),就),就是统计所要研究的事物或现象的全体,是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的即由客观存在的,具有某种共同特征的许多个别事物构成的整体。许多个别事物构成的整体。个体(个体(Item UnitItem Unit)是构
24、成统计总体的个)是构成统计总体的个别事物,又称为总体单位。别事物,又称为总体单位。总体的特点:总体的特点:1、大量性 2、同质性 3、差异性 4、相对性样本 样本(Sample)是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。抽取原则:随机、非随机非随机抽样:任意抽样、判断抽样、配额抽样非随机抽样:任意抽样、判断抽样、配额抽样 标志统计标志,简称标志(characteristic),是指每个个体所共同具有的属性或特征,它是说明个体的属性或特征的具体名称。标志按其性质分为品质标志和数量标志。标志按变异情况分为不变标志和可变标志。可变的数量标志称为变量,其值称为变量值。指标统计
25、指标,简称指标(indicator),是反映总体数量特征的,由各个个体的标志值汇总综合而成。任何一个统计指标都是经过了从个别到一般、从具体到抽象的过程,它体现总体特征,具有综合性。(一)(一)口径一致是统计指标的基本要求口径一致是统计指标的基本要求(二)(二)统计指标按反映问题的数量特征分类统计指标按反映问题的数量特征分类(三)(三)统计指标按核算的范围分类统计指标按核算的范围分类(一)口径一致是统计指标的基本要求(一)口径一致是统计指标的基本要求1.1.统计指标是反映研究对象总体特征的,确定研究对象往往与一定的理论相联系,理论定义的范畴应该和实际获得的指标数值的口径统一。2.2.统计口径包括
26、两个方面:一是计算口径外延的明确定义,。二是计算口径维度的正确把握。(二)统计指标按反映问题的数量特征分类(二)统计指标按反映问题的数量特征分类1.1.数量指标数量指标 它是反映客观事物的规模或水平的指标,它表现为汇总后直接得到的绝对数或总量,又称之为总量指标或绝对指标。数量指标是最基本的指标,它是计算其他指标的基础。数量指标包括标志总量和总体单位总量,如总产值、工资总额、人口总数、企业个数等。2.2.质量指标质量指标 它是反映客观现象之间的相互联系、比例关系、发展速度、内部结构的指标,一般用相对数或平均数表示。如劳动生产率、成本利润率、人均国民收入等。质量指标是由两个数量指标对比求得的,它是
27、由数量指标派生的。(三)统计指标按核算的范围分类(三)统计指标按核算的范围分类1.1.总体指标总体指标,即总体参数,简称参数(parameter),是我们想要了解的总体的某个特征值。2.2.样本指标样本指标,即样本统计量,简称统计量(statistic)。统计量是根据样本数据计算出来的一个量。指标体系指标体系 一系列相互联系、相互制约的多个统计一系列相互联系、相互制约的多个统计指标就构成统计指标体系。指标就构成统计指标体系。举例举例1 1:工业企业统计指标体系工业企业统计指标体系 企业管理与信息处理指标子体系企业管理与信息处理指标子体系 举例举例2 2:宏观统计指标体系宏观统计指标体系 国民经
28、济核算体系国民经济核算体系 企业管理与信息处理指标子体系企业管理与信息处理指标子体系工业企业经营管理指标工业企业经营管理指标 工业企业企业管理指标工业企业企业管理指标 信息获取与利用指标信息获取与利用指标 工业企业财务管理指标工业企业财务管理指标 工业企业经济效益评价指标工业企业经济效益评价指标 国民经济核算体系国民经济核算体系http:/ 5、马克威分析系统1SAS系统全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS早期的主要功能是统计分析,其产品与解决方案除统计分析外,
29、新增了数据整合、企业智能等,统计分析功能也在不断增加。SAS统计系统是由多个功能模块组合的,其基本部分是BASESAS模块,它是SAS统计分析系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。在BASESAS的基础上,可以增加模块而增强数据分析功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕
30、软件应用系统模块)等等。一般认为使用SAS需要编写程序,比较适合统计专业人员,而对非统计专业人员则比较困难。事实上SAS的很多功能也可以通过菜单操作实现,如Insight就是一个菜单操作的界面。2.SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”,2000年SPSS公司将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向做出了重大调整。逐渐由原来的单一统计产品开发与销售转向企业、教育科研及政府机构提供全面
31、信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。SPSS最突出的特点就是操作界面极为友好,采用类似EXCEL表格的方式输入与管理数据,数据接口通用,能方便的从其他数据库中读入数据,是非统计专业人员的首选统计软件。3.Statistica是由美国俄克拉荷马州的StatSoft公司研制的大型专业统计图表分析软件包。Statistica数据统计分析项目有15个主命令,130多个子命令,其功能是:基本统计分析(Basic Statistics)、非参数统计分析(Nooparametrics)、方差分析(General ANOVA)、多元回归分析(Mu
32、ltiple Regression)、非线性估计(Nonlinear Estimation)、时间序列预测(Time Series/Forecasting)、聚类分析(Cluster Analysis)、因子分析(Factor Analysis)、典型分析(Canonical Analysis)、多维尺度分析(Multidimensional Scaling)、路径分析(SEPATH)、可靠性/项目分析(Reliability/Item Analysis)、判别分析(Discriminant Analysis)、对数线性分析(Log-linear-analysis)和生存分析(Survival
33、 Analysis)。Statistica的图形功能很完备,显示输出的图形细腻美观,有13个主命令,80多个子命令,主要包括:快速统计图(Quick Stats Graphs)、二维统计图(Stats 2D Graphs)、三维序列统计图(Stats 3D Sequential Graphs)、三维XYZ统计图(Stats 3D XYZ Graphs)和统计矩阵图(Stats Matrix Graphs)等。4.MINITAB是由美国宾夕法尼亚州立大学在1972年研制的统计分析软件包,它以无与伦比的易学性、可靠性以及完善的功能而著名于世,是教授统计学,实施六西格玛和其他质量改进项目的理想选择,
34、MINITAB包括统计分析模块和绘制图形模块,统计分析模块有13个主命令:基本统计分析(basic statistics)、回归分析(regression)、方差分析(ANOVA)、实验设计(DOE,Design of Experiments)、控制图(control charts)、质量编制计划工具(Quality Tools)、可靠性/生存分析(reliability/survival)、多变量分析(Multivariate)、时间序列分析(Time series)、统计报表和列联表检验(Tables)、非参数检验(Nonparametrics)、探索性数据分析(EDA,explorato
35、ry data analysis)、效能与样本量分析(power and sample size)。5.马克威分析系统是由上海天律信息技术有限公司开发的中国第一套完全自主知识产权的大型统计分析和数据挖掘系统。马克威分析系统在技术上的特点是:将数据挖掘、统计分析、图形展示和智能报表融为一体,为用户提供完整配套的决策支持工具;提供独创的优化算法体系和完备的数据挖掘模型;将可视化数据分析与数据挖掘有机地融合在一起,并将自主开发的嵌入式数据库管理系统同其它关系型数据库实现了无缝连接;它在设计上充分考虑了中国用户的实际情况和使用习惯,将实用性和科学性结合在一起。二、Excel实现数据处理的主要途径1.1.公式和函数公式和函数2.2.数据分析工具数据分析工具