1、Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,1-,*,经济、管理类,基础课程,统计学,经济统计案例,经济统计无处不在:统计实例,举例,1.,我国每年都要编辑全国统计年鉴,包括很多方面的,经济发展和社会进步的各种指标,其中我们比较关心的有,GDP,、,CPI,、外贸进出口额、人均可支配收入等等。每年的,2,月底会公布前一年的,国民经济和社会发展统计公报,。,举例1.中华人民共和国2011年国民经济和社会发展统计公报,初步核
2、算,全年国内生产总值,471564,亿元,比上年增长,9.2%,。其中,第一产业增加值,47712,亿元,增长,4.5%,;第二产业增加值,220592,亿元,增长,10.6%,;第三产业增加值,203260,亿元,增长,8.9%,。第一产业增加值占国内生产总值的比重为,10.1%,,第二产业增加值比重为,46.8%,,第三产业增加值比重为,43.1%,。,举例1.中华人民共和国2011年国民经济和社会发展统计公报,全年居民消费价格比上年上涨,5.4%,,其中食品价格上涨,11.8%,。固定资产投资价格上涨,6.6%,。工业生产者出厂价格上涨,6.0%,。工业生产者购进价格上涨,9.1%,。农
3、产品生产价格上涨,16.5%,。,举例1:中华人民共和国2011年国民经济和社会发展统计公报,年末全国就业人员,76420,万人,其中城镇就业人员,35914,万人。全年城镇新增就业,1221,万人。年末城镇登记失业率为,4.1%,,与上年末持平。全年农民工总量为,25278,万人,比上年增长,4.4%,。其中,外出农民工,15863,万人,增长,3.4%,;本地农民工,9415,万人,增长,5.9%,。,年末国家外汇储备,31811,亿美元,比上年末增加,3338,亿美元。年末人民币汇率为,1,美元兑,6.3009,元人民币,比上年末升值,5.1%,。,举例1:中华人民共和国2011年国民经
4、济和社会发展统计公报,全年研究生教育招生,56.0,万人,在学研究生,164.6,万人,毕业生,43.0,万人。普通高等教育本专科招生,681.5,万人,在校生,2308.5,万人,毕业生,608.2,万人。各类中等职业教育招生,808.9,万人,在校生,2196.6,万人,毕业生,662.7,万人。全国普通高中招生,850.8,万人,在校生,2454.8,万人,毕业生,787.7,万人。全国初中招生,1634.7,万人,在校生,5066.8,万人,毕业生,1736.7,万人。普通小学招生,1736.8,万人,在校生,9926.4,万人,毕业生,1662.8,万人。特殊教育招生,6.4,万人,
5、在校生,39.9,万人,毕业生,4.4,万人。幼儿园在园幼儿,3424.4,万人。,举例,2,:人口普查,人口抽样调查,我国每,10,年进行一次人口普查,上次是,2010,年,在两次人口普查期间的中间进行,1%,的人口抽样调查。,普查涉及内容比较广泛,如人口数、流动人口、城乡构成、性别构成、年龄构成、民族、受教育程度,收入、就业等等情况。,我国以,2010,年,11,月,1,日零时为标准时点进行了第六次全国人口普查,结果显示,全国总人口为,1370536875,人。其中:普查登记的大陆,31,个省、自治区、直辖市和现役军人的人口共,1339724852,人。,举例,2,:人口普查,人口抽样调查
6、,大陆,31,个省、自治区、直辖市和现役军人的人口中,男性人口为,686852572,人,占,51.27%,;女性人口为,652872280,人,占,48.73%,。总人口性别比,(,以女性为,100,,男性对女性的比例,),由,2000,年第五次全国人口普查的,106.74,下降为,105.20,。,举例,2,:人口普查,人口抽样调查,大陆,31,个省、自治区、直辖市和现役军人的人口中,,0-14,岁人口为,222459737,人,占,16.60%,;,15-59,岁人口为,939616410,人,占,70.14%,;,60,岁及以上人口为,177648705,人,占,13.26%,,其中,
7、65,岁及以上人口为,118831709,人,占,8.87%,。,大陆,31,个省、自治区、直辖市和现役军人的人口中,具有大学,(,指大专以上,),文化程度的人口为,119636790,人;具有高中,(,含中专,),文化程度的人口为,187985979,人;具有初中文化程度的人口为,519656445,人;具有小学文化程度的人口为,358764003,人,举例,3,:,2011,年武汉地区高校毕业生就业报告,去年,该市首次用“非失业率”描述大学生就业状况,涵盖“就业率,+,升学考研率,+,出国留学率”。据称,武汉地区,2011,届高校毕业生规模达到历史新高,为,267703,人,其中本科生,1
8、14961,人、专科生,123781,人、硕士生,25661,人、博士,3300,人,非失业率达,89.61%,。这支武汉规模最大的高校毕业大军,近九成有“事”可做。,举例,3,:,2011,年武汉地区高校毕业生就业报告,根据昨日发布的就业报告,武汉地区,2011,届本科毕业生平均月收入,2983,元,专科毕业生,2123,元,硕士研究生,3872,元。相比,2010,届,前两项分别增加了,56,元、,119,元。业内人士认为,物价上涨是导致薪资升高的原因之一。武汉市毕办主任王星介绍,在全国,15,个副省级城市中,武汉高校毕业生薪资水平属中上等。,举例,3,:,2011,年武汉地区高校毕业生就
9、业报告,本科各专业中,毕业半年后月收入最高的是经济学,月收入为,3421,元;其次是工学,月收入,3353,元;最低的是教育学,月收入仅,2742,元。,行业间的贫富差距明显。金融服务行业应届高校毕业生收入继续领跑,平均月收入,3321,元,紧随其后的是,IT,行业,平均月收入达,3253,元。而房地产行业由去年第,3,名跌落至第,5,名,月平均收入,2837,元。制造业收入维持在较低水平,月均,2347,元。,举例,4.,啤酒和尿布的故事,全球最大的零售商沃尔玛通过分析顾客购物的数据发现,很多周末购买尿布的顾客同时也购买啤酒。经过深入观察和研究发现,美国家庭买尿布的多是爸爸。年轻的父亲们下班
10、后要到超市买尿布,同时“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近,从而双双促进了尿布和啤酒的销量。这个故事工人是数据挖掘,data mining,的经典范例。,举例,5,:文学也与统计有关,据统计学家(复旦大学李贤平教授)对,红楼梦,各回的虚词(,47,个虚词:之,其,或,呀,吗,可,便,就,)出现的频率进行统计分析(原因是由于个人写作特点和习惯的不同,所用的虚词是不会一样的),采用聚类分析,(物以聚类,人以群分)发现前,80,回和后,40,回明显不同,出自不同的人,进一步运用判别分析,发现前,80,回是曹雪芹所写,后,40,回不是高鹗一人所写,而
11、是曹雪芹亲友将其草稿整理而成,宝黛故事为一人所写,贾府衰败情景为另一人所写等等,这个论证在红学界轰动很大。,统计资料表明大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于,150,公里,/,小时的行驶速度上的。这是否就意味着高速行驶比较安全?,答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。,问:统计数字还表明,在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病?,答:正好相反。亚利桑那的气候对害肺病的人有好处,所以肺病患者纷纷前来,自然这就使这个州死于肺结核的平均数升高了。,究竟什么是统计?,
12、我们在生活和工作中会接触到大量的信息和数据。我们未来会成为经济管理人员或科研工作者,有些人将成为数据的生产者,但大部分人会成为数据的使用者。,你必须有能力弄懂别人向你提供的大量数据的涵义。什么样的专门手段能使你高效率地使用数据?答案是,“,统计学,”,。,统计是以数据为食物的动物,统计的本业是消化数据,并产生有营养的结果。,Data Statistics Information,经济学家、教育家、人口学家原北京大学校长 马寅初,学者不能离开统计而研究,政治家不能离开统计而施政,企业家不能离开统计而执业,第一节 统计与统计学,统计与统计学的含义,统计数据的规律与统计方法,一、统计与统计学的含义,
13、统计,统计的历史,统计学,统计学在我国的发展情况,1.,统计,统计作为一种社会实践活动已经有很悠久的历史。在外语中,“统计”一词与“国家”一词来源于同一词源,现在统计已经被赋予多种含义,包括:,(,1,)统计工作(搜集)(,2,)统计数据(结果)(,3,)统计学(方法、技术),2.,统计的历史,统计最早运用者之一是“政治算术学派”创造人威廉,.,配第和约翰,.,格朗特,首先在其著作中使用统计数字和图表等方法来分析研究社会、经济和人口现象。,3.,统计学,统计学已经发展成为具有多个分支学科的大家族。统计学是收集、整理、分析统计数据的方法科学,其目的是探索数据的内在规律性,以达到对客观事物的科学认
14、识。,统计数据的收集:基础,统计数据的整理:加工处理,使统计数据系统化、条理化,统计数据的分析:核心内容,通过统计描述、统计推断探索数据内在规律性,4.,统计学在我国的发展情况,统计学分两类人才培养模式:数理类(理学)、经济类(经济学),统计学的国家重点学科:人大、厦大、西财,统计学的博士点:人大、厦大、中南财经、西财、东财、上财等,有影响力的统计学家:陈希孺(院士,统计学唯一的院士,,2005,年不幸去世,,71,岁),易丹辉、袁卫、庞皓、曾五一、邱东、钱伯海、颜日初(国民经济统计)、张尧庭、方开泰(多元统计分析),4.,统计学在我国的发展情况,统计期刊:,统计研究,、,中国统计,、,统计与
15、决策,、,数理统计与管理,统计教材:黄良文:,统计学,,中国统计出版社,2000,。,贾俊平等:,统计学,,人大出版社,2004,魏建国:,统计学,,武汉理工出版社,2006,二、统计数据的规律与统计方法,1.,生育人口性别比:男孩:女孩,=107,:,100,2.,掷硬币,1/2,和掷色子,1/6,(买彩票、足彩、体彩等等),3.,统计调查:恩格尔系数(食品支出占总支出的比例)、基尼系数(警戒线,0.4,),二、统计数据的规律与统计方法,以上例子说明,通过多次观察或试验可以得到大量的统计数据,利用统计方法是可以探索其内在的数量规律性。因为客观事物本身是必然性与偶然性的对立统一,必然性反映了事
16、物的本质特征,偶然性反映了事物表现形式的差异。(举例学生的平均分,标准差),第二节 统计学的分科,统计方法已经被应用到自然科学和社会科学的众多领域,统计学也发展成为若干分支学科组成的学科体系。,从统计方法的构成:描述统计学、推断统计学,从统计方法研究和应用角度来分:理论统计学、应用统计学,一、描述统计学和推断统计学,1.,描述统计学(,Descriptive Statistics,)研究如何取得反映客观现象的数据,并通过图表形式,对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。(数据的收集、加工处理、显示以及数据分布特征的概括与分析),2.,推断统计
17、学(,Inferential Statistics,)研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。(举例说明,全校某次英语四级考试的通过率,通过抽样调查,100,人)(抽样估计、假设检验、回归分析),一、描述统计学和推断统计学,描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计的基础,推断统计是现代统计学的主要内容,已经成为统计学的核心内容。,二、理论统计学和应用统计学,1.,理论统计学(,Theoretical Statistics,)指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数
18、学理论。它是统计方法的理论基础。,2.,应用统计学(,Applied Statistics,)研究如何应用统计方法去解决实际问题。,如:生物统计学、卫生统计学、人口统计学、农业统计学、管理统计学、社会统计学,第三节 统计学与其他学科的关系,统计学与数学的关系,统计学与计算机的关系,统计学与其他相关学科的关系,一、统计学与数学的关系,二、统计学与计算机的关系,计算机软件的开发为统计的计算带来了极大的方便,可以在很快的时间内处理相关的数据。常见的统计软件有:,Excel,、,SPSS,(,Statistics Package for Social Sciences,)、,Eviews,、,SAS,
19、等等。,三、统计学与其他学科的关系,统计学可以帮助其他学科探索学科内在的数量规律性,但对于这种数量规律性的解释,只能由各学科的研究来完成。,统计方法不是万能的,有时会造成一些错误或误会。,定量分析与定性分析要相结合。要选择适当的统计工具。,第二章 统计数据的描述,第二章 主要内容,2.1,数据的计量尺度,2.2,统计数据的来源,2.3,统计数据的整理,2.4,分布集中趋势的测度,2.5,分布离散程度的测度,2.6,分布偏态与峰度的测度,2.7,统计表与统计图,2.1,数据的计量尺度,一般情况,数据的计量尺度按由低到高、由粗略到精确可以分为四种:,列名尺度,顺序尺度,间隔尺度,比例尺度,一、列名
20、尺度,nominal scale,其特点是只能对事物进行平行的分类或分组,例如:人口按性别分为男、女,按教育程度分为高中及以下、大学、研究生,按户口分城市、农村等等。企业按经济性质分:国有、集体、私营、外企。,为了便于统计处理,特别是为了便于计算机识别,可以对不同类别用数字或编码表示,如:“,1”,表示男性,“,2”,表示女性(但注意:这只是代码,不能区分大小或进行任何数学运算。),二、顺序尺度,ordinal scale,顺序尺度是对事物之间等级差或顺序差别的一种测度,可以比较大小。不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。,例如:产品分为一等品、二等品、三等品,考试
21、成绩分为优、良、中、及格、不及格,客户对某产品的满意程度分别很满意、比较满意、不太满意、很不满意等。,顺序尺度比列名尺度精确,但它只是测度了类别之间的顺序,而未测量出类别之间的准确差值,顺序尺度的计量结果只能比较大小,不能进行加减乘除运算。,三、间隔尺度,interval scale,不仅可以比较各事物的大小,而且可以计算差异的大小,即计算数量的间隔。例如:考试分数(百分制)、温度的计量。,四、比例尺度,ratio scale,比例尺度与间隔尺度的差别很小,区别主要在于,在间隔尺度中,“,0”,表示某一个数值,或者叫做,0,水平。而在比例尺度中,“,0”,表示“没有”或者“无”。例如:温度,0
22、,表示,0,摄氏度,而长度,0,米则表示没有或不存在。大多数情况我们使用的是比例尺度。,另外,间隔尺度只做加减运算,做乘除运算没有多大意义。而比例尺度可以做加减乘除运算且都有意义。,2.2,统计数据的来源,直接来源,间接来源,一、间接来源,报纸、图书、杂志、统计年鉴、网络等渠道获得。或者从调查公司或数据库公司购买。如国泰安,中国金融、经济信息数据库公司。期刊网、维普网。书上有很多,常用的统计数据来源,美国经济分析局,www.bea.doc.gov,美国人口普查局,www.census.gov,美国劳工统计局,stats.bls.gov,美联储经济数据库,www.stls.frb.org/fre
23、d,美国联邦统计,www.fedstats.gov,世界银行,www.worldbank.org,国际货币基金组织,www.imf.org,OECD,www.oecd.org,二、直接来源,1.,普查,census,:普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。我国的人口普查、工业普查、经济普查(第二、三产业),2.,抽样调查:抽样调查是通过随机样本对总体数量规律性进行推断的调查研究方法。虽然准确性没有普查高,但是节省人力、物力、财力。大多数调查公司都采取这种调查方式,如收视率调查、家庭收支情况调查、客户需求调查等等。,二、直接来源,3.,重点调查和典
24、型调查,重点调查是从调查对象的全部单位中选择少数重点单位进行调查,其中重点单位是指在所要调查的数量特征上占有较大比重的单位。如了解全国钢铁企业,选择宝钢、鞍钢、首钢、武钢、包钢即可。,典型调查是从调查对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查。如研究武汉市跨国公司的运营情况,选取可口可乐公司作个案分析。,重点调查、典型调查具有主观性,其调查的单位不是随机抽取的,因此,调查结果不能推论总体。,2.3,统计数据的整理,统计分组,次数分配的图示与类型,一、统计分组,统计分组是统计整理的第一步,是根据统计研究的目的,将数据按照某种特征或标准分成不同的组别。,分组时所依据的特征或
25、标准成为统计分组标志:,品质标志分组:按事物的性质和属性划分(列名尺度和顺序尺度的数据),数量标志分组:按事物的数量标准划分(间隔尺度和比例尺度的数据),(一)品质标志分组,比较简单,如对某学校学生的性别进行调查,可将学生分为男生、女生两个组。再如对武汉市的学校进行分类,可以分为小学、中学、中专、大学四个组。,性 别,人 数,(人),频率,(,%,),男,732,57.14,女,549,42.86,合 计,1281,100.00,某高校学生性别分布表,(品质数列),分组 次数 频率,注意分组的,完备性,(二)数量标志分组,单变量值分组:把每一变量值作为一组,这种分组方式通常只适用于离散变量而且
26、变量值较少的情况。,组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量作为一组。,1.,组距分组的步骤,(,1,)确定组距,class width,:一般以,5,或,10,的整数倍为组距,(,2,)确定组数:组数,=,全距,range/,组距,=,(最大值,-,最小值),/,组距,(,3,)根据分组整理成频数分布表,2.,组距分组应注意的问题,(,1,)每组的两个端点数值叫组限,其中每组的小值称为下限(,low limit,),较大值称为上限(,upper limit,);连续型变量在分组时相邻组的上下限应该重合,“上限不在组内”的原则,如:,115120,,包括,115,,但是不
27、包括,120,;,(,2,)在组距分组时,如果总体中有特小的变量值,就采用下开口组“某某以下”,在组距分组时,如果总体中有特大的变量值,就采用上开口组“某某以上”,(,3,)组距分组:等距分组、不等距分组(如年龄,06,岁幼儿,,717,少儿,,1835,青年,,3664,中年,,65,以上老年),2.,组距分组应注意的问题,(,4,)组中值:,class midpoint,可以反映各组数据的一般水平,作为该组数据的一个代表值。,组中值:(下限,+,上限),/2,对于上开口组:本组下限,+,邻组组距,/2,对于下开口组:本组上限,-,邻组组距,/2,2.,组距分组应注意的问题,(,5,)向上累
28、积:将各组次数和频数由变量值小的组向变量值大的组逐组累积,它表明该组上限以下的单位数是多少,占总体比重是多少,向下累积:将各组次数和频数由变量值大的组向变量值小的组逐组累积,它表明该组下限以上的单位数是多少,占总体比重是多少,举例,二、次数分布的图示与类型,直方图与折线图,几种常见的次数曲线,洛伦茨曲线与基尼系数,1.,直方图,histogram,和折线图(频数多边形),frequency,polygon,(多边形),直方图是用矩形的宽度和高度来表示频数分布的图形,横轴表示数据分组,纵轴表示频数或者频率。折线图则是在直方图基础上,把直方图顶部的中点(即组中值)用直线连接起来。,直方图,(,Hi
29、stogram,),用于显示连续型变量的次数分布,2.,几种常见的次数曲线,当所观察的次数越多,组距越小,而且组数越多时,所给出的折线图就会越光滑,逐渐形成一条光滑的曲线,这种曲线即次数分布曲线,反映了数据或统计量的分布规律。,(三)、次数分布的主要类型,1,、钟型分布,(1),对称的钟型分布,日产量,(,件,),(2),左偏分布,日产量,(,件,),(3),右偏分布,日产量,(,件,),2,、型分布,3,、,J,型分布,(1),价格,型分布(),价格,3.,洛伦茨曲线与基尼系数,洛伦茨曲线是,20,世纪初美国经济学家、统计学家洛伦茨根据意大利经济学家帕累托(福利经济学的代表人,提出了帕累托最
30、优)提出收入分配公式绘制成的描述收入和财富分配性质的曲线。,横轴是累积的人口百分比,纵轴是累积的收入或财富百分比。,3.,洛伦茨曲线与基尼系数,基尼系数,=A/(A+B),,如果,A=0,则基尼系数,=0,,表示收入绝对平均。如果,B=0,,则基尼系数,=1,,表示收入绝对不平均。基尼系数在,0.20.4,是比较适当的,,0.4,是收入分配不平均的警戒线。,2.4,分布集中趋势的测度,统计数据经过排序和分组整理后,对数据分布的类型、特点有了一个大致的了解,但是这种了解知识表面上的,还缺少代表性的数量特征值。,对于统计数据分布的特征,可以从两个方面进行描述:,数据分布的集中趋势(,central
31、 tendency,)(众数、中位数、分位数、均值、几何平均数),数据分布的离散程度(,dispersion,)(极差、内距、方差、标准差、离散系数),2.4,分布集中趋势的测度,众数,中位数,均值,几何平均数,众数、中位数、均值的比较,一、众数,mode,众数是一组数据中出现次数最多的变量值。从分布看,众数是具有明显集中趋势点的数值。一组数据分布的最高峰点所对应的数值即是众数。,例如:鞋的码号(女士,37,,男士,41,号)当然会后极大值如姚明,50,号的鞋子。再比如衣服的尺寸等等。,计算方法:,1.,根据未分组数据或者单变量值分组数据计算众数,2.,对于组距分组求众数,1.,根据未分组数据
32、或者单变量值分组数据计算众数,只需找出出现次数最多的变量值即为众数。,例如:有一组数据如下:,2,,,3,,,3,,,5,,,5,,,5,,,6,,,7,,,8,,,10,,这其众数为,5,。,2.,对于组距分组求众数,其中,,L,表示众数所在组的下限,表示众数组次数与下一组(前一组)次数之差,表示众数组次数与上一组(后一组)次数之差,i,表示众数组的组距,举例:某车间,50,名职工日产量分组资料如下:,产量,职工人数,向上累积,50,以下,5,5,50-60,8,13,60-70,21,34,70-80,9,43,80,以上,7,50,合计,50,-,举例,众数组为,60-70,,,L=60
33、,,,i=10,,,1,=21-8=13,,,2,=21-9=12,,,则,二、中位数,median,中位数是数据排序后(从大到小或者从小到大),位置在最中间的数值。,计算:,1.,未分组数据,2.,分组数据计算中位数,1.,未分组数据计算中位数,设有一组数据为,X1,、,X2,、,Xn,,按从小到大排序后为,X(1),、,X(2),、,X(n),,,则 (当,n,为奇数),(当,n,为偶数),例如:有,6,位工人日生产产品件数排序:,27,,,29,,,30,,,31,,,31,,,32,则,Me=,(,30+31,),/2=30.5,2.,分组数据计算中位数,先根据,N/2,确定中位数的位
34、置,确定中位数所在的组,采用以下近似公式计算:,L,表示中位数所在组的下限,S,m-1,表示中位数所在组以下各组的累积次数(以前各组的累积次数),f,m,表示中位数所在组的次数,i,表示中位数所在组的组距,举例,前例中:中位数所在组,50/2=25,在,60-70,组内,,L=60,,,i=10,,,f,m,=21,S,m-1,=13,则中位数为:,三、均值,mean,(算术平均数,arithmetric mean),简单算术平均数,加权算术平均数,1.,简单算术平均数,如小明期中考试,语文得了,100,分,数学得了,90,分,则其平均成绩为(,100+90,),/2=95,分,2.,加权算术
35、平均数,x,i,:,次数分配中各组的组中值,f,i,:,各组的次数或者权数,k,:分组的组数,加权算术平均数举例,3.,算术平均数应注意的问题,(,1,),(,2,),(,3,),四、几何平均数,geometric mean,几何平均数是,n,个变量值乘积的,n,次方根。,举例:生产某种产品需要连续经过,4,道工序,根据经验,各道工序的合格率分别为,98%,、,95%,、,92%,、,90%,,求该产品,4,道工序的平均合格率。,五、众数、中位数、均值的比较,三者的关系,三者的特点及应用场合,1.,三者的关系,2.,三者的特点及应用场合,对称分布或接近对称分布,选择均值较好。若偏态分布,选择众
36、数或中位数较好。,均值易受数据极端值的影响,对于偏态分布的数值,均值的代表性较差。,众数、中位数不易受极端值的影响。,事实上,在实际的应用当中,均值的使用率最高。,2.5,分布离散程度的测度,极差,方差,标准差,离散系数,一、极差,range,极差又叫全距,是数据最大值减去最小值,极差,R=max-min,二、方差,variance,和标准差,standard deviation,未分组数据,分组数据,1.,未分组数据计算方差和标准差,方差,标准差,2.,分组数据计算方差和标准差,方差,标准差,2.,分组数据计算方差和标准差:举例,2.,分组数据计算方差和标准差:举例,均值,方差,标准差,s=
37、262.85,四、离散系数,coefficient of variance,上面介绍的离散程度的测度值为绝对值,其大小取决于原变量值本身水平高低,变量值越大,测度值越大;另外,采用不同计量单位计量的变量值,其离散程度的测度值也不同。,而离散系数则可以消除变量值水平高低、计量单位不同对离散程度测度值的影响。,离散系数是标准差与均值之比:,四、离散系数举例,为比较两个不同城市居民家庭收入的差异程度,现从甲市随机抽取,100,户,得到其平均收入为,42000,元,年收入的标准差是,38060,元,从乙市随机抽取,100,户,得到其平均收入是,62000,元,年收入的标准差是,50980,元,试比较这
38、两个城市家庭年收入的差异程度。,由此,乙市的家庭收入差异程度低于甲市。(不能用标准差比较,否则得出错误的结论),2.6,分布偏态与峰度的测度,偏态及其测度,峰度及其测度,一、偏态及其测度,偏态是对分布偏斜方向及程度的测度。,偏态系数(,skewness,)来进行测度。,偏态系数的计算方法很多,这里介绍常用的一种,即:,离差三次方的平均数再除以标准差的三次方。,一、偏态及其测度,SK=0,对称分布,SK0,正偏或者右偏,SK0,,尖峰,K,帕氏指数,4.,综合指数的其他类型,(,1,)马歇尔,-,埃奇沃斯指数。马歇尔(,A.Marshaii,)和埃奇沃斯,(F.Y.Edgeworth),等人于,
39、18871890,间提出。,4.,综合指数的其他类型,(,2,)理想指数:(美国)沃儿什、庇古等人,19011902,年先后提出,后由费希尔通过大量比较和筛选,验证了其所具有的优良性质,将其命名为“理想公式”,ideal formula,。拉氏指数和帕氏指数的简单几何平均,公式为,:,4.,综合指数的其他类型,(,3,)鲍莱指数,1901,年统计学家鲍莱(,Bowley,)提出。拉氏指数和帕氏指数进行简单算术平均。,(,4,)固定加权综合指数,四、加权平均指数的主要形式,1.,加权算术平均指数,2.,加权调和平均指数,1.,加权算术平均指数,一般以基期总值加权的算术平均指数最为常用,其公式为:
40、,1.,加权算术平均指数(举例),1.,加权算术平均指数(注意的问题),(,1,)当个体指数与总值权数之间存在一一对应关系时,基期加权的算术平均指数恒等于拉氏指数。,1.,加权算术平均指数(注意的问题),算术平均指数不仅可以用绝对数加权,也可以用相对数加权,而且采用相对权数在应用上具有很多优越性。以价格指数为例,其计算公式为:,2.,加权调和平均指数,以计算期总值加权的调和平均数最为常用,其公式为:,2.,加权调和平均指数,当个体指数与总值权数之间存在一一对应关系时,计算期加权的调和平均指数等于帕氏指数。,2.,加权调和平均指数(举例),4.3,指数体系与因素分析,指数体系及其作用,总量变动的
41、因素分析,指数体系用于指数推算,一、指数体系及其作用,1.,广义的指数体系:泛指由若干个内容上相互关联的统计指数所结成的体系。如:市场物价指数体系(居民消费价格指数、生产者价格指数、零售价格指数等等),2.,狭义的指数体系:仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。,如:销售额指数,=,销售量指数*销售价格指数,总成本指数,=,产量指数*单位产品成本指数,总产值指数,=,产量指数*产品价格指数,一、指数体系及其作用,3.,指数体系的分析作用,:,(,1,),因素分析(分析现象的总变动中各有关因素的影响程度),(,2,)指数推算(根据已知的指数推算未知的指数),二、总量
42、变动的因素分析,以两因素分析为例。考察多种商品的销售额变动及其影响因素时,如果都用拉氏公式或者帕氏公式来编制销售量指数和价格指数,他们与销售额指数之间就难以形成严密的指数体系,即:,二、总量变动的因素分析,为了建立相应的“综合指数体系”,有两种供选择的方案:,二、总量变动的因素分析,为了统一,通常采用第一种分析方法。这种指数体系的完整分析框架为:,二、总量变动的因素分析(举例),二、总量变动的因素分析(举例),三、指数体系用于因素分析,三、指数体系用于因素分析,例,2,:同样多的人民币多购买,5%,的商品,问物价指数是多少?,1/105%=95.24%,例,3:,多购买,3%,的商品却可少付,
43、2%,的货币,问物价指数是多少?,98%/103%=95.15%,4.4,几种常用的经济指数,工业生产指数,消费者价格指数和零售物价指数,股票价格指数,一、工业生产指数,反映一个国家或地区各种工业产品产量的综合变动程度,是衡量经济增长水平的重要指标之一。我国的编制方法:(固定加权综合指数),一、工业生产指数,国外的编制方法是:(加权平均指数),为各种工业品的个体产量指数,为相应产品的基期增加值。,二、消费者价格指数和零售物价指数,1.,消费者价格指数,Consumer Price Index,,,CPI,综合反映各种消费品和生活服务价格的变动程度的重要经济指数。,2.,零售物价指数,Retai
44、l Price Index,3.,生产者价格指数,Producer Price Index,应,用,我国的商品零售价格指数、农副产品收购价格指数、职工生活费指数(居民消费指数)及西方的工业生产指数、消费品价格指数等等,均采用了固定权数的平均指数的编制方法。,特,点,权数资料一经确定,可在相对较长时间内使用,能减少工作量;,在不同时期内采用同样权数,可比性强,有利于指数数列的编制。,固定权数的平均指数,以,商品零售价格指数,的编制为例,将全部商品划分为大类、中类、小类、品种、规格;,确定各品种的代表规格品及权数,w;,按照小类、中类、大类、总指数的顺序逐级计算各级指数。,个别商品或类商品的价格指
45、数,步,骤,确定的居民消费构成固定权数,,w=100,商品类别及名称,代表规格品,计算单位,平均价格(元),权数(,w,)(,),指数(,),总指数,一、食品类,粮食,细粮,面粉,大米,粗粮,副食品,烟酒茶,其他食品,二、衣着类,三、日用品类,四、文化娱乐用品类,五、书报杂志类,六、药及医疗用品类,七、建筑装潢材料类,八、燃料类,标准,粳米,千克,千克,2.40,3.50,2.52,3.71,100,51,35,65,40,60,35,45,11,9,20,11,5,2,6,2,3,115.1,117.5,105.3,105.6,105.0,106.0,104.8,125.4,126.0,11
46、4.8,115.2,109.5,110.4,108.6,116.4,114.5,105.6,三、股票价格指数,股票价格指数可以衡量整个股票市场变动的基本趋势。,综合指数法:,p,为股票价格,,q,为相应股票的发行量或者交易量(一般取计算期的发行量),国外主要股价指数,道,琼斯股价指数,标准,普尔股价指数(,S&P500,),那斯达克(,Nasdaq,)指数,伦敦金融时报股价指数,日经指数,香港恒生指数,工业股价指数;,运输业股价指数;,公用事业股价指数;,综合股价指数;,道,琼斯公正市价指数,其中,道,琼斯股价指数由,5,种股价指数构成:,上海证券交易所股价指数,深证综合指数,深证成分指数,深
47、证,100,指数,深圳证券交易所常用股价指数,三、股票价格指数(举例),4.5,综合评价指数,综合评价指数的基本思想,构建综合评价指数的基本问题,综合评价指数的编制方法,一、综合评价指数的基本思想,1.,在经济管理和分析实践中,常常需要根据统计指标的实际水平对有关的经济活动或经济状况进行评价,叫做统计评价。包括:单项评价(一项指标)和综合评价(多项指标)。,2.,单项评价:如一国的人均,GDP,考察其经济实力和发展水平。,多项评价:一国的经济发展水平不仅表现为人均,GDP,,还有产业结构、资源利用(绿色,GDP,)、居民的福利及生活水平。(和谐社会的评价指标、人的幸福指数),一、综合评价指数的
48、基本思想,3.,综合评价方法,(,1,)常规的综合评价方法:,简易计分法(体育、歌唱比赛中的综合评分)和参数指标法(选定综合评价所要考虑的几个主要方面的指标,以特定的方式结合起来,构成一个新的评价指标),生活质量指数,=,(,2,)规范的综合评价方法,依据指数分析的原理对多项指标进行综合对比,最后得出概括性的单一评价指标。称为“综合评价指数法”。,二、构建综合评价指数的基本问题,1.,建立综合评价指数体系,2.,确定各项指标的评价标准,(可以用各项指标的中等水平作为单一“标准值”,也可以确定有关的阈值,采用相应的对比方法将原始数据无量纲化,得到各项指标的个体指数),3.,确定各项评价指标的权重
49、,4.,选择评价指标的合成方法(算术平均、几何平均),三、综合评价指数的编制方法,标准比值法,功效系数法,1.,标准比值法,通过对各项参评指标分别确定单一的对比标准来计算个体指数,然后将个体指数加权平均得到综合评价指数。,举例,361,页例,10.8,2.,功效系数法,通过对各项参评指标分别确定阈值,并运用“功效系数”的方法计算个体指数,然后将个体指数加权平均得到综合评价指数。,功效系数,d,的计算方法:,2.,功效系数法,第五章 抽样与抽样分布,主要内容,5.1,常用的抽样方法,5.2,抽样分布,重点与难点,重点:常用的几种抽样方法(包括简单随机抽样、分层抽样、系统抽样、整群抽样)、抽样分布
50、定理,难点:抽样分布定理的应用,5.1,常用的抽样方法,样本(,sample,)是按照一定的抽样规则从总体中抽取的一部分单位的集合。根据抽取的原则不同,抽样方法有概率抽样和非概率抽样。,(,本科评估专家如何抽样?,),5.1,常用的抽样方法,(,1,)概率抽样(随机抽样):按随机原则抽取样本,随机原则(,random,)排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽为样本单位。(比较客观),最基本的组织方式有:简单随机抽样、分层抽样、系统抽样、整群抽样。,该方式有效避免了主观选择带来的倾向性误差,可以估计、推断建立在概率、数理统计的科学理论上,可以计算、控制抽样误差,能够说明估计结果的