资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计分析讲座,西南财经大学统计学院 张照贵,(,028,),87355672,eyes,广大统计人员必须改变传统的工作方式、方法,把工作重点从事后统计转移到统计分析、监督、预测和决策上来。,泰罗的铁铲实验,泰罗在伯利恒钢铁厂当工程师时,发现装卸工在装卸货物时,都使用同样大小和样式的铁铲,这样效率很低,一个工人平均每天只能装卸,16,吨货物。泰罗挑选了一批标准体力的工人进行实验。发现每铲的重量约为,21,磅时,效率最高。故建议工厂应根据装卸不同的货物使用不同大小和形状的铁铲,目的是使每铲的重量达到,21,磅。同时他建议合理安排休息时间,并相应提高工人工资。这样一来,实验组的工人每天能完成,59,吨的工作量。,生活中的系统工程,淘米 洗菜 煮饭,29,分钟,切菜 炒菜,淘米 煮饭,22,分钟,洗菜 切菜 炒菜,2,分钟,7,分钟,20,分钟,3,分钟,9,分钟,2,分钟,20,分钟,7,分钟,3,分钟,9,分钟,“许多统计学家在第二次世界大战中发挥了重大的作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被咨询飞机上什么部位的钢板需要加强时,在飞机的轮廓图上标出返航战斗机上受敌军创伤的弹孔位置。资料积累一段时间后,机身各部位几乎都被填满了。,于是沃德建议,把剩下少数几个没有弹孔的位置加强,因为这些部位被击中的飞机都没有返航。”,戴维,.S.,穆尔,“,情报象我们呼吸的空气一样,是国家的资,源,精确而有用的情报对国家和个人来说,,如同氧气对于我们健康和幸福那样必要,我,国国民生产总值的一半都与情报活动有关。,在我国商业,科学,法律,医学,政府和技,术革新中,情报经常提供必要的活力。它点,燃了创造发明的天才的火焰,它帮助人们,决策世界上日益复杂的各种问题,”,卡特,科学研究是高价的,成果是昂贵,的,情报是廉价的,若,1,项科技,成果的研究费为,1,,发展推广费,为,10,,生产费用达,100,,而情,报只要,0.05,。,某些人不喜欢统计这个名词,但,我却发现其中充满了乐趣,他们处理,各种复杂现象的能力是非凡的。他们,是追求科学的人从荆棘丛生的困难阻,挡中开辟道路的最好工具。,高尔登,“有三种谎话,即一般的谎话,该死的谎话和统计”,狄斯雷利,洛杉机湖人队,2000,年队员年薪水(百万美元),球员,薪水,球员,薪水,奥尼尔,17.1,哈珀,2.1,布莱恩特,11.8,格林,2.0,霍利,5.0,乔治,1.0,莱斯,4.5,肖,1.0,费希尔,4.3,萨利,0.8,福克斯,4.2,卢,0.7,奈特,3.1,塞莱斯坦德,0.3,该队的,平均工资为,410,万元,,而,中位数是,260,万元,,众数是,100,万元,“要用统计骗人很容易。但不用统计,骗人更容易”,-,寞斯提勒,红楼梦,后,40,回出自谁的手笔,众所周知,,红楼梦,一书共,120,回,一般认为前,80,回为曹雪芹所写,后,40,回为高鹗所续,长期以来对这个问题一直有争议。能否从数学上做出论证,?1985,、,1986,复旦大学李贤平教授带领他的学生作了这项有意义的工作,他们创造性想法是将,120,回看成是,120,个样本,然后确定与情节无关的虚词作为变量,(,所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的,),,,NEXT,数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类,果然将,120,回分成两类即前,80,回为一类,后,40,回为一类,很形象地证实了不是出自同一人的手笔。之后又进一步分析前,80,回是否为曹雪芹所写,?,这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔,而后,40,回是否为高鹗写的呢,?,论证结果推翻了后,40,回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。,如何进行统计分析?,一、统计分析的任务、特点、作用(一)统计分析的概念 统计分析,是运用科学的方法,对统计资料进行精密加工,分析研究,从而对社会经济现象的,特点、规律、本质,进行深入的认识,并得出相应结论及,建议措施,的工作过程。,如,19,世纪德国统计学家恩格尔通过对大量反映比利时工人家庭收支情况的统计资料进行分析,提出著名的恩格尔法则,1,、家庭收入越多,则食品费用占收入的比重越小;,2,、无论收入多少,衣着费用占收入的比重变化不大;,3,、租金、灯火、煤炭等费用比重不受家庭收入多少影响;,4,、收入越多,杂费支出比重越大。,食品费用所占比重(,%,)生活水平,59,以上 绝对贫困,50-59,勉强度日,40-49,小康水平,30-39,富 裕,30,以下 最 富 裕,中国需要发展个体经济,案例背景,1979,年是中国改革开放的第二年,党中央提出要坚持以经济发展为中心的政策。这时的中国刚从文化大革命“以阶级斗争为中心”的恶梦中醒来,经济几乎处于崩溃的边缘,百业待兴。人民生活中的购物难、做衣难、修车难、理发难等成为当时十分突出的问题,要解决这些人民群众生活的难题,需要发展个体经济,但受“极左”思潮余毒的影响,发展个体经济的步履维艰。,案例资料,表,1,某城市有如下统计资料,1965,年,1979,年,全市人口(万人),自行车(万辆),缝纫门市部(个),自行车修理店(个),401,100,1500,500,757,300,225,170,指标计算表,1965,年,1979,年,发展速度(,%,),绝对差额,全市人口(万人),401,757,188.78,356,自行车(万辆),100,300,300,200,缝纫门市部(个),1500,225,15,-1275,自行车修理店(个),500,170,34,-330,强度相对数,1965,年,1979,年,修理店,/,自行车(个,/,万辆),自行车,/,修理店(万辆,/,个),5,0.2,0.57,1.76,缝纫店,/,人口数(个,/,万人),3.74,0.3,人口数,/,缝纫店(万人,/,个),0.27,3.36,计算表明,该市,1979,年的人口比,1965,年增加了,88.78%,,净增,356,万人,但缝纫店由,1965,年的,1500,个减少到,1979,年的,225,个,减少了,1275,个,万人拥有的缝纫店则由,1965,年的,3.74,个减少到,1979,年的,0.3,个,减少,3.44,个,减少了,92%,,每个缝纫店的负担系数则由,1965,年的,0.27,万人增加到,1979,年的,3.36,万人,负担系数增加了,11.4,倍;该市,1979,年的自行车比,1965,年增加了,200%,,净增,200,万辆,但自行车修理店则由,1965,年的,500,个减少到,1979,年的,170,个,减少了,330,个,万辆自行车拥有的修理店个数由,1965,年的,5,个下降到,1979,年的,0.57,个,减少,4.43,个,减少,88.6%,,每个修理店的负担系数由,1965,年的,0.2,万辆增加到,1979,年的,1.76,万辆,负担系数增加了,7.8,倍。如此强烈的反差,人民群众怎能不感叹修车难,做衣难呢?这些涉及为人民群众日常生活的服务业,显然不可能搞“越大越公”的所有制企业,而应当发展个体经济来得以解决。根据以上的统计分析,有人向党中央提出“涉及为人民群众日常生活的服务业,应当发展个体经济来得以解决”。由此,发展个体经济的坚冰开始打破。,(二)统计分析的任务,1,、宏观经济统计分析的任务,1,)检查经济计划的完成情况及执行中存在的问题,为制定正确的经济计划和组织计划的实施提供依据。,2,)对经济的发展变化进行评价和监测。,3,)为国家运用经济杠杆,有效管理经济,搞好市场服务。,4,)反映对外开放及对外贸易等等。,2,、微观经济统计分析的任务,1,)市场信息的整理与分析,内部信息与,外部信息,2,)为企业的经营决策服务,3,、科学技术统计分析的任务,(三)统计分析的特点,1,、统计分析的客观性和广泛性,2,、统计分析的数量性,3,、,统计分析的社会标准化性,4,、统计分析的的多层次性和总体系统性,5,、统计分析的科学性,(四)统计分析的作用,1,、在社会经济领域的作用,1,)认识客观规律的作用,2,)促进信息产业的作用,3,)现实生活中的作用,-“,统计时代”,2,、在统计领域的作用,1,)更好发挥统计部门的作用,-,信息职能,2,)为社会公众服务,-,咨询职能,3,)为制定检查政策、计划提供依据,-,服务、监督职能,4,)有利于统计方法、制度的改革,5,)有利于提高统计干部的业务素质,二、统计分析的原则,1,、实事求是的原则,2,、“一分为二”的原则,3,、全局和全面的原则,4,、数字与情况相结合的原则,5,、发展的原则,三、统计分析的基本步骤,(一)选择分析研究的课题,1,、选题的意义,选题准确与否,是关系到统计分析目的是否能达到的 重要问题。不同的选题还决定着不同的分析方法。,2,、选题的要求,1,)要适时对路,2,)要新颖独到,3,)要解放思想,4,)要切实可行,3,、选题的内容,统计分析报告的课题一般有三种:任务题、固定题、自选题。,针对自选题,应当从以下方面选题:,围绕方针政策选题,;,围绕中心工作选题,围绕计划选题,围绕重点选题,围绕经济效益选题,围绕重大变化选题,围绕薄弱环节选题,围绕横向比较选题,围绕发展战略选题,围绕“空白”选题,4,、标题的要求,准确,(,贴切,),、,简练、新颖、有吸引力,吃一拿二眼观三,行情不妙就转产,、,产品质量是企业生存的希望,、,厂长、经理该拿多少钱?,、,利润目标为什么不能实现?,、,廉价化肥哪里去了?,、,十五期间城乡人民生活水平显著提高,、,避之不及的送礼风,却之不恭的人情债,、,喜在眉头瞬逝,愁在心头难消,-,析借债办婚事,等等。,5,、统计分析报告的种类,由于统计分析的对象、内容、时间和方法的不同,因而产生了不同形式的统计分析报告类型。,按题材性质,,可分为工业分析报告、农业分析报告、商业分析报告等等;,按内容范围,,可分为专题分析报告和综合分析报告;,按时间长度,,可分为期中分析报告和期末分析报告、定期分析报告和不定期分析报告;,按功能作用,,可分为状态分析报告、规律分析报告和预测分析报告。,统计中常用的统计分析报告有:,1,)专题分析报告,专题分析报告是对社会经济现象的某一个方面的问题进行专门调查和深入研究的一种统计分析报告。它的作用主要是为领导解决某个问题,制定某项政策,做出某项决策提供参考和依据。,专题分析报告具有以下特性:,单一性、深入性、灵活性。,2,)综合分析报告,综合分析报告是从社会生产全过程综合反映和评价一个地区、一个部门或一个单位全面情况的一种统计分析报告。它的分析对象可以是大小不同的总体,不仅能综合反映一个地区社会经济的总规模、总水平,综合研究国民经济主要比例关系,也能综合研究一个企业产,供、销以及内部生产经营环节之间的比例关系。综合分析报告通过研究生产,分配、交换和消费中的基本状况、各种矛盾以及比例关系,为促进社会生产各部门、各环节的协调发展提供决策依据。,综合分析报告具有以下特点;全面性、联系性。,3,)进度分析报告,进度分析报告的特点进度性、规范性、时效性,4,)统计预测决策报告,统计预测报告的特点预见性、假定性、建议性。,(二)搜集资料,(三)拟定分析提纲,(四)资料的整理与分析,(五)提供分析报告,“,轶闻,引人注目,是因为它很突出,所以会深入人心。,在大众心目中,每次都是轶闻得胜。但我们应该心存疑问。数据比轶闻可靠,因为数据可以有系统地描绘出整体的情况,而轶闻只聚焦于少数特例”。,戴维,.s.,穆尔,“,数据不会说谎,但说谎的人会想出办法。”,格罗夫纳,“这些数据是打哪儿来的?为什么我们应该相信?”,“好数据是人们智慧及努力的产物。坏数据的来源,则是懒惰、不了解甚至存心误导。每当有人丢个数字给你,你第一个该问的问题就是“这些数据是打哪儿来的?”,戴维,.s.,穆尔,统计数据,即统计资料,是总体或总体单位某一数量特征的具体表现。,统计数据的处理(统计整理),一 统计整理的意义和步骤,(一)含义,将调查得到的统计数据根据,分析的目的,进行,审核、分类、汇总,等加工处理,使之系统化、条理化,成为能够反映事物总体特征的综合资料的工作过程。,(二)内容,数据处理:,分类、汇总、表现(制表、图),数据管理:,输入、贮存、更新、输出,(三)步骤,1,制定统计整理方案,主要内容包括,指标体系的设计;分组体系的设计;统计表、图的设计;具体工作计划的安排(人员、时间、经费、培训等)等。,2,数据的审核、筛选与排序,数据的,审核,发现数据中的错误,数据的,筛选,处理数据中的错误,数据,排序,发现数据的基本特征,升序和降序,数据的审核,(原始数据),审核的内容,完整性审核,检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全,准确性审核,检查数据是否真实地反映了客观实际情况,内容是否符合实际,检查数据是否有错误,计算是否正确等,审核数据准确性的方法,逻辑检查,从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象,主要用于对定类数据和定序数据的审核,计算检查,检查调查表中的各项数据在计算结果和计算方法上有无错误,主要用于对定距和定比数据的审核,3,、数据处理,手工整理、计算机整理,4,、编制统计表或统计图,消失的厢型车,纽约长岛有一位叫麦纳马拉的车商,在,1985,至,1991,年间,向通用汽车公司借贷了超过,60,亿美元。仅在,1990,年,12,月,他就借了,4.25,亿,购买了,17000,辆通用厢型车,交由印第安纳州一家公司来改装,号称要销售到海外。因为他的信用良好,所以通用汽车欢欢喜喜的借钱给他。,让我们 细想想这些数据,这是通用汽车公司该做却没有做,的。整个厢型车改装行业,一个月差不多改装,17000,辆。麦纳马拉等于宣称他一个人买下了全美整个月的数量。这种车在,1990,年只有,1.35%,外销。称一个月要买,17000,辆车来外销,是令人怀疑的。即使和厢型车的全部产量相比,这些数据也值得怀疑。,雪佛兰,1990,年全年才生产,100167,辆厢型车。,看到这些数据后,应该知道是怎么回事了,麦纳马拉是骗子。,麦纳玛拉在,1992,年联邦法庭中承认他大大地诈骗了通用汽车公司,印第安那州的公司是麦纳玛拉的空壳公司,发票是伪造的,,所购汽车根本不存在。麦纳玛拉大量向通用汽车借钱,大部份,用来还前次的借款(因而建立了良好的信用记录),而他也趁机揩油,前后共诈骗了,4,亿美金。通用汽车两位应仔细审查相关,业务数字的主管,也因此被开除。,高产瓜田,极富声望的,科学,期刊某期有一篇文章在谈论侵害植物的昆虫,,文中提到加州有一块田,每英亩生产,750000,颗瓜。,大家知道,一英亩为,43560,平方英尺,即意味着每平方英尺约生产,17,颗瓜,若是哈密瓜,一颗瓜就约占一平方英尺,人们猜想,一定是一颗叠一颗长,一共,17,层。,实际是每英亩大约生产,11000,颗瓜。,老年大军来了,1976,年出版的,科学,期刊某期中一篇文章的作者提出“在美国,,65,岁以上的人口现有共,1000,万,到公元,2000,年时会达到,3000,万,而且会占美国人口的,25%,,是前所未有的高比率。”警钟响起了老年人会在四分之一世纪里变成三倍,会构成全体美国人口的四分之一。,事实果真如此吗?,先进行一个简单的计算,,3000,万人占总人口数的,25%,,则,2000,年的总人口应是,1.2,亿,(,3000/0.25=1.2,亿),而美国人口在,1975,年已经是,2.16,亿了。,翻开,美国统计精粹,,看看事实如何。,1975,年,美国,65,岁以上的人口是,2240,万,而不是,1000,万,占总人口的比率为,10.37%,,到,2000,年,美国总人口约,2.5,亿,,3000,万占总人口,的比率为,13%,。人的寿命愈来愈长,所以老年人的数目会有持续增加的趋势。不过,在,25,年之间,老年人口比重从,10%,增加到,13%,,可比,科学,期刊中的那位作者所说的比率低多了。,女性的心脏病,公路边一个大广告牌上简短地写着“死于心脏病的人当中,有一半是女性。”立此广告牌的人也许是要提醒女性要注意心脏病的风险,因为许多女性低估了心脏病的风险;也许广告主要是想反击对男性心脏病的过强调。,这个真实叙述的背后,到底藏着什么目的?,很多人对于各式各样的议题有强烈立场。强烈希望看到的数据可以支持他们的立场。通常只要他们很小心地选择数据来报道,或者努力想办法把数据挤压成想要的形状,就可以找到支持他们立场的数据。,本案例就是其中的一起。虽然死于心脏病的人有一半是女性,然而她们的平均年龄却比男性大很多。大致来说,全美每年有,36000,位,65,岁以下的女性及,85000,位,65,岁以下的男性死于心脏病。美国心脏病协会说“女性死于冠状动脉心脏病的风险,差不多和小她,10,岁的男性一样。”,暴风雪的利弊,威斯康星州密尔瓦基地区的一则新闻报道“这场冬季风暴挟着雪横扫该地区,造成,28,起轻微交通事故”,记者迈尔常搜集这类资料,他问该地警长,好天气时通常有 几起轻微交通事故,警长说大约为,48,起。迈尔认为似乎应当这样写“这场暴风雪,防止了 约,20,起交通事故的发生。”,如此大相径庭的叙述,我们该相信谁的?,最常见的误用数据的方式是,虽然引用了正确的数据,但是因为没把全部事实说来,所以数据的意义并非表面上看起来的那样。数据是有相关内容的,如果你不知道相关的内容,那么单独、赤裸裸的数据就没法给你太多信息。,本案例中,如果不进一步了解暴风雪天气开车出门的车辆数是否比正常天气的数量是增加还是减少;暴风雪天气出门的人数是否比正常天气的数量是增加还是减少;交通事故发生原因的类型等相关情况,轻易下结论看来均有片面性。,收入的差距,在,20,世纪,80,年代和,20,世纪,90,年代美国经济起飞的时候,最高收入人群和最低收入人群的差距加大了。在,1980,年的时候,最低收入的五分之一的住户,只赚到全美总收入的,4.3%,,而前五分之一的高收入户得到,43.7%,。到,1998,年,最低收入的五分之一的住户,收入下降到总收入的,3.6%,,而前五分之一的高收入户则上升到到,49.2%,。也就是说,前五分之一的高收入户的所得,几乎是最低收入的五分之一的住户的,14,倍。,贫富真有如此大的悬殊吗?,看来要将数据挤压成人们希望的形状是轻而易举的。,福布斯,(一种供有钱人阅读的杂志)将数据进行了一些处理。首先,平均来说,富人家的人口数比穷人家的人口数多,应改算成每个人的收入(而不是每户);其次,有钱人缴纳税多,应考虑税后收入;再者,穷人有食物代卷及其它补助,也应计算进去;最后,收入高的人工作的时间比低收入的人多,所以应该根据工作时数调整。这样重算之后,前五分之一的高收入者的收入,变成只是后五分之一低收入者收入的,3,倍。,还有人认为,普查局的收入数据当中,并不包括资本收益,比如说股票上涨卖出所赚的钱。资本收益绝大多数都进了有钱人的腰包,所以把这项加进去会使收入差距更大(但,福布斯,可没有这样做)。普查局说,如果把任何可以想象得出来的,可以叫做收入的东西都调整进去的话,,1998,年最低所得的五分之一住户的收入占总收入的,4.7%,,而最高所得的五分之一住户的收入占总收入的,45.8%,。,你认为呢?,夏天多小偷,一个住宅保全系统的广告上说;“你去度假的时候,小偷就开始工作了,根据统计资料显示,有,26%,的住宅窃案发生在阵亡将士纪念日和劳工节之间。”,这段时间的盗窃率高吗?,广告的意思显然是想告诉我们,小偷在暑假期间特别话跃。可是看看你的日历,阵亡将士纪念日和劳动节之间隔了,14,周,在一年,52,周中,所占的比重为,26.9%,(,14/52,)。因此广告等于在说;一年当中,26%,的窃案,发生在,27%,的时间当中,这显然并没有什么奇怪之处。,用什么评量公路安全性?,美国死亡事故通报系统报告,1989,年的死亡人数是,45582,人,,1998,年的死亡人数是,41471,人。,1998,年的死亡人数比,1989,年减少了,4111,人、故公路的安全性更高了。,用总量指标来衡量公路的安全性合理吗?,一旦我们决定了要度量什么性质,就应该想想应该怎样度量才是正确的。,本案例中,用死亡人数来度量公路的安全性不是有效的度量。因为,有驾照的人从,1989,年的,1.66,亿上升到了,1998,年的,1.85,亿,开车总的英里数也从,20960,亿英里增加到,26190,亿英理。如果更多人开了更多英里,即使道路安全了,死亡人数也可能增加。死亡人数不是公路安全的有效度量。用相对数(每亿公里的死亡人数)才是反应公路安全性的有效度量。,死亡率由,1989,年每亿英里,2.2,人(,45582/20960,)下降到,1998,年的,1.6,人(,41471/26190,),,1998,年和,10,年前相比,每亿英里的死亡人数减少了,27%,,开车已愈来愈安全了。,假数据与真数据,美国的,实验医学期刊,登载了一篇由史隆,-,凯特林中心通过的“关于明民苏达老鼠实验的总结”的论文,论文中有一个统计表,表中有,6,组动物,每组各,20,只,每组实验的成功率(,%,)分别为,53,,,58,,,63,,,46,,,48,,,67,。,莱思克受邀为史勒次基写推荐函,他阅读了史勒次基的两篇论文,两篇论文均用控制组的动物进行实验分析,两篇论文所引用的动物数目不相同,而实验结果的数据却完全一样。,每组实验的成功率合理吗?实验结果的数据完全相同可能吗?,这样的错误,连聪明的小学生都能看出来。显然,,20,的任何百分比都应该是,5,的倍数。不可能出现,53,、,58,、,63,、,46,、,48,、,67,这样的一些百分比。,本案例中两篇论文中不同数目动物的对比实验,却得到完全一样的数据,结果数据的高度一致性使人产生怀疑。原来是同一个实验,这即使不是有意做假,也是非常草率的做法。,二 统计整理的基本方法,-,统计分组,(一)统计分组的含义和作用,1,、概念,根据研究目的,按一定的标志将总体单位分为性质不同但又有联系的若干部分(组),对总体,分,对个体,合,突出组与组之间的差异、抽象组内各单位差异,2,、作用,区分事物质的界限(划分社会经济类型)、反映现象内部的结构及比例、揭示现象间相互依存关系。,3,、原则,科学性原则、完备性原则(不漏)、互斥性原则(不重),三 分布数列,-,统计分组的必然结果,(一)分布数列的含义和种类,1,意义,2,构成要素,:,分组标志的具体表现和次数。次数又分频率和频数。,3,种类,品质数列、变量数列,品质数列是按品质标志分组而形城的分布数列。,变量数列是按数量标志分组而形成的分布数列。,表,2-1,某公司职工文化程度状况,文化程度 工人数 比重(,%,),小学,400 8,初中,1500 30,高中,2600 52,大学,500 10,合计,5000 100,品质数列由各组名称及次数(频数、频率)构成,变量数列,单项式数列,概念、适合离散变量、变量值不多的情况。,组距数列,概念、适合连续变量(离散变量)、变量值多时。,等距数列,每组组距均相等的组距数列。,异距数列,每组组距不均相等的组距数列。,概念:组限(开口、闭口)(重叠、不重叠),组距(等距、异距),组中值概念、计算(开口组)、含义,某企业日产量(表,22,),日产量 工人数,10 70,11 100,12 380,13 150,14 100,合计,800,单项变量数列,(等组距、上下组限重叠),某,班,学生考试成绩次数表,成绩(分),学生人数,向上累计,向下累计,50-60,2,2,54,60-70,15,17,52,70-80,19,36,37,80-90,15,51,18,90-100,3,54,3,合 计,54,累计次数向上累计、向下累计的计算和意义。,表,3-5,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,110,110,115,115,120,120,125,125,130,130,135,135,140,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,(等组距、上下组限间断),表,3-6,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,109,110,114,115,119,120,124,125,129,130,134,135,139,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,不等组距数列,表,3-7,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,109,110,119,120,129,130,139,140,149,150,159,160,179,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,开口组、不等组距的变量数列,开口组组中值的计算按相邻组的组距作为开口组的组距计算。,(二)变量数列的编制,1,、步骤,确定全距(排序),确定组数,确定组限:离散变量组限不重叠,连续变量组限重叠,将总体单位归入各组,组距分组,(步骤),(1),确定组数:,组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按,Sturges,提出的经验公式来确定组数,K,:,(2),确定各组的组距:,组距,(Class Width),是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即,组距,(,最大值,-,最小值),组数,Log(,n,),Log(2),K,1+,(3),根据分组整理成频数分布表,某裨酒,公司某月,60,个销售点的销量统计,48 71 52 53 36 41 69 58 47 60 53 29,41 72 81 37 43 58 68 42 73 62 59 44,51 53 47 66 59 52 34 49 73 29 47 16,39 58 43 29 46 52 38 46 80 58 51 67,54 57 58 63 49 40 54 61 58 66 47 50,单位:桶,excel,啤酒销售量的分布数列(表,2,-3,),销售桶数 销售点数 频率,(%),1019 1 1.7,2029 3 5.0,3039 5 8.3,4049 16 26.7,5059 20 33.3,6069 9 15.0,7079 4 6.7,8089 2 3.3,合计,60 100.0,2,、次数累计,(三)统计表,表现经过整理的统计数据的表格。,1,、统计表的构成,按形式:,标题,总标题、横栏标题、纵列标题,横行、纵列,数字,按内容:,主词 (主栏),宾词 (宾栏),2,、统计表的种类,(,1,)按主词分组情况不同分为简单表、分组表、复合表。,(,2,)按用途不同分为调查表、整理表、分析表。,(,3,)按时间不同分为静态表、动态(时间)表。,四 统计图,直观地表现统计整理结果,(一),常用的统计图,1,、直方图,2,、轮廓图,3,、,饼图,4,、面积图,政府发放工资总额(上升),6 7 8 9 10 11 12,月,6 7 8 9 10 11 12,月,30,20,10,工资总额(百万元),政府发放工资总额(稳定),2000,万美元,1950,万美元,5,折线图的误用,慎重的人在看折线图时,会仔细地看横轴和纵轴上标示的刻度。,累计次数分布的应用:,将全社会从业人员按收入水平分组,从低收入到高收入组汇总计算向上累计频率,得洛伦茨曲线。,A,B,20,世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配平等程度的指标(如上图),设实际收入分配曲线和收入分配绝对平等曲线之间的面积为,A,,,实际收入分配曲线右下方的面积为,B,。,并以,A,除以,A+B,的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。系数可在零和,1,之间取任何值。收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么尼系数也越大。联合国有关组织规定:若低于,0.2,表示收入绝对平均;,0.2-0.3,表示比较平均;,0.3-0.4,表示相对合理;,0.4-0.5,表示收入差距大;,0.6,以上表示收入差距悬殊。,95,年,96,年,97,年,98,年,99,年,0.28,0.284,0.292,0.3,0.295,NEXT,(,二)次数分布图(统计图的一种)的主要类型,钟型分布,U,型分布,J,型分布,1,直方图,2,折线图,3,曲线图,统计分析方法分析的目的,指标分析法,总量指标、相对指标、平均指标,指数分析法(因素分析法),时间数列分析法,相关回归分析法,假设检验分析法,创新思维分析法,预测决策分析法,不注意量度的单位,有时会让你陷入大麻烦。,1999,年,火星气象观测轨道太空船在火星大气中焚毁。,它原本应该处于火星上方,93,英里(,150,千米),事实上则只到上方,35,英里(,57,千米)处。,这是因为太空船的制造者,洛克希德马丁(,Lockheed Martin,),公司用英制,(英磅、,英里等,),标示了重要的量度,,但,负责太空船飞行的国家航空和航天管理局却以为数字代表公制,(,千克,、,千米等,)。,1.25,亿,美元就这样泡汤了,。,“,一旦我们决定了要度量什么性质,就应该想想怎么度量”,“错误的结论或令人无法理解的结论,常常是粗心大意的结果,,其中,比率以及百分比尤其容易出错,一个量可以无限增长,,增长,100%,只不过代表它变成原来的两倍。但没有什么量可以减少超过,100%,,减少,100%,就已经什么也没有了”,例这是什么百分比?,澳大利亚的,堪培拉时报,报道“超过,60,岁而独居的人当中,,34%,是女性、而只有,15%,是男性”。加起来只有独居人口的,49%,,我猜另外那,51%,既非女性,也不是男性。,在美国,一份写给大学教师的信中问道“女性被指派为某,一专业等级的机会,比男性少,550%,,这样合理吗?”,不管什么东西,如果拿走,100%,,就什么也没有了。少,550%,让人摸不着头脑。,决策方法及应用,决策概论,一决策及决策的发展,“人人作决策、天天作决策”。,决策并不神秘,从狭义上讲,决策就是“决定”。日常生活中许多事情需要我们作出决定,如出门是否需要带雨具;选什么课程;到商店买衣服,买不买,买什么样式,什么颜色等等问题,都需要作出决定。不过,对于这些小问题的决策,一般称为“决定”。决策一般可理解为“决定政策”。主要是指关系到国家的发展,企业生存等等一些大问题的决定。,管理理论中的决策是广义的,既包括对小问题的“决定”,也包括对大问题的“决策”,但侧重于大问题的决策。,“要胜曹公,需用火攻,万事俱备,只欠东风”。,三国赤壁之战采用火攻这一正确的战术决策,为诸葛亮“三分天下”的战略决策的实现奠定了基础。可见,决策思想古已有之。决策是人类固有的行为之一,有人类就有决策。,中国是一个文明的古国,在历史上可找出许多“运筹帷幕之中,决胜千里之外”的成功的决策范例,如大禹分而治之的治洪方案;三十六计中的“围魏救赵”、增兵减灶”等等策略;战国时的“田忌赛马”,就有了博弈论的思想;宋朝丁渭“一举三得”的修城方案,己具有现代系统工程的思维方法;都江堰李冰父子提出的“低筑堤,深淘堰”的治河方案,至今仍有参考价值。,但古时的决策主要依靠领导者个人的知识和经验来进行的,既有许多成功的范例,也有许多“一失策顿成千古恨”的事例,,如项羽饮恨自刎乌江;赤壁之战的“蒋干中计”等等。,这时的决策被称为,“经验决策”。,“战局瞬息万变”。,把决策的观念和方法推向科学化的,首先是在军事领域中逐步发展并开始形成的。随着历史的进程,战争的规模越来越大,武器更先进,参战的人员、兵种更多,需要相互配合,协同作战。军事指挥者越来越感觉到仅靠个人的经验和才能已不能应付复杂的战争局面。,1806,年,普鲁士的军事改革家香霍斯特创建了“参谋本部”体制。它以众多参谋的集体智慧来协助和支持军事长官的决策。,“规章制度是重复的结果”,。人们在决策时发现许多决策问题会重复出现,若能寻找出一些共同的规律并加以制度化,则可大大提高决策的效率。,“一种科学只有成功的运用数学时,才算达到真正完善的地步”。,20,世纪以来,由于数学理论、方法的飞速发展,使数学这门学科显得格外光采夺目。特别是在“运筹学”产生以后。二次世界大战期间,“搜索论”被用于飞机如何有效地搜索德军潜艇;“规划论”用研究如何用最少的护航舰达到最好的护航效果;“对策论”(博弈论)用来研究舰只在“神风突击队”(日本空军敢死队)攻击下的各种应急措施;“库存论”用于研究军备、武器的合理库存量;“网络论”用于战时的交通调度和管理;在“系统论”指导下“自由轮”的建造,被罗斯福总统认为是二次大战获胜的重要工具。,二次世界大战结束后,许多军事人员开始从事工业和商业经济活动,他们发觉经济活动与军事活动有许多相似的地方。因此,许多用于军事领域的数学方法也可用于经济领域。特别是在电子计算机产生后,许多数学方法有了真正实用的价值。,因此,到,20,世纪,决策才走上科学化的道路。,而决策科学化的标志是“数学化、模型化、电子计算机化”。,“危机是革命的前夜”。,由于数学方法(特别是运筹学)在军事和经济领域取得巨大的成功。管理科学一词几乎成了运筹学的代名词,许多公司成立了专门研究数学模型的机构。他们相信任何管理问题只要给出足够多的约束条件,变量数目,设计出一个比一个更庞大的矩阵图、网络图及数学模型都能迎刃而解。这种狂热在西方一直持续到,20,世纪,60,年代。,但是,一个象棋大师异于常规的怪招,使得储备了许多常规棋谱的机器人举手无措。,12,届世界杯足球赛时,人们将,24,支球队的历史、队员的技术条件、身体素质、气候、环境、营养状况及过去的比赛记录等极为细致的情况输入计算机进行分析,希望用计算机来预测比赛的结果。,但,令人沮丧的是,第一轮计算机预测的结果与实际结果的误差高达,41.7%,。而西班牙国王卡洛斯的预测误差确只有,16.7%,。而决赛的结果与计算机的预测更是相差十万八千里。,过份追求数学化、模型化的失败记录也日渐增多。决策方法数学化、模型化的上空笼罩着一片乌云。好走极端大概是人类的通病。许多公司撤消了数学模型机构。决策方法面临着一场危机。,“创造力是人类最高的能力,正是它把新事物引进了人们的想法、观念、方法和系统”。,错误和教训使人们变得聪明起来,人们终于认识到,决策的科学化并不单纯是决策方法的数学化。决策是一种复杂的社会行为,决策是人作出的,也要人来执行。决策,方案是在特定的政治、经济、文化等条件下确定并实施的,这就必然涉及到人的、社会的、经济政治的、文化的、心理的诸多因素。而有些因素是难以或不能定量的,对这些因素数学方法是无能为力的。,因此,盲目过份地追求决策方法的数学化、模型化将导致管理科学的死亡。于是许多发挥人的创造性思维的决策方法应运而生。如“头脑风暴法”、“强制联想法”等等。相对于决策的数学方法(硬方法),这些方法被称为决策的“软方法”。,美国的管理学家斯塔尔对此深有感触地说,“管理科学逐渐地越来越不象物质科学,而越象社会科学。人们渐渐明白了,问题的软的行为科学方面和硬的物质数量测定方面,不仅是相互联系的,而且是不可分割的”。,二、决策程序,西蒙将决策过程分为参谋活动,设计活动和选择活动。具体可分为以下几个步骤。,(一)分析问题,“把一个问题说得清清楚楚,已经解决了一半”。,1,、问题与决策问题,问题,是一切决策的开端,没有问题就无所渭决策。,而问题是主观与客观、理想与现实
展开阅读全文