资源描述
管理工程学院,管理统计学,*,1,管理统计学,授课老师:杜金玲,统计学,2,考核方式:,闭卷考试,+,平时成绩(,作业、考勤、课堂讨论等,),答疑问题:,礼拜四下午第,3,节,,地点,BG510,(暂定),邮箱:,sdlydjl,QQ,:,1287523556,3,统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。,H.G.Wells,统计名言,4,知识是我们已知的,也是我们未知的,基于已有知识之上,我们去发现未知的,因此,只是得到扩充,我们获得的知识越多,未知的知识就会更多,因而,知识的扩充永无止境,在终极的分析中,一切只是都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学,5,统计在管理决策中作用的流程图,管理问题的提出,现实问题,管理问题的确立,统计问题的提出,管理问题的解决,管理问题的答案,统计问题的答案,统计分析,新问题,问题的再次提出,6,第,1,章,绪论,1.1,统计及其应用领域,1.2,统计数据的类型,1.4,统计学的几个基本概念,9,案例,2,吸烟导致肺癌,抗生素治疗胃溃疡,锻炼有助于预防心脏病,我们怎么知道这些?因为科学家有统计数据证明。,10,案例,3,市场调查和分析人才依托自己的市场学知识,通过自己掌握的调查工具和手段,对所关注的行业进行调查,并对调查得到的数据进行分析得到对市场的预期和判断。,(2015),11,数据的意义,由试验或调查取得的数值称为数据。,数据可以系统地反映出客观事物和现象的属性和规律。,12,案例,4,股市上的股票涨涨跌跌,我们知道可以根据股票以前涨跌的数据进行判断,哪只股票好哪只股票坏,那只股票还会涨。但是面对股市中大量的数据我们应该怎么判断?,13,数据的疑问?,如何能从大量无序的数据中获取信息?,怎样才能让数据开口?,14,什么是统计学,?,(statistics),统计学是收集、分析、表述和解释数据的科学,(,不列颠百科全书,),统计是一门收集、分析、解释和提供数据的科学,(,韦伯斯特国际辞典第,3,版,),统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论,(Mario F.Triola,初级统计学,),15,什么是统计学,?(statistics),1.,收集数据:取得数据,2.,整理数据:图表展示,3.,分析数据:利用统计方法分析数据,4.,数据解释:结果的说明,5.,得到结论:从数据分析中得出客观结论,收集、整理、分析、解释数据并从数据中得出结论的科学。,16,1.1.2,统计学的研究对象,1.1,统计及其应用领域,17,统计学研究什么?,1.,物理学研究的是如热、光、电、运动规律那样的自然现象。,2.,化学家测定物质组成及化学元素之间的交互作用。,3.,生物学家研究植物和动物的生活。,4.,数学家则在给出的假定之下沉溺于他自己推演各种命题的游戏。,5.,这些学科中的每一门都有它自己的问题,而且有解决这些问题的各自的方法,各学科为此而成为一门单独的学科。,18,统计学研究什么?,统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。,按萨维奇,(L.J.Savage),的说法:,统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱。,19,统计学的研究对象,一般的说统计学的研究对象是客观事物的数量特征和数量关系。,20,统计学的性质,统计学是一门科学,统计学提供一套方法和技术,这些方法和技术不能用于固定模式,使用者在给定的情况下必须根据所掌握的专门知识选择使用的方法,而且,如果需要还要进行必要的修正。,统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的。,统计学是一种技术,如同工业生产过程中的质量控制程序一样,统计方法是为保证产品达到所希望的质量和保持其稳定性的的管理系统中建立起来的,统计方法也能用于控制、减少和考察不确定性。,统计学是一门艺术,作为归纳推理的统计方法不是没有争议的。不同的人对同一组数据的分析可能得到不同的结论。,一本印度小说,红色城堡,(The Red Fort),说:使用数字讲故事取决于统计学家的技巧和他们的经验。在这个意义下,统计学也是一门艺术。,21,1.1.3,为什么学统计学,1.1,统计及其应用领域,22,为什么学统计学,提高个人素质,统计学是一种思维方式,解决生活中的实际问题,统计无处不在,学科专业学习的基石,23,统计是一种思维方式,统计思维总有一天会像读与写一样成为一个有效率公民的必备能力,(H.G.Wells),在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学,(C.R.Rao),1-,24,利用“,360,”对互联网进行搜索,得到的结果是:包含“统计”这一词汇的网页高,100,000,001,项。,在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,,经济学,12,版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。,诺贝尔经济学奖得主,无处不在的统计,1-,25,美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。”(转引自,马夸德特谈统计学家的重要作用,,,统计教育,1994,年第,3,期)。,美国总统布什的年薪已经达到,40,万美元,在各国元首中名列首位,但根据美国,工作等级年鉴,一书的排名,总统一职并未进入最好工作之列。根据该书的统计,在美国,工作环境最好的工作是:统计学家。(转引自,2002,年,3,月,7,日,扬子晚报,),1-,26,1981,年,首届国际,红楼梦,研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为,从词汇上的统计论,红楼梦,作者的问题,的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对,红楼梦,后,40,回系高鹗所作这一流行看法提出异议,认为,120,回均系曹雪芹所作。,27,17871788,年,三位作者,Alexander Hamilton,,,John,Jay,和,James Madison,为了说服纽约人认可宪法,匿名,发表了著名的,85,篇论文。这些论文中的大多数作者已经,得到了识别,但是,其中的,12,篇论文的作者身份引起了,争议通过对不同单词的频数进行统计分析,得出的结论,是,,James Madison,最有可能是这,12,篇论文的作者。现,在,对于这些存在争议的论文,认为,James Madison,是,原创作者的说法占主导地位,而且几乎可以肯定这种说,法是正确。,28,用简单的描述统计量得到一个重要发现,费舍,(R,A,Fisher),在,1952,的一篇文章中举了一个例子,说明如,何由基本的描述统计量的知识引出一个重要的发现。,20,世纪早,期,哥本哈根卡尔堡实验室的施密特,(J.Schmidt),发现不同地区所,捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一,海湾内不同地点所捕获的同种鱼类,也发现这样的倾向。然而,,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速,尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,,计算发现了几乎一样的均值和标准偏差值。由此,施密特推断所,有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名,为“戴纳,(Dana)”,的科学考察船在一次远征中发现了这个场所。,29,挑战者号航天飞机失事预测,1986,年,1,月,28,日清晨,载有,7,名宇航员的挑战者号进入发射状,态。就在发射前,有冰片牢附在机壳上。几分钟后,正当电,视新闻报道它已进入轨道时,航天飞机在毁灭性的爆炸声中,化成碎片,机上的宇航员片骨未存。推动航天飞机进入太空,的两个固体燃料发动机是由,Thiokol,公司制造的。失事前一天,晚上,,Thiokol,公司的经理们和国家航空航天局就如期发射还,是推迟发射产生了争执。天气预报发射时的气温为,310F,。争,执的结果采纳了,Thiokol,公司经理们的建议:按计划发射航天,飞机。因为他们觉得没有确凿证据表明低温会对固体燃料火,箭推进器的性能产生影响。,30,挑战者号航天飞机失事预测,在此次失事前,该航天飞机,24,次发射成功。将航天飞机送入,太空的两个固体燃料推进器由,6,只,O,型项圈密封。在几次飞行,中,曾发生过,O,型项圈被腐蚀或气体泄漏事故。这样的事故是,及其危险的。前,24,次发射中有一次发动机遭到了永久性破,坏。根据,23,次飞行中发生腐蚀或泄漏事故的次数,(,因变量,),及火,箭连接处的温度,(,自变量,),数据,进行线性回归得到的回归方程,为:,当温度为,310F,时,,O,型项圈发生事故的预计次数为,2.225,次。,结果显示连接处的温度与,O,型项圈事故之间有一定的相关性。,如果当时那些经理们看到了回归的预测结果,也许推迟发射,会成为其谨慎的选择。,31,统计的无处不在 统计的应用领域,经济学,管理学,医学,工程学,社会学,统计学,32,统计的应用领域,actuarial work,(,精算,),agriculture,(,农业,),animal science,(,动物学,),anthropology,(,人类学,),archaeology,(,考古学,),auditing,(,审计学,),crystallography,(,晶体学,),demography,(,人口统计学,),dentistry,(,牙医学,),ecology,(,生态学,),econometrics,(,经济计量学,),education,(,教育学,),election forecasting and projection,(,选举预测和策划,),engineering,(,工程,),epidemiology,(,流行病学,),finance,(,金融,),fisheries research,(,水产渔业研究,),gambling,(,赌博,),genetics,(,遗传学,),geography,(,地理学,),geology,(,地质学,),historical research,(,历史研究,),human genetics,(,人类遗传学,),33,统计的应用领域,hydrology,(,水文学,),industry,(,工业,),linguistics,(,语言学,),literature,(,文学,),manpower planning,(,劳动力计划,),management science,(,管理科学,),marketing,(,市场营销学,),medical diagnosis,(,医学诊断,),meteorology,(,气象学,),military science,(,军事科学,),nuclear material safeguards,(,核材料安全管理,),ophthalmology,(,眼科学,),pharmaceutics,(,制药学,),physics,(,物理学,),political science,(,政治学,),psychology,(,心理学,),psychophysics,(,心理物理学,),quality control,(,质量控制,),religious studies,(,宗教研究,),sociology,(,社会学,),survey sampling,(,调查抽样,),taxonomy,(,分类学,),weather modification,(,气象改善,),34,统计学的发展过程,统计学的发展及学科分类,35,(一)政治算术学派,产生于,17,世纪英国。,其代表人物是威廉配第,著作,政治算术,。,主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,马克思评价威廉,.,配第为统计学的创始人。,36,产生于,17,世纪德国,代表人物海尔曼,.,康令,最早使用“统计学”这一术语,主要使用文字记述方法对国情国力进行研究,不进行数量对比分析,(二)国势学派,37,统计学发展的趋势图,政治算术学派,国势学派,社会统计学派,数理统计学派,国家论,vs,vs,38,(三)数理统计学派,针对数量对比分析方法进行研究。,创始人是比利时统计学家凯特勒,(Adolphe Quetelet,,,17961874,年,),。他所著的代表作,社会物理学,等将概率论和统计方法引入社会经济方面的研究。,数理统计学已经发展成为一门基础性的方法论科学。,39,1850,年,德国的统计学家克尼斯,(K.G.A.knies),发表了题为,独立科学的统计学,的论文,提出统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学,在德国、日本和前苏联,社会统计学派都曾有相当大的影响。,代表人物:恩格尔(恩格尔系数),(四)社会统计学派,40,统计学学科分类,统计学的发展及学科分类,41,统计学科分类,理论统计学,应用统计学,统计学,以概率论为基础,纯理论的对统计方法加以论证。,从所研究的领域出发,利用统计学工具解决问题,42,理论统计学与应用统计学的对照,理论统计学:,以方法为核心,统计方法论体系,随机变量的数量分析,应用统计学:,以问题为核心,统计指标体系,现象的质量分析,与数量分析,43,统计学学科体系,应用统计学,物理统计学,医药统计学,经济统计学,生物统计学,社会统计学,教育统计学,心理统计学,理论统计学,描述统计学,推断统计学,统计估计理论研究,假设检验理论研究,时间序列分析,随机过程理论分析,提供方法,开阔领域,44,1.2,统计数据的类型,统计数据的分类,按计量层次,分类的数据,顺序的数据,数值型数据,按时间状况,截,面,的,数,据,时序的数据,按收集方法,观察的数据,实,验的数据,45,统计数据的分类,(,按计量尺度分,),分类数据,(categorical data),只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类,顺序数据,(rank data),只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述,例如,产品分为一等品、二等品、三等品、次品等,数值型数据,(metric data),按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为,175cm,、,168cm,、,183cm,46,统计数据的分类,(,按收集方法分,),观测的数据,(observational data),通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据,实验的数据,(experimental data),在实验中控制实验对象而收集到的数据,比如,对一种新药疗效的实验,对一种新的农作物品种的实验等,自然科学领域的数据大多数都为实验数据,47,统计数据的分类,(,按时间状况分,),截面数据,(cross-sectional data),在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,比如,,2005,年我国各地区的国内生产总值数据,时间序列数据,(time series data),在不同时间上收集到的数据,描述现象随时间变化的情况,比如,,2000,年至,2005,年国内生产总值数据,48,1.3.1,统计学的几个基本概念,1.3,统计学的基本概念,49,造价,12,级某班统计学成绩单,姓名,班级,性别,成绩,黄,造价,121,女,86,张,造价,121,女,75,易,造价,121,男,64,欧阳,造价,121,男,88,钱,造价,121,男,86,张,造价,121,男,65,陈,造价,121,男,76,郝,造价,121,女,90,萧,造价,121,男,72,孔,造价,121,男,61,洪,造价,121,女,57,常,造价,121,男,91,老师想要了解,12,级同学,学习统计学的情况。看到,造价,12,级某班同学,成绩如右表,计算得该班同学,平均分为,81.5,分,不及格率为,15%,。,50,总体和样本,总体,(population),所研究的全部个体,(,数据,),的集合,其中的每一个个体也称为元素,分为有限总体和无限总体,有限总体的范围能够明确确定,且元素的数目是有限的,无限总体所包括的元素是无限的,不可数的,样本,(sample),从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量,(sample size),51,参数和统计量,参数,(parameter),描述总体特征的概括性数字度量,是,研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值,(,),、标准差,(,),、总体比例,(,),等,总体参数通常用希腊字母表示,统计量,(statistic),用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值,(,x,),、样本标准差,(,s,),、样本比例,(,p,),等,样本统计量通常用小写英文字母来表示,52,统计中的几个基本概念,平均数,标准差,比 例,参数,统计量,x,s,p,总体,样本,53,变 量,(variable),说明现象某种特征的概念,如商品销售额、受教育程度、产品的质量等级等,变量的具体表现称为变量值,即数据,变量可以分为,分类变量,(,categorical variable,),:说明事物类别的名称,顺序变量,(rank variable),:说明事物有序类别的名称,数值型变量,(metric variable),:说明事物数字特征的名称,离散变量:取有限个值,连续变量:可以取无穷多个值,54,变 量,(,其他分类,),随机变量和非随机变量,经验变量,(empirical variables),和理论变量,(theoretical variables),经验变量所描述的是我们周围可以观察到的事物,理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,,z,统计量、,t,统计量、,2,统计量、,F,统计量等,55,变量及其类型,变量,基本分类,其他分类,分类变量,顺序变量,数字变量,随机变量,非随机变量,经验变量,理论变量,56,1.3.2,统计学研究方法,1.3,统计学的几个基本概念,57,统计方法,统计方法,描述统计,推断统计,参数估计,假设检验,58,描述统计学,推断统计学,59,描述统计,(descriptive statistics),研究数据收集、处理、汇总、图表描述、概括与分析等统计方法,内容,搜集数据,整理数据,展示数据,描述性分析,目的,描述数据特征,找出数据的基本规律,0,25,50,Q,1,Q,2,Q,3,Q,4,¥,x,=30,s,2,=105,60,推断统计,(inferential statistics),研究如何利用样本数据来推断总体特征的统计方法,内容,参数,估计,假设检验,目的,对总体特征作出推断,样本,总体,什么是描述统计,?,岁末,踯躅街头,朔风陡起,一信从垃圾堆旁刮来。启之,乃情书也。起承转合,甚为“规范”,疑是公仆文秘之手笔,故录之。原信洋洋,,6000,余言,限于版面,忍痛割爱,删节处代之以省咯号。,亲爱的,D,:,我们的感情,在十六大和十七大以来一系列正确方针政策的指引下,在党组织的亲切关怀下,在领导的亲自过问下,在同志们的热心帮助下,一年来正沿着健康的道路蓬勃 发展。这主要表现在:,一、我们共同通信,121,封,平均每,3.01,天一封。其中,你给我的信,51,封,占,42.1%42.1%,;我,;给你的信,70,封,占,57.9%,。每封信平均,1502,个字,最长的达,5215,个字,最短的也有,642,个字,.,二、我们约会共,98,次,平均每,3.7,天一次。其中你主动约我,38,次,占,38.8%38.8%,;我主动约你,60,次,占,61.2%,。每次约会平均,3.8,小时,最长达,6.4,小时,最短也有,1.6,小时,.,三、我到你家看望你父母,38,次,平均每,9.6,天一次;你到我家看望我父母,36,次,平均每,10.1,天一次,.,61,以上充分证明,通过一年的交往我们已经形成了爱情的共识,我们爱情的主流是互相了解、互相关心、互相帮助,是平等互利的。但任何事物都是一分为二的,缺点的存在是不可能避免的,我们两人虽然都是积极的,但从以上的数据来看发展还不太平衡,积极性还存在一定的差距,这是我们前进中的缺点。我相信在新的一年里,我们一定能发扬成绩,克服缺点,再接再厉,携手前进,开创我们爱情的新局面,.,因此,我提出三点意见供你参考,:,一是要围绕一个“爱”字,.,二是要狠抓一个“亲”字,.,三是要落实一个“合”字,.,让我们弘扬团结拼搏坚忍不拔的精神,共同振兴我们的爱情,争取我们的爱情达到一个新高度,登上一个新台阶。本着“我们的婚事我们办,办好婚事为我们”的精神辉煌。,你的小,w,62,推断统计学,亲爱的,W,:我们的感情,在十七大强调民意调查的正确方针政策的指引下,在红娘咨询公司的亲切关怀下,在人民大学统计学院专业可靠分析下,在社区居委会的热心评价帮助下,我们重新整理了数据,对我们的爱情历程做出如下可靠性推理结果:我们共通信,121,封,但经调查抽样,400,对情侣发现,喜结良缘者恋爱期间共同通信平均,930,封,,95%,置信区间(,620,,,1240,)封,与之相比,不能不感叹我们还有努力的空间;其中,你给我的信,51,封,占,42.1%,;我给你的信,70,封,占,57.9%,。但我给你的信平均间隔,3,天,您给我的信平均间隔,1,天,经检验发现我对关系维系的持久性远胜于您。,64,您每封信平均,1502,个字,最长的达,5215,个字,最短的也有,642,个字,其中表达思念和寄托美好感情的词语占总篇幅百分比为,1/100,与相亲相爱词语篇幅比,10%,相比较,,p-,值为,0.0004,,与一刀两断表达忧虑和需在个人习惯脾气方面需整治修改意见的感情词语篇幅比,50%,相比,远胜于此,.,从内容来看,我们之间的不和谐因素远高于平均水平,比较接近一刀两断的分布水平。我们约会共,98,次,平均每,3.7,天一次。其中我主动约你,38,次,占,38.8%,,平均约会时间,5,分钟,因为你工作忙要马上离开;你主动约我,60,次,占,61.2%,,平均时间,10,分钟,因为要去加班,约会质量不高。我到你家看望你父母,38,次,平均每,9.6,天一次,综合评价得分远低于幸福美满小夫妻女方家庭意见得分;你到我家看望我父母,36,次,平均每,10.1,天一次,综合评价得分远低于能干持家小媳妇得分,1/4,分位数。,65,以上充分表明,通过一年的交往我们的爱情共识还基于表面,我们爱情的发展遇到一些阻力,我们在互相了解、互相关心、互相体谅方面与白头偕老的指标体系相比,还有很大差距。从以上的数据发现我们距离建立稳固和谐的家庭还有较大差距,如果要继续开创我们爱情的新局面,要下大工夫,在内在涵养和父母支持方面应形成战略性规划和长远打算。因此,我提出三点意见供你参考,:,一是要围绕一个“恩”,.,二是要狠抓一个“省”字,.,三是要落实一个“谅”字,.,让我们弘扬团结拼搏坚忍不拔的精神,增强内在修养,克服爱情前方的种种困境,共同重建我们的爱情,夺取爱情的真谛,彼此珍惜彼此感动无怨无悔地接受对方。,66,67,不同统计研究阶段中用到的方法,收集数据,整理数据,分析数据,结论及应用,描述统计,推断统计,实验设计,大量观察,描述统计,68,实验设计,定义:是设计一个合理的试验程序,在这个程序中对所研究现象的影响因素的部分或全部进行控制,然后观察所研究现象的数量变化。,使用阶段:数据收集,适用范围:自然科学研究,工程技术领域的统计数据搜集,市场研究。,例子:药物试验,可口可乐,pk,百事可乐,69,大量观察,定义:指对所研究的现象的全部或足够多的数量进行观察的方法。,使用阶段:数据收集,适用范围:无法进行重复实验,例子:普查,市场需求研究,春晚满意度电话调查,70,统计描述,定义:指对通过实验或调查所搜集的数据进行整理计算,得到能够反映总体或样本数量特征的数量指标或统计图表。,使用阶段:整理及分析数据,适用范围:全部,例子:股市指数,学生的平均成绩,市场的需求分布等。,针对统计描述的研究,形成了描述统计学。,71,统计推断,定义:在样本数据进行描述的基础上,对统计总体的未知数量特征或位置的总体分布形式作出具有一定把握程度推断的统计方法。,使用阶段:分析数据,适用范围:抽样调查,例子:市场研究,针对统计推断的研究,形成了推断统计学。,72,本章小节,统计学的含义,统计数据的类型,统计学的基本概念,
展开阅读全文