收藏 分销(赏)

应用统计学ppt医学课件.ppt

上传人:精*** 文档编号:12866306 上传时间:2025-12-19 格式:PPT 页数:44 大小:1.23MB 下载积分:10 金币
下载 相关 举报
应用统计学ppt医学课件.ppt_第1页
第1页 / 共44页
应用统计学ppt医学课件.ppt_第2页
第2页 / 共44页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,应用统计学,Applied Statistics,1-,*,*,yyyy-M-,应用,统计,应,用,统,计,学,Applied Statistics,yyyy-M-,统计思维总有一天会像读与写一样,成为一个有效率公民的必备能力。,H.G.Wells,统计名言,yyyy-M-,你相信下面的统计结果吗?,吸烟对健康是有害的,不结婚的男性会早逝,10,年,身材高的父亲,其子女的身高也较高,第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推,两天服一片阿司匹林会减少心脏病第二次发作的机会,身体超重,30%,会使寿命减少,1300,天,每天摄取,500,毫升维生素,C,,生命可延长,6,年,怕老婆的丈夫得心脏病的机会较大,学生们在听了莫扎特钢琴曲,10,分钟后的推理测试会比他们听,10,分钟娱乐磁带或其他曲目做得更好,上课坐在前面的学生平均考试分数比坐在后面的学生高,第,1,章 统计能为你做些什么?,1.1,统计无处不在,1.2,统计研究什么?,1.3,统计能做什么和不能做什么?,1.4,怎样获得数据?,Statistics,1.1,统计无处不在,第,1,章 统计能为你做些什么?,yyyy-M-,不同原因引起的,寿命损失,原因,天数,原因,天数,未结婚,(,男性,),3500,饮酒,130,惯用左手,3285,枪炮事故,11,未结婚,(,女性,),1600,自然放射线,8,30%,超重,1300,医疗,X,-,射线,6,20%,超重,900,咖啡,6,吸香烟,(,男性,),2250,口服避孕药,5,吸香烟,(,女性,),800,减肥饮料,2,抽雪茄,300,家里有烟雾报警,-10,用烟斗抽烟丝,220,带有气囊的轿车,-50,危险工作,事故,300,移动冠状动脉监护器,-125,一般工作,事故,74,注:负数表示寿命增加,yyyy-M-,理解统计对大众的必要性,在外出旅游时,需要关心一段时间内的详细天气预报,在投资股票时,需要了解股票市场价格的信息,了解某只特定股票的有关财务信息,如果你关心足球世界杯,在有关媒体上,你可以看到详细的报道,如果你关心宏观经济形式,在有关媒体上你可以得到有关报道,yyyy-M-,理解统计对,管理者,更重要,一个统计办公室的主管也是一个行政事务官,一次与一些统计学者开会,统计学者抱怨从其他部门收到的一些估计值没有给出标准误差,(,估计时的误差大小,表示估计的精度,),,这个主管马上问道:“对误差也有标准吗?”,一个统计顾问提交给茶叶委员会的报告中,含有标题为“饮茶人数的估计值,(,含标准误差,)”,的附表。不久,一封信被送到这个统计学者手中,问道什么是人们喝红茶时的“标准误差”,yyyy-M-,理解统计对管理者更重要,皇家委员会审查一份统计报告,报告中提到中产阶级家庭平均有,2.2,个子女,委员会评述说:“每一个成人女性有,2.2,个子女的数字是荒谬的。这是为要求对中产阶级提供财政援助以便通过四舍五入把平均值提高到一个更合适的整数,健康大臣对一个统计学者的报告中提到的去年由于某种疾病,平均,1000,中死亡人数为,3.2,这个数字发生了兴趣。他问他的私人秘书,,3.2,个人是如何死法?他的秘书说:“先生,当一个统计学家说死了,3.2,个人时,意味着,3,个人已经死了,两个人正要死”,yyyy-M-,假定你是市场部的新任经理,一次广告活动的统计结果摆到了你面前,声称某个结果是“统计显著”的。你如何解释这份报告而又是暴露你对该术语的无知?,赶快学点统计,这对你和你的事业都非常有用。,Gudmund R.Iversen,避免尴尬,yyyy-M-,让你说出哪些领域不使用统计,这很困难,因为几乎找不到一个不用统计的领域;让你说出哪些领域应用统计,同样也很困难,因为几乎所有的领域都应用统计,出一个统计没有用途的领域名称比举出一个统计作为其组成部分的领域名称要困难得多,(Robert Johnson),几乎所有的领域都要用统计,yyyy-M-,统计应用,用统计识别作者,用统计识别作者,:,17871788,年,三位作者,Alexander Hamilton,,,John Jay,和,James Madison,为了说服纽约人认可宪法,匿名发表了著名的,85,篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的,12,篇论文的作者身份引起了争议,通过对不同单词的频数进行统计分析,得出的结论是,,James Madison,最有可能是这,12,篇论文的作者。现在,对于这些存在争议的论文,认为,James Madison,是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确,yyyy-M-,统计应用,质量管理中的,6,统计在许多领域都有应用,:,在统计中,,表示一个总体的标准差,它说的是数据之间的差异程度。比如,在企业生产的产品中,同一种产品也没有两个是完全一样的,因为在生产过程中,由于各种因素的影响而使产品质量产生波动。在服务领域就更是如此。产品或服务的这种差异称为质量的波动性,也正是由于波动性的存在才需要进行质量管理,6,是质量管理中使用的一个术语,它的含义是指偏离正态分布的中心,6,个标准差。就产品生产或服务而言,它表示在生产或服务过程中缺陷率不超过百万分之,3.4,,通俗地说,如果生产,100,万个产品或进行,100,万次服务,产品的不合格率或服务达不到要求的比率平均来说不超过,3.4,个或,3.4,次。这样的不合格率非常低以致于可以忽略不计,yyyy-M-,统计应用,质量管理中的,6,6,质量管理已成为最新的质量管理理念,近年来,它已成为一些著名国际大企业的质量管理方法,并在这样的管理理念下使企业受益匪浅。例如,实行了,6,质量标准,使摩托罗拉公司在,3,年中节省的资金超过,9.4,亿美元。实行,6,管理的大公司还有美国通用电器公司,(,简称,GE),、宝利来,(Polaroid)h,和德州仪器,(Texas Instruments),等,GE,的前,CEO,杰克,.,韦尔奇,1999,年,4,月曾说过这样一段话:“,6,培训计划是,GE,下一个世纪领导层得以产生繁衍的园地,,6,是我们曾经尝试过的最重要的管理培训方法,它胜过到哈佛工商学院就读,也胜过到克顿维尔,(,注:克顿维尔是,GE,公司内部的质量培训部,),进修,它教会你一种完全与众不同的思维方式。”在推广,6,质量管理策略不到,10,年的时间内,通用电器公司总市值从世界排名第十位跃升到第二位,yyyy-M-,统计应用,用简单的描述量得到一个重要发现,费舍,(R,A,Fisher),在,1952,的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现,20,世纪早期,哥本哈根卡尔堡实验室的施密特,(J.Schmidt),发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向。然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值,施密特推由此断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名为,“戴纳,(Dana)”,的科学考察船在一次远征中发现了这个场所,yyyy-M-,统计的应用领域,actuarial work,(,精算,),agriculture,(,农业,),animal science,(,动物学,),anthropology,(,人类学,),archaeology,(,考古学,),auditing,(,审计学,),crystallography,(,晶体学,),demography,(,人口统计学,),dentistry,(,牙医学,),ecology,(,生态学,),econometrics,(,经济计量学,),education,(,教育学,),election forecasting and projection,(,选举预测和策划,),engineering,(,工程,),epidemiology,(,流行病学,),finance,(,金融,),fisheries research,(,水产渔业研究,),gambling,(,赌博,),genetics,(,遗传学,),geography,(,地理学,),geology,(,地质学,),historical research,(,历史研究,),human genetics,(,人类遗传学,),yyyy-M-,统计的应用领域,hydrology,(,水文学,),industry,(,工业,),linguistics,(,语言学,),literature,(,文学,),manpower planning,(,劳动力计划,),management science,(,管理科学,),marketing,(,市场营销学,),medical diagnosis,(,医学诊断,),meteorology,(,气象学,),military science,(,军事科学,),nuclear material safeguards,(,核材料安全管理,),ophthalmology,(,眼科学,),pharmaceutics,(,制药学,),physics,(,物理学,),political science,(,政治学,),psychology,(,心理学,),psychophysics,(,心理物理学,),quality control,(,质量控制,),religious studies,(,宗教研究,),sociology,(,社会学,),survey sampling,(,调查抽样,),taxonomy,(,分类学,),weather modification,(,气象改善,),1.2,统计研究什么?,第,1,章 统计能为你做些什么?,yyyy-M-,统计学是一门独立的科学吗?,物理学研究的是像热、光、电等这类自然现象的运动规律,化学家测定物质的组成及化学元素之间的交互作用,生物学家研究植物和动物的生活,数学家则在给出的假定之下推演各种命题,这些学科中的每一门都有它自己的问题,而且有解决这些问题的各自的方法,各学科因此而成为一门单独的学科,yyyy-M-,统计学有自己的研究对象吗?,统计学,(statistics),没有任何固定的对象,是一门独特的学问,统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。按萨维奇,(L.J.Savage),的说法:,统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱,yyyy-M-,什么是统计学,?,(statistics),统计学研究的是数据,提供的是一套通用于所有学科领域的获取数据、分析数据并从数据中得出结论的原则和方法,Statistics,yyyy-M-,统计学是什么?,统计学是一门科学,它提供一套方法和技术,使用者在给定的情况下必须根据所掌握的专门知识选择使用的方法,如果需要还要进行必要的修正,统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的,统计学是一种技术,如同工业生产过程中的质量控制程序一样,统计方法是为保证产品达到所希望的质量和保持其稳定性的的管理系统中建立起来的,统计方法也能用于控制、减少和考察不确定性,统计学是一门艺术,提供一种归纳推理的方法,推理就是一种艺术。既然是归纳推理,就不能保证结论百分之百正确,就不能没有争议,怎样让别人看懂并理解统计结论,要看统计表达这些结论的技巧和艺术,yyyy-M-,统计方法,统计方法,描述统计,推断统计,参数估计,假设检验,yyyy-M-,0,25,50,Q,1,Q,2,Q,3,Q,4,¥,x,=30,s,2,=105,描述统计,(descriptive statistics),研究数据收集、整理和描述的统计学分支,内容,搜集数据,整理数据,展示数据,描述性分析,目的,描述数据特征,找出数据的基本规律,yyyy-M-,推断统计,(inferential statistics),研究如何利用样本数据来推断总体特征的统计学分支,内容,参数,估计,假设检验,目的,对总体特征作出推断,样本,总体,1.3,统计能做什么和不能做什么?,第,1,章 统计能为你做些什么?,yyyy-M-,统计帮助你分析数据,大量数据如果不去分析它,那也仅仅是一堆数据而已,没有什么用处。因为有用的信息恰恰藏在数据的里面,统计可以在多个方面帮助你分析数据,利用统计简化繁杂的数据,用图表重新展示数据,进行比较分析,建立数据模型进行预测,yyyy-M-,统计不能解决你的所有问题,统计仅仅是一种数据分析的方法,与数学一样统计是一种工具,是数据分析的工具,统计结论需要你的专业知识去解释,统计在自然科学和管理科学中的作用不同,管理人员所需要的,统计未必能提供,Tools,yyyy-M-,统计的误用与滥用,大约在一个世纪以前,政治家,Benjamin Disraeli,曾有一个著名的论断:,“有三类谎言:谎言、糟透的谎言和统计”,。他还说:,“图并没有说谎,是说谎者在画图”,历史学家,Andrew Lang,说,一些人使用统计,“就像喝醉酒的人使用街灯柱,支撑的功能多于照明”,统计滥用,不好的样本,过小的样本,误导性图表,局部描述,故意曲解,False,yyyy-M-,统计应用的两个极端,不懂或不太懂统计的人认为统计没什么用,他们因为不懂统计而瞧不起统计,他们不用或几乎不用统计方法分析数据,即使做些统计分析,也往往是表面上的,把简单问题复杂化,特别是在管理领域,把本来可以用简单方法解决的问题故意复杂化,为证明管理的科学性,建立一个别人看不懂的模型,编一大堆程序,输出了一大堆数字和符号,得出用统计语言陈述的结论,提出一些似是而非的建议,1.4,怎样获得统计数据?,第,1,章 统计能为你做些什么?,yyyy-M-,变量与数据,(variable&data),从一次观察到下一次观察会出现不同结果,“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”,观察变量得到的结果即数据,变量可以分为,数值变量,(metric variable,),:,可以用阿拉伯数据来记录其观察结果,分类变量,(,categorical variable,),:,观察结果表现为不同的类别,顺序变量,(rank variable,),:,有序类别,yyyy-M-,你不必吃完整头牛,才知道它的肉,是咬不动的。,(,You dont have to eat the whole ox to know,that it is tough,.),Samel Johnson,yyyy-M-,怎样获得一个样本?,(,概率抽样方法,),简单随机抽样,(simple random sampling),从含有个元素的总体中,抽取个元素组成样本,使得总体中的每一个元素都有相同的机会,(,概率,),被抽中,如果抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选,叫做重复抽样,(sampling with replacement,如果抽中的个体不再放回,再从所剩下的个体中抽取第二个元素,直到抽取个个体为止,这样的抽样方法叫做不重复抽样,(sampling without replacement),简单随机抽样得到的样本称为简单随机样本,(simple random sample),yyyy-M-,怎样获得一个样本?,(,概率抽样方法,),分层抽样,(stratified sampling),在抽样之前先将总体的元素划分为若干层,(,类,),,然后从各个层中抽取一定数量的元素组成一个样本,系统抽样,(systematic sampling),先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取个元素组成一个样本,整群抽样,(cluster sampling),先将总体划分成若干群,然后在以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,yyyy-M-,简单随机抽样,(,用,Excel,对分类数据随机抽样,),【,例,】,某班级共有,30,名学生,他们的名单如右表。用,Excel,抽出一个由,5,个学生构成的随机样本,yyyy-M-,简单随机抽样,(,用,Excel,产生一个简单随机样本,),第,1,步:,将,30,个学生的名单录入到,Excel,工作表中的一列,第,2,步:,给每个学生一个,数字代码,,分别为,1,,,2,,,30,,并按顺序排列,将代码录入到,Excel,工作表中,的一列,与学生名单相对应,(,数值型数据直接抽取,),第,3,步:,选择,【,工具,】,下拉菜单,并选择,【,数据分析,】,选项,,然后在,【,数据分析,】,选项中选择,【,抽样,】,第,4,步:,在,【,抽样,】,对话框中的,【,输入区域,】,中输入学生代码,区域,在,【,抽样方法,】,中单击,【,随机,】,。在,【,样本,数,】,中输入需要抽样的学生个数。在,【,输出区域,】,中,选择抽样结果放置的区域。,【,确定,】,后即得到要抽取,的样本,用,Excel,对分类数据抽样,yyyy-M-,简单随机抽样,(,用,Excel,生成随机数,),生成位于两个指定数之间的一个随机数,(,RANDBETWEEN,函数,),第,1,步:,在,Excel,表格界面中,直接点击,【,f,(,x,),】,命令,第,2,步:,在复选框“函数分类”中点击,【,全部,】,选项,并在“函数,名”中点击,【,RANDBETWEEN,】,选项,然后,【,确定,】,第,3,步:,在,【,Bottom,】,输入要返回的最小整数,(,本例为,100),在,【,Top,】,输入要返回的最大整数,(,本例为,1),单击,【,确定,】,即可得到一个随机数,(,要得到多个随机数,向下复制即可,),用,Excel,生成,1,100,之间的,20,个随机数,yyyy-M-,简单随机抽样,(,用,Excel,生成随机数,),生成位于,0,1,之间的均匀分布随机数,(RAND,函数,),第,1,步:,在,Excel,表格界面中,直接点击,【,f,(,x,),】,命令,第,2,步:,在“函数分类”中点击,【,全部,】,选项,并在“函数名”中点击,【,RAND,】,选项,然后,【,确定,】,,单击,【,确定,】,即可得到一,个随机数,(,要得到多个随机数向下复制即可,),若要生成,a,与,b,之间的随机实数,请使用,RAND()*(b-a)+a,若要对结果四舍五入为整数,请使用,ROUND(RAND()*(b-a)+a,0),如果要使用函数,RAND,生成一随机数,并且使之不随单元格计算而改变,可以在编辑栏中输入“,=RAND()”,,保持编辑状态,然后按,F9,,将公式永久性地改为随机数,用,Excel,生成,1,100,之间的,20,个随机数,yyyy-M-,几个统计概念,总体,(population),所研究的全部个体,(,数据,),的集合,其中的每一个个体也称为元素,分为有限总体和无限总体,有限总体的范围能够明确确定,且元素的数目是有限的,无限总体所包括的元素是无限的,不可数的,样本,(sample),从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量,(sample size),yyyy-M-,几个统计概念,参数,(parameter),描述总体特征的概括性数字度量,是,研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值,(,),、标准差,(,),、总体比例,(,),等,总体参数通常用希腊字母表示,统计量,(statistic),用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值,(,x,),、样本标准差,(,s,),、样本比例,(,p,),等,样本统计量通常用小写英文字母来表示,yyyy-M-,几种常用的统计软件,(Software),典型的统计软件,SAS,SPSS,MINITAB,STATISTICA,Excel,MINITAB,STATISTICA,Excel,SAS,SPSS,yyyy-M-,本章小节,正确认识统计,统计研究数据,提供通用方法,统计为你所用,但不能滥用,抽取样本获得数据,几个基本概念,结 束,THANKS,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服