收藏 分销(赏)

现代统计学.ppt

上传人:精**** 文档编号:12264115 上传时间:2025-09-29 格式:PPT 页数:162 大小:791KB 下载积分:25 金币
下载 相关 举报
现代统计学.ppt_第1页
第1页 / 共162页
现代统计学.ppt_第2页
第2页 / 共162页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,“,按照现代理论,自然规律的基础不是因果性,相反,本质上具有,统计性质。,人们断言,一切自然规律在原则上都是统计性的,只是我们观察操作不完善,我们才受骗去信仰严格的因果性。”,-Albert Einstein,(1879-1955),1928 年,第一卷 P239 商务出版社,为何要学统计,统计学的作用,1.现代,统计学,概论,(1),统计学发展背景,当今信息时代,无论社会政治、军事经济,还是生物医学、教育心理、工农业生产等各行各业都有大量的数据,需要我们进行分析,从中挖掘出有用的证据、消除虚假的信息,发现事物内部的规律性。,数据,信息,面对现实中复杂的问题怎样处理?,“,当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有,统计工具,可为其开辟一条前进的通道”。,-,英国著名遗传学家Galton(1822-1911),2000,年,法国政府已将统计学列入二十一世纪影响法国社会发展的十个重大领域之一。,2001,年,中国国家教育部为推进基础教育改革而推出新课程标准,将统计学纳入新的小学数学课程。要求小学生要“,经历运用数据描述信息、作出推理的过程,发展统计观念,”。,(2)什么是统计?,统计学的英语单词是,statistics,,来源于,state,即指政府,官方所要求的信息。,Webster,国际大辞典中定义,统计学是:,“,a science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”,。,统计学是一门关于收集、分析、解释和表达数据的科学,。,统计学的哲学命题,每个人能到世界上的概率为,“0”,哲学的观点:生命是无,佛学说:人生空的,每个人死亡的概率为“1”,对每个来到世界上人来说,生命是100%,生命只有一次,我们每个人要珍爱生命,科学、哲学、宗教的关系,宗教,哲学,科学,科学的上面是哲学,哲学的上面是宗教.,-,Albert Einstein,(1879-1955),“哲学是全部科学之母.”,-Albert Einstein,1950 年,第一卷 P518 商务出版社,爱因斯坦对医生有深挚的尊敬感,并发表了对医学太专业化的看法:,学习知识的专与博的问题,哲学是什么?,“如果一个人的某一部分出了毛病,那么,只有很好地了解整个复杂机体的人,才能医好它;在更复杂的情况下,只有这样的人才能正确地理解病因.”,宗教分为 恐惧宗教,道德宗教,宇宙宗教,“你很难在造诣较深的科学家中找到一个没有自己的,宗教,感情的人.”,-Albert Einstein,(1879-1955),1930年和,第一卷 P283 商务出版社,宗教是什么?,现代统计学的新观念,统计学是对不确定性问题做决策的科学,。,报刊统计信息文摘,2003年,北京市人平寿命77.93岁,婴儿死亡率为5.56,儿童计划免疫接种率98%.,这些主要健康指标已接近或超过中等发达国家的水平.,北京日报.京报网,2003年11月20,在现实生活中,经常会遇到各种不确定性的问题,人们常常凭直觉和经验来处理问题。,直觉,经验,对于人们的审美生活、观察研究很重要,。,(3),直觉,经验与统计,直觉与统计,1.一家有两个小孩,问:已知一个是女孩,另一个也女孩的可能性多大?,A)1/2 B)1/3 C)1/4 D 1/5,直觉与统计,2.一个班有50同学,问至少有两个同学生日相同的可能性多大?,A)5%B)50%C)90%D)97%,直觉与统计,3.某地肝癌发病率为千分之四,已知肝癌病人用甲胎蛋白法检验呈阳性为95%,非肝癌病人用甲胎蛋白法检验呈阴性为90%。,A)0.38%B)3.8%C)90%D 95%,现进行普查,在普查出用甲胎蛋白法检验呈阳性的人中,问真的患有肝癌病人的可能性是多大?,直觉虽重要,但有时直觉会产生错觉。,主观的,直觉 经验,客观的,规律,进行科学研究活动时,需要直觉来发现问题,产生灵感,但必须采用科学的方法进行实验,经过严格的验证后,才能得出事物内在的客观规律。,现代社会中,统计学的知识已渗透到自然科学、社会科学以及人类生活的各个领域。,大到国家重大政策的制定(如国民生产总值GDP增长率,产业发展计划等),小到人们的日常生活(如天气预报等)几乎都离不开统计学提供的信息。,(4),统计学的应用,统计学的理论是随着人类社会生产的需要而产生,同时也随着人类社会生产的发展而更新。特别是近二十年来,统计学的理论方法和应用方面得到迅速的发展。,统计学与各个专业结合形成数十个学科分支,如遗传统计学、人口统计学、心理统计学、社会统计学、经济统计学、卫生统计学、医学统计学、,生物统计学,等。,统计学两个方面的作用,一.是培养统计思维方法,二.学以至用,解决实际问题,统计学应用的普适性,自由落体运动规律:,公式:h=1/2 g*t,2,重力加速度常数 g=9.80665米/秒,2,公式是怎样产生的?,h,典型统计案例1,牛顿的自由落体运动,牛顿的自由落体运动实验,多次重复实验,测量计录每,次下落的高度与时间数据:,采用什么方法找规律呢?,运用了统计学思想,回归分析,直线回归方程:,y=a+,b,*x,h,1/2 g,t,h,牛顿发现定律方法的探究,时间,t,高度,h,1,4.9,2,39.1,3,88.3,.,h,。,。,。,。,。,。,。,。,。,0 1 2 3 4 t,散 点 图,牛顿的自由落体定律的产生,回归方程的构造:,回归方程:y=a+,b,*x,h 0,1/2 g,t,2,h,自由落体定律的探究,影响定律公式的因素:,灵感,测量误差,模型的选择,美国国立卫生研究院(National Institutes of Health,NIH,)的基金申请明确要求基金合作者中有统计学家,并且在所立项中有统计学方面的思考。,美国国家药品食品管理局(Food and Drug Administration,FDA,)要求新药的研发试验中,必须有统计学家来指导研究的设计、数据的分析、报告的呈递等。,一些著名医科大学和医院中,要求硕士和博士毕业论文的开题报告有统计方面的思考和统计学家参加,毕业论文答辩前要求请统计学家进行审阅。,据调查,新英格兰医学杂志(New England J.Medical)、英国医学杂志(BritishJ.Medical)、美国医学杂志(JAMA)和Lancett等著名医学杂志发表的文章中,有70%应用了统计学。,医学工作者在从事科研工作时经常要进行统计咨询和统计分析工作,。,统计的工作量和资金的投入占总科研,的比例为,20%至30%。,“统计学是现代医学大厦的一个重要支柱”。,-美国医学会杂志(,JAMA),主编,(5),医学及其它专业与,统计学,历史上很多非统计专业人员,通过对统计学的学习和研究,在专业和统计学取得有很深的造诣。,物理学家,爱因斯坦,学习和研究统计,将统计学思想应用于他的物理学和哲学研究中。,生物学家,达尔文,学习和研究统计,进化论方面的工作在本质而言是属于生物统计学。,英国,F.Nightingale,(,1820-1910,)以护理学的奠基人闻名于世的,她通过分析医院病情记录说明护理工作的重要性(伤员死亡率由,60,下降至,3,)。,Nightingale,还是现代医院统计制度的创立者,她于,1862,年出版了出版世界上第一部医院统计的专著医院统计与医院规划。,(6)科研与临床医学的关系,科研工作有利于将当今最先进的科技成果应用于临床实践。,科研工作有利于获得新的临床检测技术和治疗方案;,(7),统计案例选讲,典型统计案例2,吸烟与健康关系的研究,现在全民健康教育中宣传大量吸烟、过量饮酒会影响健康,而运动、积极乐观的心情会有利于健康。,但确实有情况相反的个例。如邻居甲每天既大量吸烟又过量饮酒,活到90岁仍身体健壮,但邻居乙既不吸烟又不饮酒,40岁就死于肺癌。,怎样使人信服全民健康教育的宣传呢?,要使人信服全民健康教育的宣传,就必须提供统计学的研究结果。,即显示吸烟人群的死亡率(或发病率)与不吸烟、不饮酒人群的对比结果。,吸烟和冠状血管疾病再通术间的关系,二十世纪九十年代,美国Aerobics中心的追踪研究,他们追踪了5437例冠状血管疾病并接受再通手术(,用线和球打开阻塞的冠状血管),的病人,将病人分为不吸烟、以前吸烟(至少在手术前6个月戒掉)、刚戒烟(因手术后刚戒掉)、及持续吸烟4个组,分析他们的死亡情况.结果见下表1.1.,表1.1 吸烟状况和死亡危险性的单因素分析,组别 RR (95%CI),不吸烟 1.0 (参照组),以前吸烟 1.08 (0.92-1.26),刚戒烟 0.56 (0.40-0.77)*,持续吸烟 0.74 (0.59-0.94)*,引自:D.,et al.“Effect of smoking status on the long-term outcome after successful percutaneous coronary revascularization.”,N.Engl.J.Med.,1997;,336:755-761.,持续吸烟组的死亡相对危险度RR怎么比不吸烟组低呢?(烟草公司希望),在你假定在此研究中可能有差错之前,一些其它研究发现在冠状动脉疾病血栓溶解治疗中,吸烟和预后具有同样的关系,这一作用被称为“吸烟者悖论”.,引自:Barbash,G.L.,Reiner,J.,White,H.D.,Et al.“Evaluation of paradoxical beneficial effects of smoking in patients receiving thrombolytic therapy for acute myocardial infarction:Mechanisms of the smokers paradox from the GUSTO-I trial,with angiographic insights.”,J.Am.Coll.Cardiol.,1995;26:1222-1229.,是什么原因导致这一“悖论”呢?,通过对数据的分析,发现如下表1.2的人口学及临床因素与吸烟状况的关系,表1.2 人口学及临床因素与吸烟状况的关系,不吸烟 以前吸烟 刚戒烟 持续吸烟,年龄SD,(年)6711 6510 5610 5511,心绞痛病程,(月)4166 5172 2146 2955,糖尿病,%21 18 8 10,高血压,%54 48 38 39,冠状动脉疾病,%,一枝血管 50 51 57 55,二枝血管 36 36 34 36,三枝血管 14 13 10 9,表1.2可以看到,相比于吸烟者和以前吸烟者,刚戒烟者和持续吸烟者更年轻,心绞痛时间更短,较少有糖尿病和高血压,较少有严重的冠心病。,看到这些,你对刚戒烟者和持续吸烟者的死亡率低于不吸烟者和以前吸烟者就不会奇怪了。因为他们比不吸烟者和以前吸烟者年轻,而且很少有医学隐患。,如何解决问题?,解决问题的方法是对年龄,心绞痛,糖尿病,高血压和冠心病这些混杂因素进行控制,。,1.3 吸烟状况和死亡危险性的多元分析,组别 RR (95%CI),不吸烟 1.0 (参照组),以前吸烟 1.34*(1.14-1.57),刚戒烟 1.21 (0.87-1.70),持续吸烟 1.76*(1.37-2.26),引自:D.,et al.“Effect of smoking status on the long-term outcome after successful percutaneous coronary revascularization.”,N.Engl.J.Med.,1997;,336:755-761.,在多元统计分析中,研究者校正了4组中存在的如年龄、心绞痛时间等差别。通过对这4组基线差别的统计学校正,刚戒烟者和持续吸烟者的死亡危险显著高于不吸烟者。,表1.4 将一元分析死亡危险性(未校正)和多元统计分析死亡危险性相比。,表1.4 比较,一元统计,与,多元统计,吸烟状况与死亡危险性的关系,不吸烟 以前吸烟 刚戒烟 持续吸烟,一元统计的,危险相对度 1.0 1.08 0.56 0.74,9 5%CI (参照组)(0.92-1.26)(0.40-0.77)(0.59-0.94),多元统计的,相对危险度 1.0 1.34 1.21 1.76,9 5%CI (参照组)(1.14-1.57)(0.87-1.70)(1.37-2.26),案例分析的启示,1.一元统计和多元分析的差别表明混杂因素是存在的。,2.正确选择数据分析方法对研究结果非常重要!,3.现代多元统计分析的重要性!,统计学是“对令人困惑费解的问题做出数字设想的艺术。”,-David Freedman,统计学绝非数字游戏!,生命在于运动。,运动有利于长寿,流水不腐。,这是人类长期经验的总结,但事实果真如此吗?是科学的结论,还是事物的假象呢?,典型统计案例3,运动与寿命关系的研究,许多研究表明长期运动人的寿命比久坐型生活方式人的寿命长。,但是,如果运动者寿命长的真正原因是他不吸烟,没有家族病史,良好的生活环境和卫生条件等,那么运动将不能改变一个人的寿命。,运动与人寿命的关系,美国Aerobics中心的追踪研究,在19701989年间,它们追踪观察25,341男性和7084女性,研究运动和死亡率的关系。男性参加者被追踪观察平均8.4年,女性平均7.5年。所有参加者接受了基线检查,这些检查包括体检、实验室检测及踏车试验评价身体适宜运动量。结果如表1.5。,引自:,Blair,S.N.,Kampert,J.B.,Kohl,H.W.,et al.”Influences of cardiorespiratory fitness and other precursors on cardiovascular disease and all-cause mortality in men and women.”,JAMA,1996;276:205-10,表1.5 Aerobics,中心追踪研究过程中生存与死亡者基线特征(男性组),指标 生存 死亡,(n=24,740)(n=601),年龄(SD)42.7(9.7)52.1(11.4)*,体重指数,26.0(3.6)26.3(3.5),收缩压 121.1(13.5)130.4(19.1)*,总胆固醇 213.1(40.6)228.9(45.4),*P0.05.,经过统计分析,认为两组差别无统计意义。,现在实事也不支持原研究者的,用康复病人血浆治疗非典病人,结论。,6“统计笑话”,一个乘客得到信息:“每一百万乘座飞机人中只有一个人会携带炸弹”。,于是他每次座飞机要携带一个炸弹。,被机场管理员发现后,他解释原因说:,一架飞机上有一个人携带炸弹的几率是 百万分之一,同时有两个人携带炸弹的几率是万亿分之一,所以不可能发生。”,(11)医学中的统计问题和错误,发现不少医务工作者曾多次学习统计学课程,但仍然对统计学知识理解很模糊。,有的学员统计知识学习成绩很好,但是遇到很简单的实际问题也不会解决。,现在广泛地存在误用统计学现象。,1 统计学的误用问题,中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种。,据统计:,中华系列医学杂志发表的论文中有统计问题和错误的达到7,0,。,国际著名医学杂志有统计问题和错误也达50%。,-,(胡良平 主编 军事医科院出版2003年),国内对中华系列医学期刊的调查结果,凌瑞珠发现中华医学检验杂志发表论文中存在统计误用高达70%。,王倩 调查了1995年5种具有较高水平的中华系列杂志,发现发表的论文不能正确应用统计分析方法占54%。,程萍 评阅了19931995年中华内科杂志论著栏内发表的论文,发现存在统计学方法上的问题或错误占68%。,毛宗福等报告了5种中华核心期刊论著中统计推断应用缺陷率为62%。,国外对英文权威医学期刊调查结果,统计学误用率为50%的不在少数,有的甚至高达70%或100%。,Glantz调查了1977年Circulation Research和Circulation杂志中发表的文章,在考虑使用统计学方法的文章中,分别有61%和44%具有统计学错误。,Kanter等调查了1992年至1993年Transfusion杂志发表的文章,发现75%的文章至少存在一处统计问题和错误。,30年前,美国医学杂志(JAMA)一位编审曾说:“医学论文作者统计知识和统计水平低下”。,近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高。,(12)误用统计问题产生的原因,原因之一 对统计学的作用重视不够、统计教育普及不够,我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面很少。其结果是获得的只是一些简单的报表,有价值的信息很少。,-中科院张永光教授,要提高统计信息的科学和真实性,必须在人力、资金财力、法律上对统计切实加以重视,不只是口头上,以统计P值来做装饰。,原因之二 统计学教学观念和方法落后,1 教学中比较多的在统计推理和计算;,2 科研设计、质量控制和统计分析分离;,3 教学与实际应用脱离。,原因之三,计算机统计软件应用问题,面对大量数据的统计分析,无法用手工方式完成。只能采用计算机来实现。以前手工一个月的工作,计算机几分钟就能完成。计算机软件统计分析带得很大的方便。,“计算机软件给统计学带来革命性的变化”。,对于同一份数据资料,统计学可提供多种不同的分析方法,各种方法都有一定的前提条件,采用不同方法所得到的结果不完全相同。,乱用计算机统计软件现象很,普遍,一方面,很多人不管统计方法的前提条件是否満足,将数据直接代入计算机软件中,得出的结果与实际相差堪远。,另一方面,现有的统计软件使用不太方便,造成用户的误用。,3 统计软件使用情况调查,2003年,对中国人民解放军总医院医学博士进行问卷调查,参加学员,135,名,调查统计软件使用情况。,表1.12,学习和使用统计软件情况的调查,统计软件,例数 构成比(),学用过,102 81.60,未学过,23 18.40,表1.13曾用过的统计软件情况的调查 曾用过的统计软件 例数 构成比(),不満意 19 16.38,一般 48 41.38,较満意 41 35.34,很満意 8 6.90,4 中国统计教育的现况,1 不少学校仍用手工或计算器进行应用统计教学;,2 统计教学大量使用英文软件,但在中国学生需要有中文统计软件进行辅助教学;,3 现有的一些统计软件功能还不很完善、使用不太方便,还不能満足广大用户的需求。,4 使用盗版统计软件现象较为严重。,这些因素也是导致在科研工作中存在着大量误用统计学问题的原因。,5 解决方案,随着高科技的迅速发展,中国经济的腾飞,中国需要而且也可以开发出功能更为强大、使用更为方便具有智能化的统计软件,用于统计学教学、统计分析和数据挖掘。,具有智能化,CHISS,统计软件,CHISS 是一套具有数据信息管理、图形制作和数据分析的强大功能,并具有一定智能化的统计分析软件。,可以广泛应用于科学研究、学校教学、市场调查、企业和医院中的数据管理、挖掘和统计分析。,CHISS,使用调查结果,99.2%的博士认为,CHISS,软件基本能満足科研的需要。,95.1%的博士认为,CHISS,软件比他所使用的其它国外软件更好用。,96.0%的博士认为,CHISS,软件操作很方便。,(13)统计数据造假的问题,统计是支持研究结论的证据之一,一些想在研究中走捷径的人不惜抛开科学道德伪造统计数据。,据,1976,年,New Science,杂志关于科研舞弊行为的调查,,74%,的调查表反映有不正当修改数据的情况。其中,,17%,拼凑实验结果,,7%,凭空捏造数据,,2%,故意曲解结果。,年月,美国劳伦斯伯克利国家实验室名研究人员在学术刊物物理评论通讯上联合发表论文称,通过铅原子核和氪原子核的撞击,他们发现了元素周期表上空缺的号元素,以及由号元素衰变产生的号元素。,这一成果曾被视为年最重要的科技突破之一。,美国劳伦斯伯克利国家实验室公开承认数据造假,新华网 华盛顿2002年月日,美国劳伦斯伯克利国家实验室最近公开承认,该实验室一个研究小组年发现的两种超重元素的实验数据是“捏造”的,有关研究人员从事了“不正当科学行为”。,其他科学家随后进行的重复研究,却无法获得类似结果。,尼诺夫是人研究小组成员之一,在最初的研究中主要负责数据的分析,目前已被该实验室开除。,贝尔实验室“揭丑”,光明日报 2002年10月9日,贝尔实验室是全世界科学工作者敬仰和向往的地方。曾获得6个诺贝尔物理学奖。,世界最负盛名的贝尔实验室向世人公布了该实验室研究人员舍恩在16篇论文中捏造或篡改实验数据的丑闻。,中国“学术腐败”,2004年初,南京中医大学学术带头人博士导师XX的造假事件。,北京大学教授和博士生导师王铭铭剽窃,北京大学社会学系年轻教授和博士生导师王铭铭,美国人类学家哈维兰的当代人类学(中译本)和王铭铭的近作想象的异邦,这两本书大约有10万字的内容几乎是一模一样。,北大一副教授剽窃被解聘,黄宗英,男,1993年攻读北大美国文学博士学位,1996年7月留校任教,1997年8月晋升为副教授,事发前是系工会主席。,北京大学英语系核查组关于黄宗英学术剽窃行为的评价报告称,根据美国语文学会研究论文写作指南对剽窃行为的定义,黄宗英的艾书剽窃部分占到全书的74%.,上市公司财务数据造假案,安原公司,郑百文,银广夏,蓝田股份,造假案公司主要领导判刑,公司倒闭.,历史上许多事实说明,科学容不得半点虚假,造假者一旦被揭露就背上了永远洗脱不掉的耻辱,其中不少人最终精神错乱或自杀身亡。,“科学诚实”,“对于科学工作者,没有比科学诚实更重要的东西了,只有拥有了这种诚实,公众才会对我们有信心。”,“在一篇论文发表之前,所有作者都有责任核实数据。”,-尚克美国劳伦斯伯克利国家实验室主任,谢谢!,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服