资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,教学方法,讨论,讲授,医学统计学简介(,I,ntroduc,tion to medical,statistics,),研发一种预防甲型或者乙型肝炎疫苗,我们如何评价疫苗的预防效果?,最基本的方式就是比较。通常我们将受试对象随机分为两组,一组注射该疫苗,另一组不注射该疫苗,检测并记录预防效果,最后统计分析该疫苗的有效性和安全性,,这就是一个常见的人群实验。,请问在该实验过程中,需要注意那些关键问题?,问题讨论一,医学统计学简介(,I,ntroduc,tion to medical,statistics,),需要解决的关键技术问题:,样本含量的确定,如何随机分组,有什么措施可以保证两组志愿者除了接受疫苗外,其他影响到疫苗效果的因素在两组的分布是一致的?,用什么指标反映疫苗的有效性和安全性?,如何控制误差和偏倚?,医学统计学将回答上述问题!,问题讨论一,医学统计学简介(,I,ntroduc,tion to medical,statistics,),运用,概率论,与,数理统计,的原理和方法,研究资料的,搜集、整理和分析推断,的一门学科。,统计学(,statistics),Statistics,:,“,a science dealing with the,collection,analysis,interpretation,and,presentation,of masses of numerical data”,-Webster,国际大辞典,统计语源最早出现于拉丁语的,Status,,意思指各种现象的状态和状况。,由这一语根组成意大利语,Stato,,表示,“,国家,”,的概念。,十八世纪德国政治学教授亨瓦尔在,1749,年所著,近代欧洲各国国家学纲要,一书绪言中,把国家学名定为,Statistika,(统计)这个词。原意是指,国家显著事项的比较和记述,或,国势学,。,医学统计学的基本概念,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计学的产生与发展,1,、统计学的萌芽期(,17,世纪中,18,世纪中),古典记录统计学派,(,1,)德国的记述学派(国势学派,康令(,1606,1681,)、阿痕瓦尔(,1719,1772;1764,年首创统计学一词),在大学中开设“国势学”采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。,(,2,)政治算术学派,威廉,配第(,16231687,):,政治算术,,对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较。,约翰,格朗特(,16201674,):,关于死亡表的自然和政治的考察,,他们开创了从数量方面研究社会经济现象的先例。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,统计学的产生与发展,2,、近代统计学(,18,世纪末,19,世纪末),(,1,)数理统计学派,法国的拉普拉斯:把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。,比利时的凯特勒(,17961874,):,社会物理学,、,论人类,、,概率论书简,。他是数理统计学派的奠定人,有“统计学之父”之称。,(,2,)社会统计学派,德国的克尼斯(,18211898,),恩格尔(,18211986,):著名的,恩格尔定律,梅 尔(,18211896,),:,人口统计学,、,伦理统计学,、,社会生活中的规律性,。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,统计学的产生与发展,3,、现代统计学(,20,世纪),统计学的主流从描述统计学转向推断统计学。,20,世纪,30,年代,R,费希尔的推断统计理论标志着现代数理统计学的确立。,(,1,)数理统计学派,哥塞特(,18761936,):首创小样本,t-,分布理论,费希尔(,18901962,):提出实验设计等。此外,尼 曼、毕尔生、瓦尔德、科克伦等。,19,世纪,应用数学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,统计学的产生与发展,(,2,)社会统计学派,弗拉斯卡姆波(,1886,):,一般统计学,史密斯(,18541901,):,统计学原理,高野岩山郎(,18711949,):,社会统计史研究,(,3,)社会经济统计学派,斯特鲁米林(,1877,)发展了社会经济统计理论,列昂捷夫(,1906,)投入产出方法,(,4,)当代中国的统计学(,1949,),新中国成立前主要介绍欧美统计学派。,改革开放前主要参照前苏联统计模式。,改革开放以来学习世界各国统计之长,创有中国特色统计之新。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,统计学的产生与发展,60,年代以后统计学发展有三个明显的趋势:,统计学依赖和吸收,数学,更多;,以统计学为基础的,边缘学科,不断形成;,与电子计算机技术相结合。,计算机和统计软件如,SAS,、,SPSS,的出现 使统计学得到了突飞猛进的发展。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,统计学(,Statistics,),统计工作,:,即对事物数量特征的有关资料进行搜集、整理和分析的活动过程。,统计资料,:,即统计工作的对象和成果。,统计科学,:,即对统计工作及统计资料规律进行总结和理论概括的系统学说。,统计学的内涵,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,统计学的内涵,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,医学,统计学,(medical statistics),是以医学理论为指导,运用数理统计学的原理和方法研究医学科研设计和医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。,卫生统计学(,health statistics,):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,医学,统计学发展简史,统计计算历史:笔、纸、算盘、对数表、乘方表、计算尺、计算器等,统计发展历史:德国数学家,GUASS,(,1777-1855,)数字计算题,表现出极高的统计计算天赋。,最先提出“相关与回归”的英国人类学家,Galton,在人类学和优生学研究中萌发的统计思想。,遗传学家,F.,Galton,爵士(,1822-1911,)对上千家庭父亲身高和儿子身高的观察发现遗传的“回归”现象。,小样本均数,Student-t,检验的发现者、英国生物统计学家,Gosset,(1876-1937,)为了解决,t,检验的理论和应用问题,通过使用卡片进行抽样试验和计算统计量得出,t,分布曲线,成为,Monte-Carlo,计算方法的先行者。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,医学,统计学发展简史,现代实验设计方法和统计分析技术的奠基者,、英国生物统计学家,R.A.Fisher(1890-1962),在,20,世纪,20,年代撰写的实验设计和统计方法专著时,因不可能计算出所有小概率对应的,t,分布和,F,分布的临界值,只好给出了,a=0.05,,,0.01,时对应的,t,分布和,F,分布的临界值表。令他未曾想到的是这种因统计计算方法的限制而人为设定的两个数字,至今仍然被许多人当作小概率的唯一数量标准。,他创立了,实验设计方法和统计分析,技术,奠定现代生物统计的基础。,1948,年,,英国发表了评价链霉素治疗肺结核疗效的,随机对照的临床试验,报告,第一次采用生物统计方法进行临床干预试验。,1948,年,,,郭祖超,教授(,19121999,)编著的,医学与生物统计方法,,是我国第一部医学统计方法的教科书。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,医学,统计学的内涵,医学统计学是建立在现代科学方法之上,由统计学理论指导的数据收集、表达和分析的方法,现代科学方法可以概括为以下几点:问题的识别与表达(发现问题、提出问题)。,搜集有关资料。,通过归纳得出假说:因果联系及重要的模式。,从假说作出演绎:进行实验或收集更多的资料。,推理:结果与演绎相符,假说得到加强,但不是被证明(例某地区食盐与高血压的关系)。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,医学,统计学的学科特点,医学数学,侧重医学,淡化数学。,用数量反映质量,如平均期望寿命,解放前为,35,岁,现在,70,岁,可反映国家医疗卫生服务总体水平的提高。,大量观察,+,实验数据分析,可以揭示医学规律。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本概念,医学,统计学的研究对象,研究医学中具有变异的事物。,简单地说,变异是生物个体之间的差异。,变异是医学领域的普遍现象,医学领域内没有变异的现象十分罕见。,变异是医学统计学存在的必要条件。,医学统计学的研究对象,医学统计学简介(,I,ntroduc,tion to medical,statistics,),1.,采用统计学方法,发现不确定现象背后隐藏的规律。,变异,(,variation,)是社会和生物医学中的普遍现象。,变异使得实验或观察的结果具有,不确定性,,如每个人的身高、体重、血压等各有不同。,2.,用统计学思维方式考虑有关医学研究中的问题,“阳性”结果是否是虚假联系?,某感冒药治疗,1,周后,治愈率为,90%,,能否说该感冒药十分有效?,“阴性”结果是否是样本含量不足?,有人曾对发表在,Lancet,N Engl J Med,,,JAMA,等著名医学杂志上的,71,篇阴性结果的论文作过分析,发现其中有,62,篇(,93%,)可能是由于,样本含量,不足造成的假阴性。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),为什么要学习医学统计学,3.,保证你的研究论文能通过统计学审查,据国外,60,80,年代对不同医学杂志发表论文的调查,有,统计错误的论文的百分比最高达,72%,,最低也有,20%,。,国内,1984,年对,中华医学杂志,、,中华内科杂志,、,中华外科杂志,、,中华妇产科杂志,、,中华儿科杂志,595,篇论文的调查结果,相对数误用为,11.2%,,抽样方法误用,15.9%,,统计图表误用,11.7%,。某研究者,1996,年对,4586,篇论文统计(中华医学会系列杂志仅占,6.9%,),数据分析方法误用达,55.7%,。,JAMA,,新英格兰医学杂志(,NEJM,)、英国医学杂志、中华医学会,杂志对来稿都有统计学要求,或统计学指导。,国际生物医学杂志编辑协会在其,生物医学期刊投稿的统一要求,中也包含了统计学要求。,为什么要学习医学统计学,医学统计学简介(,I,ntroduc,tion to medical,statistics,),4.,获得循证医学证据的主要手段,“良好愿望的医学”(,well-meaning medicine,)转入“以证据为基础的 医学”(,evidence-based medicine,,,EBM,)需要有统计学方法的支持。,全世界的医学期刊每年大约刊登,600,万学术论文,但能作为可靠“证 据”的论文并不多。,5.,医学需求,如何判断药物的疗效?,(,假设检验,),明天是否下雨?体育彩票能否中奖?,(,概率论,),子女为什么象父母,其强度有多大?,(,相关与回归,),美国的民意测验是如何进行的?,(,设计,抽样,),中国的市场调查的可信性有多大?,(,现场调查,),统计学是对令人困惑费解的数字问题做出设想的艺术。,为什么要学习医学统计学,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的研究内容,医学统计学简介(,I,ntroduc,tion to medical,statistics,),研究内容,统计设计,统计分析,实验设计,调查设计,统计描述,统计推断,指标描述,图表描述,参数估计,假设检验,变量关系,1,统计研究设计,包括调查研究设计和实验研究设计。,2,医学统计学的基本原理与方法,主要包括研究设计和数据处理中的基本统计理论和方法。例如:,资料的搜集与整理;,常用统计描述:集中趋势与离散趋势,相对数,相关系数,回归系数,统计表与统计图等;,统计推断:参数估计和假设检验等。,3,变量关系,医学现象复杂多变,如疾病的发生、发展、转归、预后等受众多因素的影响。而多元统计可充分利用资料的多因素信息,从而得出更贴近实际的结论。主要方法有:多元线性回归和逐步回归、判别分析、聚类分析、主成分分析、因子分析、,Logistic,回归与,Cox,回归分析等。,4,统计软件的使用,SAS,,,SPSS,,,Stata,等等,医学统计学的研究内容,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本步骤,第一步设计,:制定计划,对整个过程进行安排。是整个工 作的关键。如何进行设计?举例。背景,-,目的,-,方法,-,内容,-,经费预算,第二步收集资料,(,现场调查,),:,根据计划取得可靠、完整的资料。收集资料的方法有三种:统计报表、日常性工作、专题调查。注重资料的真实性。,第三步整理资料:,原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。可借助于计算机(常用软件:,EPI,、,SPSS,、,SAS,)。,第四步分析资料,(,统计分析,),:,统计学的关键所在。运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本步骤,1.,专业设计:,选题、建立假说、确定 研究对象和技术方法等,个性,2.,统计设计:,围绕专业设计确定统计 设类型、样本大小、分组方法、统计分析指标及统计分析方法。,设计,(,design),一,、医学研究设计 是对整个研究过程的总设想或总按排,是,最关键的一步,也是最重要的一步,。,搞好设计应具备以下条件,1.具有丰富的专业知识和水平,2.纵阅大量的参考文献,3.选准研究课题,4.组成多学科专家队伍,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本步骤,设计,(,design),从内容上讲设计分为,专业设计:反映课题研究的深度与水平。,Why?,了解专业现状、学术前沿、研究动态、水平及发展方向和条件,提出课题(立项依据 项目的研究意义和应用前景、国内外研究现状分析,附主要的参考文献等),What?,主要解决的问题(研究目标,研究内容和拟解决的关键问题等,提出详尽的分析思路和技术路线,作好周密的考虑和安排,),统计设计:与科研课题完成的质量有关,How?,设计方案应考虑,分析目的,研究对象,分析指标、观察单位、检测内容和方法,如何获取资料、怎样整理计算,如何控制误差、组织实施等,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本步骤,收集资料,_,是最基础的一步,(,1,)资料来源,第一手资料,经常性:统计报表(死亡登记、疫情 报告等),工作记录(病历、化验);,一时性:专题调查、实验或临床试验。,第二手资料:已公布的资料,如数据银行、全国、全省卫生统计资料。,(,2,)资料要求,完整:观察单位及观察项目完整。观察单位:最基本的获取数据的 单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。,准确:即真实、可靠。真实是统计学的灵魂。,及时:即时限性。如人口普查规定调查开始日期和截止日期。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本步骤,整理资料,整理资料即原始数据的条理化、系统化的过程。,所采取的手段,合理化分组,目的,实现专业目标。,质分组:按事物的属性或性质分组,分类变量;,量分组:按数据的大小,数值变量。,(,1,)统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。,(,2,)统计推断:用样本信息推断总体特征:,参数估计,,假设检验。,分析资料,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的基本步骤,变量,(variable),与变量值,(,1,)、变量:被观察单位的某一项特征,习惯用,X,表示。,(,2,)、变量值:变量的测得值称为变量值或观察值。,(,3,)、统计资料(数据):由变量值构成资料。,在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量。如“身高”、“体重”、“疗效”就是变量。变量的观察结果或测量值称为变量值,(variable value),,变量按其值的性质可分为不同类型。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料类型,统计资料类型,数值变量资料,分类变量资料,二分类资料,多分类资料,资料类型,有序分类资料,无序分类资料,统计资料的类型,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料类型,数值变量,(numerical variable),资料:,其变量值是定量的,表现为数值大小,多有度量衡单位。如身高(,cm,)、体重(,kg,)、心律(次,/,分)、住院天数(日)、血压(,mmHg,或,kPa,)等。,这种由数值变量的测量值组成的资料称为计量资料。,大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只是正整数,如心率、白细胞计数等,在医学统计学中把它们也视为连续型变量。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料的类型,统计资料类型,2,分类变量(,categorical variable,)资料:,表现为互不相容的类别或属性,亦称定性变量。分类变量可分为二分类与多分类两类。,二分类变量资料:如性别(男、女),多分类变量资料:分为无序和有序两种。,无序分类变量(,unordered categorical variable,)是指所分类别或属性之间无程度和顺序的差别。如血型(,O,、,A,、,B,、,AB,)等。无序分类变量的分析应先按类别分组,计各组的观察单位数,编制分类资料的频数表,所得资料称为计数资料。,有序分类变量(,ordinal categorical variable,)是各类别之间有程度的差别。如尿糖化验结果按、,、,+,、,+,、,+,分类;疗效按治愈、好转、无效、恶化分组。有序分类变量的分析应先按等级顺序分组,计各组的观察单位数,编制各等级的频数表,所得资料称为等级资料。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料的类型,统计资料类型,变量类型,变量值表现,实例,资料类型,数量变量,定量(具体数值),身高(,cm),计量资料(定量资料),分类变量,多,分,类,无序,不相容的多类属性,血型(,A,B,O,AB,),计数资料,(等级资料),有序,类间有程度差异的属性,文化程度(初中、高中、大学,.,),二,分,类,对立的,两类属性,性别,(男,女),二项分布资料,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料的类型,统计资料类型的相互转换,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料的类型,统计资料类型的表现形式,医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料的类型,统计资料类型的别名,1,、定性数据(,qualitative data,),(二项与多项)分类数据,(categorical data),计数数据(,enumeration(counting)data,),2,、定量数据(,quantitative data,),计量数据(,measurement data,),区间数据(,interval data,),数值数据(,numerical data,),3,、等级资料(,ranked data,),有序资料(,ordinal data,),医学统计学简介(,I,ntroduc,tion to medical,statistics,),统计资料的类型,总体和样本,(population and sample),总体,:根据研究目的确定的,同质,研究对象的,全体,(集合)。分有限总体与无限总体。,样本,:从总体中随机抽取的部分观察单位,医学统计学的几个重要概念,医学统计学简介(,I,ntroduc,tion to medical,statistics,),总体和样本,1.总体(,population):,是根据研究目的确定的同质的所有观察单位某种变量值的集合。,有限总体,(,finite population,),:指明确了特定的时间、空间范围的有限个观察单位所组成的总体。,无限总体,(,infinite population,),:没有时间和空间范围限制的无限个观察单位所组成的总体。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,总体和样本,总体的三个基本特征:,.,同质性。即构成总体的各单位必须具有某种共同性质,这是形成总体的客观依据,也是我们确定总体范围的标准。各单位必须具有这种共同性质,是由统计研究的目的决定的。,.,大量性。即总体是由许多单位组成的。一个或少数单位不能形成总体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以统计研究的对象必须包括足够多的个体。,.,差异性。即总体的各单位除了某一方面的共同性外,在其他方面必须是有差异的,这些差异是统计研究的基础和前提。,作为总体,必须同时具备上述三个特征,才能进行一系列的统计计算和分析研究,三者缺一不可。现象不同质,无法将其结合在一起;少量单位,反映不出现象的规律性;各个单位都一样,没有差别,无须进行统计研究。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,总体和样本,(population and sample),样本(,sample,),:,是从总体中随机抽取的部分观察单位变量值的集合。样本的例数称为样本含量,(,sample size,),。,注意:,1.,总体是相对的,总体的大小是根据研究目的而确定的。,2.,样本应有代表性,即应该随机抽样并有足够的样本含量。,3.,抽样研究的目的是用样本信息去推断总体特征,,所以样本必须具有代表性。“,代表性,”是在样本来自同质总体、足够的样本含量和随机抽样的前提下实现的。,从某市全体,7,岁健康儿童中随机抽取,100,名,他们的体重测量值构成样本。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,总体和样本,(population and sample),总体与样本的关系:,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,同质,(,homogeneity,),和变异,(,variation,),同质:,是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。,严格地讲,同质是指被研究指标的影响因素相同。但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。因此,在实际工作中只有相对的同质。,在统计学中可以把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。,例如研究儿童的身高时,要求影响身高较大的、易控制的因素如性别、年龄、民族、地区要相同,而不易控制的遗传、营养等影响因素可以忽略,。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,同质,(,homogeneity,),和变异,(,variation,),变异:,由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。,同质基础上的各观察单位间的差异称为变异。,如同性别、同年龄、同民族、同地区健康儿童的身高、体重不尽相同;相同病种、病程的病人,使用同一疗法,却未必有相同疗效。这些不同就是变异。变异是生物体的基本属性之一,也是统计研究的前提,若所研究的同质群体中各个观察单位都一样,没有差别,分析一个就够了,无须进行统计研究。,来源于一些未加控制或无法控制的甚至不明原因的因素。是统计学存在的基础,从本质上说,统计学就是研究变异的科学。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,同质和变异,同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现,是由于生物体内外环境中,多种因素的综合影响造成的,其中许多因素是未知的,也是难以控制的。统计研究的是有变异的事物,其任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征。,调查,2003,年西安市,7,岁男童的身高和体重,同质,:,2003,年、西安市、,7,岁男童,变异,:身高和体重各不相同,研究某降压药的疗效,同质,:高血压患者、用某药治疗;,变异,:疗效各不相同,。,医学统计学的几个重要概念,医学统计学简介(,I,ntroduc,tion to medical,statistics,),随机化(,randomization,),和随机抽样(,r,andom sampling,),随机性,就是要保证总体中的每个个体有相同的几率被抽作样本。重要的是要避免主客观的“偏因”。必须指出,随机化抽样绝不等于随意抽样。,例如,将40只小鼠分为两组。如果闭上眼睛,随意抓取20只作为第一组,留下的作为第二组。表面上看来是随机的,实际上是不随机的。因为体壮、活泼性强的小鼠难于抓到,故大部分留在第二组,两组的活泼性是不同的。,随机抽样:,为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,随机化(,randomization,),和随机抽样(,r,andom sampling,),抽样方法:,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,误差(,Error,),和抽样误差(,random,sampling error,),统计上所说的误差泛指测量值与,真值,之差,样本指标与总体指标之差。主要有以下三种:系统误差、随机测量误差、抽样误差。,问题:哪类误差用统计学方法可以控制?为什么?,系统误差(,systematic error,),概念:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造次观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。流行病学称之为偏倚(,bias,)。,特点:具有累加性。观察值有系统性、方向性、周期性的偏离真值。,可以通过严格的实验设计和技术措施消除,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,误差(,Error,),和抽样误差(,random,sampling error,),随机测量误差(,random measurement error,),:,概念:由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。,特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。,提高操作者熟练程度可以减少这种误差,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,误差(,Error,),和抽样误差(,random,sampling error,),抽样误差,(,random,sampling error,),:,概念:由于抽样而引起的样本指标与总体指标之间的差别。,特点:有抽样,抽样误差就不可避免。,统计上可以计算并在一定范围内控制抽样误差。,不可避免,但有一定的分布规律,可估计。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,误差(,Error,),和抽样误差,抽样误差(,sample error,),:,由于随机抽样所引起的,样本统计量与总体参数之间的差异,以及样本统计量之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率的差别等。,注意:,抽样误差是,不可避免的,。无论抽样抽得多么好,也会存在抽样误差。但统计上可以计算并在一定范围内控制抽样误差。,减少抽样误差的方法:,(,1,)改进抽样方法(增加样本的代表性),误差从大到小:,整群抽样,单纯随机抽样系统抽样分层抽样,(,2,)增加样本量,;,(,3,)选择变异程度较小的研究指标。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,参数(,parameter,),和统计量(,statistic,),医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,统计推断(,inference,),医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,统计推断,(,inference,),医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,统计推断,(,inference,),描述统计与推断统计的关系,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,概率(,probability,),和小概率事件(,small probability event,),随机事件,可重复性:相同条件下可重复进行,随机性:出现两种及两种以上结果,偶然性:实验前不能肯定将会出现哪种结果,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,概率,(,probability):,是描述随机事件发生的可能性大小的数值。,(1)必然事件:,P(A)=1,(2),不可能事件:,P(A)=0,(3)随机事件(偶然事件):0,P(A),1,(4)小概率事件,:概率,p,小于或等于,0.05,的随机事件,表示一次实验中该事件发生的可能性很小。,小概率原理,:,小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设检验。,“小概率”的标准,是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定,=0.01,,甚至更小。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,概率(,probability,),和小概率事件(,small probability event,),频率(,frequency,),与概率的区别,(,1,)频率:某种现象在样本中出现的比率,是样本特征。样本的实际发生率称为频率。设在相同条件下,独立重复进行,n,次试验,事件,A,出现,f,次,则事件,A,出现的频率为,f/n,。,(,2,)概率:随机事件发生可能性的数值度量,常用,P,表示,取值范围,0P1,,是总体的特征。,特别的,小概率事件,特指发生概率,P0.05,或,P0.01,的事件。,样本的实际发生率称为,频率,。设在相同条件下,独立重复进行,n,次试验,事件,A,出现,f,次,则事件,A,出现的频率为,f,/,n,。,频率与概率间的关系:样本频率总是围绕概率上下波动样本含量,n,越大,波动幅度越小,频率越接近概率。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),医学统计学的几个重要概念,概率(,probability,),和小概率事件(,small probability event,),1.,着重理解基本原理和基本概念,掌握搜集、整理与分析资料的基本知识和技术,常用统计指标与基本统计方法的正确应用。重视原始资料的完整性与可靠性,对数据的处理应持严肃、认真和实施求事的科学态度。,2.,培养科学的统计思维方法。如关于生物个体变异的客观存在,抽样误差不可避免,因而样本指标的比较,不能仅从数字表面大小看问题的思想。,3.,联系实际,结合专业。,4.,对讲义中的统计公式,只求了解其意义、用途和应用条件,不必深究其数学推导。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),如何学习医学统计学?,学习此门课程的方法与建议:,首先,,一定要掌握好三基,即基本知识、基本概念和基本方法。,其次,,要逐步培养统计的思维方法,始终牢记概率、抽样和变异的存在。,最后,,要注意掌握每种统计方法的实际应用和应用条件。,最关键的,,还是要训练对实际问题进行深入分析和培养实际处理各类资料的能力。,医学统计学简介(,I,ntroduc,tion to medical,statistics,),如何学习医学统计学?,坚决反对,伪造统计数据违反科学道德的行为!,1976,年,New Science,杂志关于科研舞弊行为的调查,(,1,),74%,的调查表反映有不正当修改数据的情况,(,2,),17%,拼凑实验结果,(,3,),7%,凭空捏造数据,(,4,),2%,故意曲解结果,医学统计学简介(,I,ntroduc,tion to medical,statistics,),如何学习医学统计学?,Thanks,!,医学统计学简介(,I,ntroduc,tion to medical,statistics,),
展开阅读全文