资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,医 学 统 计 学,Medical Statistics,浙江海洋学院医学院 龚戬芳,gjf 200527,第一章 医学统计中的,基本概念,绪论,医学统计工作的内容及资料类型,医学统计中的基本概念,医学论文中,统计运用错误,,除了影响论文的科学性,,还可能导致严重的伦理学问题。,eg,:,1996,年有机构对申报科技成果的,4586,篇论文进行分析(中华医学会系列杂志占,6.9%,),统计方法使用率仅,为,76%,,数据分析方法误用达,55.7%,。,2001,年,中华预防医学杂志,:中华医学会系列杂志数据分析方法误用约,54%,(,1995,)。,“非常痛心地看到,因为数据分析的缺陷和错误,那么多 好的生物研究工作面临着被葬送的危险”。,-,F.Yates,M.J.R.Healy,统计知识的运用,撰写论文:报告自己观察或实验的研究结果。,阅读论文:吸收新知识,了解学术进展。,为什么要学医学统计学?,统计学,(,statistics,),:,是以,概率论,、,数理统计学,为基础,研究,资料和信息,(数据)的,搜集,、,整理,、,分析,和,解释,的科学。,目的是帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。,理论基础,由此看出:,统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科,强调了“,过程,”。,医学统计学,(,medical statistics,),:,运用,概率论,和,数理统计,等数学的基本原理和方法,研究生物医学资料和信息的,搜集,、,整理,、,分析,和,推断,的一门学科。,理论基础,概率论、数理统计学,研究对象,随机、不确定的现象,(,变异的医学现象,),医学统计学是帮助人们透过许多,偶然,现象,分析和判 断事物,内在规律,的学科。,eg:,P,1,医学统计学是医学实践和医学科学研究中的一门重要 的医学,基础学科,,是一种不可缺少的分析和解决问题 的,工具,。,个体变异,第二节 医学统计工作的,内容及资料类型,一医学统计工作的内容,任何统计工作和统计研究的全过程都可分为以下五个步骤:P,2,第一步,研究设计,(,Design,),第二步,收集资料,(,Collection of data,),第三步,整理资料,(,Sorting data,),第四步,分析资料,(,Analysis of data,),第五步,解释资料,(,Interpretation of data,),1、研究设计,(,design,),设计是对资料的搜集、整理和分析全过程的,周密、,科学、有效的设想与安排,,是科学研究,最关键的一环,。,种类:,实验设计、调查设计,内容:,专业设计、,统计设计,前期准备工作,:,查阅文献、了解现状、征询意见,(,在,此基础上考虑,)其中有可能涉及到的统计内容是什么?,设计内容包括:,确定研究目的、研究假说;,确定,观察对象,、观察单位、样本含量和抽样方法;,拟定研究方案;,确定预期分析指标、误差控制措施、进度与费用等。,2、收集资料,(,collection of data,),遵循统计学原理采取必要措施得到准确可靠,的,原始资料,。,基本原则:,及时,、,完整,、,准确,、,可靠,、,系统,原则。,资料来源:,原始资料,(一手资料),:包括,经常性资料,(,eg,:,日常医疗卫生工作记录、统计报表、专门报告卡等),;,专题研究资料,(一时性资料)(,eg,:,专题调查资料、实验研究资料,)。,次级资料,(二手资料),:文献的二次开发,(循证医学)。,3、整理资料,(,sorting data,),通过科学的分组和归纳,用,图表,的形式来展示资料特征,使原始资料,系统化、条理化,,便于进一步计算统计指标和分析。,步骤:,审核:,遵循及时性、完整性、准确性、有效性原则。,包括,逻辑检查,与,技术检查,。,(,eg,:,录入误差,170,输入为,17,,对结果影响较大,故,应进行双份录入,),分类或分组:,质量分类,按性质、类别分类整理,即“同质者合并,非同质者分开”的原则对资料进行分组。多用于定性数据,(计数或等级资料),的整理。一般用二维表。,数量分组,按数量大小分组整理,即在同质基础上根据数值大小进行分组,组与组之间是连续的或非连续的。多用于定量数据,(计量资料),的整理。,拟订整理表:,汇总归纳。,制定统计图表或报告。,4、分析资料,(,analysis of data,),目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律,是统计学的,核心,。,包括:,统计描述,(,descriptive statistics,):用,统计指标,(样本均数、标准差、率),与,统计图(表),等方法对样本资料的数量特征及其分布规律进行描述分析事物特征。,统计推断,(,inferential statistics,):指,如何抽样,,以,及如何用,样本信息推断总体,特征,分析事物间相互,关系。,(,eg,:,药物疗效的统计学分析,降压药物的降压效果为,5,mmHg,且,P,0.05,),5、解释资料,(,interpretation of data,),对统计结果进行说明和应用。,(,eg,:,药物疗效的统计判断,降压药物的降压效果为5,mmHg,且P,0.05,),:,统计工作的五个步骤,紧密相连,、,不可分割,,任何一步的缺陷,都将影响整个研究结果。,进行资料分析时,需根据,研究目的,、,设计类型,和,资料类型,选择恰当的描述性指标和统计推断方法。,目前,应用广泛,成为医药护理学研究、疾病防治、卫生事业管理等多方面的重要手段、工具之一,即成为,方法论,。,二学习医学统计学的目的与要求,目的:,掌握医学统计学的基本,理论,、基本,方法,、基本,统计技能,,为今后从事护理科研、阅读专业书刊、,从事具体的临床实践工作打下必要的统计学基础。,要求:,明确学习目的,(前述),;,注意学习方法:掌握统计方法的基本思想、公式的应用条件及用法,不要深究其数学原理;,明确理论体系;,理论联系实际;,纵横联系,(前后贯通),;,培养科学作风:严肃、认真、实事求是。,三,资料的类型,资料,(,data,),:是对客观事物观察的结果。,eg,:,观察药物在研究对象血液中的含量,即血药浓度。,(,一,),资料的类型,1,计量资料,(,measurement,data,):又称数值数据,(,numerical data,)、定量数据(,quantitative,data,)。,特征:,观察结果由,具体数值,表示:其变量值是,定量,的,表,现为数值大小,可经测量取得数值;,具有度量衡,单位,。,eg,:,医药企业销售收入(万元)、身高,(,cm,)、,体重,(,kg,)、,血压,(,mmHg,kPa,)、,脉搏,(,次,/,min,),和白细胞计,数,(,10,9,/L,),等,。,分类:,连续性,计量资料,:,大多数的数值数据为连续型资料,,其取值连续不断,不能一一列举。,eg,:,血药浓度、时间、身高、体重、血压、温度等。,非连续性(离散性)计量资料:,可以取有限个值,即,可以一一列举。,eg,:,制药公司数、门诊人数、生育子女数等。,2计数资料,(,enumeration data,),:又称定类数据,(,categorical data,)、分类数据(,categorical data,)、,名义数据(,nominal data,),特征:,观察结果由,字符,表示,其变量值是,定性,的,;,观察结果之间是互不相容,类别,与属性,且,无序,类别。,无序分类,(,unordered categorical data,):是指所,分类别或属性之间无程度和顺序的差别。,分类:,二项分类,数据,:,eg,:,性别(男、女),生死等。,无序多项,分类数据,:,eg,:,民族、血型(,O,、,A,、,B,、,AB,),,职业(工、农、商、学、兵)等。,整理:,应先按,类别,分组,清点各组的观察单位数,编制分,类变量的频数表,所得资料为定类数据。,3等级分组资料,(,rank data,):又称定序数据(,ordinal,data,)、有序多项分类数据(,ordinal categorical,data,)、半计量资料。,特征:,观察结果由,字符,表示,其变量值是,定性,的;,观察结果之间是互不相容,类别,与属性,且,有序类别,无具体数据大小,,但在性质上判断有,程度大小,关系。,eg,:,药物疗效按治愈、显效、好转、无效分类;尿糖化验结果按,、,、,分类;新药等级分类(一类、二类、三类、四类、五类);手术效果等。,整理:,对于定序数据,应先按,等级,顺序分组,然后清点各,组的观察单位个数,编制有序变量,(各等级),的频数,表,所得资料称为定序数据。,住院号,年龄,身高,体重,住院天数,职业,文化程度,分娩方式,妊娠结局,2025655,27,165,71.5,5,无,中学,顺产,足月,2025653,22,160,74.0,5,无,小学,助产,足月,2025830,25,158,68.0,6,管理员,大学,顺产,足月,2022543,23,161,69.0,5,无,中学,剖宫产,足月,2022466,25,159,62.0,11,商业,中学,剖宫产,足月,2024535,27,157,68.0,2,无,小学,顺产,早产,2025834,20,158,66.0,4,无,中学,助产,早产,2019464,24,158,70.5,3,无,中学,助产,足月,2025783,29,154,57.0,7,干部,中学,剖宫产,足月,观察单位,observations,个体,individuals,变量,variables,Numerical variable,计量资料,Categorical variable,计数资料,Units;elements,(二)资料之间的转换:,资料,类型不同,,其分布规律亦不同,对它们采用的,统计分析方法也不同,。在处理资料之前,,首先要分,清,资料,类型。,资料,类型不是一成不变的,根据研究目的的需要,,各类资料之间可以进行,相互,转化。,eg:,一组20,40岁成年人的血压(舒张压),以,12,kPa,(90,mmHg,),为界分为正常与异常两组,统计每组例数,8 低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,数值变量资料,等级资料,无序分类资料,基 本 内 容,统计描述,统计推断(1),统计推断(2),计量 资料,频数分布,集中趋势,离散趋势,统计图表,抽样误差,标准误,t/u/F,检验,秩和检验,可信区间,直线相关与回归,偏相关,多元线性回归,计数,资料,相对数,统计图表,u,/,2,检验,秩和检验,可信区间,Logistic,回归,四,常用统计软件简介,SAS,(,统计分析系统,):,全称,Statistical Analysis System,,是当前最流行,的,国际标准通用、最具权威,的统计分析软件,但操作,略为繁琐。,优点:数据处理功能强,具有较强的数据管理和,报表制作功能。,SPSS,(,社会科学统计软件,):,全称,Statistical Package for Social Science,,,2009,年,已更名为:预测统计分析软件,PASW Statistics 18.0,(,Predictive Analytics Software,),,是当前,国内最流,行,应用最广泛,的专业统计分析软件。,优点:方法较齐全,运行速度快,容量大,操作方便。,Stata,:,方法齐全,小巧,统计制图及其打印较为独特,操,作简单。,EXE,(,电子表格软件,):,可进行基本的统计分析,操作简便。,第三节 医学统计中的,基本概念,一、同质与变异,同质,(,homogeneity,),:指,研究对象具有相同的状况或,属性等共性,。,同质性是构成研究总体的必备条件,科学研究与统计分析的前提,;,研究内容不同,对同质性的,要求不同,;,eg,1,:,住院患者,的心理需求的研究。,eg,2:,欲研究某新药治疗,胃溃疡,的效果。,所有研究对象都必须是,确诊为胃溃疡的病人且病情相似,,在这,种同质的基础上观察治疗效果,有的人治愈,有的人未愈,这种差,异就是变异。,变异,(,variation,),:指在,同质,的基础上各观察单位,(,或个体,),的某,变量值,之间的,差异,。,原因:,不可控的、不明原因的因素,作用下所产生的一,种综合表现。,特征:,个体变异的结果是,随机,的,,不可预测,的,;,个体变异是,有规律,的,(,n,分布趋于稳定),;,个体变异是,普遍存在,的,。,没有个体变异,就没有统计学!,图9-1 正常妊娠期分布,eg,:,二、总体与样本,(一)个体,(,individual,/观察单位,observed unit,):,是统计研究中,最基本,的单位,组成总体的每个成员。,任何统计研究都必须首先确定观察单位,可以是,一个人、一个家庭、一个地区、一个样品、一个采,样点等。,(二)总体,(,population,/母体):研究对象的全体,是,客观存在的。,1、定义:,根据研究,目的,确定的,同质,的,所有,观察单位,的某,变量值,(,eg,:,身高、体重等特征),的,集合,。,The entire group of individuals that we want information about is called the,population,.,个体,eg,:,调查某地2010年正常成年男子的红细胞数的正常值范围。,研究单位:一个人,变量,:红细胞数,同质:某地、,2010,年、成年、男子、正常。,总体:,1,)某地所有的正常成年男子,2,)某地所有的正常成年男子的红细胞数,2、分类:,有限总体,(,finite population,):是指在某特定的,时间,与,空间,范围内,同质研究对象的所有观察单位的某变量值的个数,(观察单位数),为有限。,eg,:,我院,护生,的心理健康状况的研究。,无限总体,(,infinite population,):,假想,,不存在的总体,是抽象的,无时间和空间的限制,观察单位数是无限的。,eg,:,高血压,病人,的自我护理能力的研究。,鉴于总体的,巨大,或,不可知性,或,可破坏性,能否研究其中的一部分?,不可能或没有必要对总体中的每一个个体进行研究,(三)样本,(,sample,),:,按照,随机化,原则,从总体中抽取的,有,代表性,的,部分,观察单位的,某变量值,的集合。,A,sample,is a part of the population that we actually examine in order to gather information.,样本容量(,sample size,):即,n,,又称为样本含量,是,指样本包含的观察值的数目。,(四)参数与统计量,parameter and statistic,1、参数:,是,总体,的统计,指标,为,固定的常数,,,常采用希腊字母表示。,eg,:,总体均数,记为,。,总体,样本,抽取部分观察单位,?,推断,inference,2、统计量:,样本,的统计指标,,是参数附近波动的随机变,量,,常采用拉丁字母表示。,eg,:,样本均数,记为 。,三、保证样本对总体具有代表性,应遵循的原则,1、同分布性原则(代表性原则):,样本与总体的,同质性,原则,规定总体的特征。,2、随机性原则:,总体中每个观察值有,同等机率,被抽取的,原则。避免随意抽样、主客观偏因。,抽样方法:,单纯随机抽样,机械抽样,分层抽样,整群抽样,常用的抽样方法,1)单纯随机抽样(simple random sampling):将调,查总体全部观察单位编号,再用抽签法或随机数字,表随机抽取部分观察单位组成样本。,优点:操作简单,均数、率及相应的标准误计算简,单。,缺点:总体较大时,难以一一编号。,2)系统抽样(systematic sampling):又称机械抽样、,等距抽样,即先将总体的观察单位按某一顺序号分,成n个部分,再从第一部分随机抽取第k号观察单位,,依次用相等间距,从每一部分各抽取一个观察单位,组成样本。,优点:易于理解、简便易行。,缺点:总体有周期或增减趋势时,易产生偏性,。,3)整群抽样(cluster sampling):先按某特征将总体分,为若干个群,再随机抽取几个群组成样本,群内全,部调查。多用于群与群之间差别较小的总体。,优点:便于组织、节省经费。,缺点:抽样误差大于单纯随机抽样。,4)分层抽样(stratified sampling):先按对观察指,标影响较大的某种特征,将总体分为若干个类别,,再从每一层内随机抽取一定数量的观察单位,合起,来组成样本。有按比例分配和最优分配两种方案。,优点:样本代表性好,抽样误差减少。,以上四种基本抽样方法都属单阶段抽样,实际应用,中常根据实际情况将整个抽样过程分为若干阶段来,进行,称为,多阶段抽样,。,各种抽样方法的,抽样误差,一般是:,整群抽样单纯随机抽样系统抽样分层抽样,3、样本含量适当原则:,可靠性,,即研究结果具有可重,复性、可信度。,4、独立性原则:,总体中每个观察值的抽取不干扰其它,观察值的抽取,如放回抽取与不放回抽取有所不同,(,有限总体,抽样不放回低于5%及,无限总体,不放回一般不,影响其它观察值的抽取),。,可比性,(,comparable,),:,两,组,或多个样本之间的比,较,要求,:,可比性是指处理组,(临床设计中称为治疗组),与对,照组之间,除处理因素不同外,其他,可能影响实验,结果的因素,要求基本齐同,也称为齐同对比原则,。,四、误 差,(一)误差,(,error,),系统误差,(,system error,),随机测量误差,(,random measurement error,),抽样误差,(,sampling error,),必须克服,应采取措施,尽最大可能在一定的允许范围内,可用统计方法分析其规律性,(二)抽样误差,(,sampling error,),定义:由,抽样,引起的,样本统计量,与,总体参数,间的差别。,原因:个体变异抽样,表现:,样本统计量与总体参数间的差别,不同样本统计量间的差别,特点:,不可避免性,有统计规律性,随机事件:,随机现象的某个可能观察结果。,频率,(,frequency,),:用,A,表示随机事件,则在,n,次观察,中,其中有,m,次随机事件,A,发生了,则称,A,发生的比,例 为,频率,。显然:。,五、概 率,eg,1:,某地区随机抽样调查糖尿病的患病率,eg,2:,抛硬币实验,频率,f,的性质:,随机性,不同的,n,有不同的频率,规律性(稳定性),随着实验次数,n,的增大,,频率,f,随机波动的幅度越来越小并且,趋向常数,:,随机,事件,A,发生的概率。,1.概率,(,probability,),:,描述,在,一定条件,下,,某事件发生可能性大小的度量,常用,P,来表示。,取值范围:,0,P,1。,在一定条件下,事件可分为:,必然事件,:必然发生的事件,,P,1,。,不可能事件,:一定不会发生的事件,,P,0,。,以上事件是,确定性的,,不是随机事件,但可以把它们看成随机事件的特例。,随机事件,:可能发生,也可能不会发生的事件,,0,P,1,。,分类:,古典概率,有限等可能,概率,统计概率,在,相同条件,下进行,大量重复,试,验,若事件,A,的频率逐渐稳定地趋于某个确定的,常,数,p,。,2.小概率事件:,定义:,在,一定条件,下,,发生的概率小于或等于,0.05,或,0.01,的事件。,小概率实际不发生原理:,该事件发生的可能性很小,,进而认为其在一次实验中,不可能发生,是进行统计,推断的依据,。,eg1,:,某都市大街上疾驶的汽车撞伤行人的事件的发生概率为,1/,万,但,大街上仍有行人,这是因为“被撞”事件是小概率事件,所以行人认,为自己上街这“一次试验”中不会发生“被撞”事件。,eg2,:,在跳伞界,主、副(备用)降落伞同时出现打不开的现象仅仅为,百万分之一的概率。,作 业,P,6,:,一,.1-5,二,.1-3,Thanks!,
展开阅读全文