1、医学科研设计的基本原则和方法浙江大学公共卫生学院浙江大学公共卫生学院流行病学与卫生统计学学科流行病学与卫生统计学学科余运贤余运贤Email:Email: A study is conducted to determine the effects of drinking Coca Cola on a teenagers willingness to bungee jump from frightful heights.A total of 500 teenagers is assembled on the basis of bungee-jumping status:250 are jumper
2、s,and 250 are not.Of the 250 jumpers,150 report drinking Coca Cola.Of the nonjumpers,50 report drinking Coca Cola.A majority of the nonjumpers report a preference for warm milk.练习题练习题问题该研究采用了哪种流行病学研究方法?根据是什么?如何来评估暴露变量对结局变量的效应大小?DrinkingNon-drinkingJumper150(a)100(c)Non-jumper50(b)200(d)选择课题的原则 选题是科研
3、工作第一步,也是十分重要的一步。选择集中体现了研究者的科学思维、学术水平、研究能力及其预期目的,但是选题要遵循以下原则:需要性原则 创新性原则 科学性原则 可行性原则 效益性原则 尽量选择防病治病中有重要意义或迫切需要解决的关键问题。例如:常见病多发病的防治研究、地方病、职业病、传染病、心脑血管疾病、恶性肿瘤、老年病等影响人类健康疾病的研究,以及对提高劳动者健康水平、促进医学发展的理论、基础研究。需要性原则还应符合主管部门需要需要性原则国家中长期科技发展规划纲要2006-2020 医学科研的重点范围与优先主题 安全避孕与出生缺陷防治 心脑血管病、肿瘤等重大非传染病防治 城乡社区常见多发病防治
4、中医药传承与创新发展 先进医疗设备与生物医用材料 医学科研的重大专项 重大新药创制 艾滋病和病毒性肝炎等重大传染病防治 医学科研的前沿技术 靶标发现技术 基于干细胞的人体组织工程技术 医学基础科研 脑科学与认知科学 人类健康与疾病的生物学基础 创新是科学研究的灵魂,任何成果贵在创新。“创”是指前人或他人没有研究过的题目,而不是重复别人的工作。“新”是指研究项目有独到之处,而不是公知公用、模仿抄袭的低水平重复。创新程度可有不同,但一定要有创新。对于国外引进项目,必须具有填补国内空白的价值创新性原则以辨证唯物主义为指导思想,选题必须以事实为根据,不是主观臆想。正确处理继承与发展的关系,选题不能与正
5、确的科学规律和理论相矛盾。选题必须具体和明确,反映研究者思想的清晰度与深刻性。选题设计符合科学的要求:受试对象、施加因素、观察措施和指标等选择合理,科研方法先进,统计学设计正确。具有科学价值。科学性原则 可性性是指实施科研选题的基本条件。包括人员、技术、设备、经费、信息等条件是否具备,预期的目的能否达到。预期成果可能收到的效益。一般基础研究课题要求具有理论(或知识)意义与潜在的应用价值;应用性课题要求具有经济效益或社会效益。可行性原则与效益性原则 选择课题的方法从招标范围中选题 认真阅读各级科研管理部门(包括国家、省科研计划项目)每年定期公布的项目招标指南或有关文件,从中选择适合的研究课题从实
6、际工作中选择 由于医学领域中许多问题尚未阐明,在实践工作遇到一些现象不能用已知的知识解释,对于有心计的医务工作者,可能成为原始意念,进而发展为科研选题从已有课题的延伸中选题 此类选题占有相当地比例。通过原有课题的延伸,可以使科研步步深入,取得较大的成果从文献空白点中选题 认真查阅国内外文献,全力寻找空白,把填补空白作为选题选择课题的方法从改变研究内容组合中选题 有意识地改变原有课题中受试对象、施加因素、观察指标三个要素中任何一个,可以形成新的课题从其他学科移植中选题 将其他学科新技术、新方法移植到医学领域 选择课题的方法选择课题的方法选题 设计 观察和实验(实施)资料整理和数据分析总结(论文报
7、告)提出假设提出假设研究结果研究结果检验假设检验假设科研的基本程序科研的基本程序1提出问题 选题-问题的来源实际工作的观察分析实际工作需要文献资料前人的工作各级科研管理部门定期公布的课题申请项目指南 某基层医生,在门诊工作中发现当地居民单纯性甲状腺肿的发病率很高调查该地区当地的粮、油、盐均不缺乏碘,当地的食谱也与发病不高的邻近地区相同,但饮用水源不同该地区饮用水中是否存在其它的影响碘吸收的物质?钙离子和碘离子结合形成不溶性沉淀,使碘不能被吸收;摄入高钙时,氯离子的吸收率也增加,导致碘排出量增大提出课题饮水中钙含量与地方性甲状腺肿的关系选题实例选题实例实际工作的观察分析D M ED design
8、 设计M measurement 测量E evaluation 评价科研设计的基本原则科研设计的基本原则对研究的具体内容、方法进行设想、计划与安对研究的具体内容、方法进行设想、计划与安排;科研要事先进行设计,才能排;科研要事先进行设计,才能 保证研究达到预期目的保证研究达到预期目的 可重复性(推广意义)可重复性(推广意义)精确、准确、可靠、经济精确、准确、可靠、经济临床科研为什么要设计临床科研为什么要设计专业设计专业设计:运用专业理论知识来进行:运用专业理论知识来进行设计,保证研究达到预期目的及结果设计,保证研究达到预期目的及结果的先进性、独创性的先进性、独创性统计设计统计设计:运用统计学知识
9、和方法来:运用统计学知识和方法来进行设计,解决其重复性与精确可靠、进行设计,解决其重复性与精确可靠、经济经济设计分为两个方面设计分为两个方面对对 照照随随 机机盲盲 法法重重 复复均均 衡衡科研设计的五大基本原则科研设计的五大基本原则对照的原则对照的原则对照的原则对照的原则是对试验有影响的非研究因素和试验条件均应相同或相近。在研究设计和试验过程中应从下列四个方面在研究设计和试验过程中应从下列四个方面组间均衡性:比较各组间除研究因素外,比较各组间除研究因素外,考虑组间考虑组间均衡性:均衡性:1.研究对象性质相同研究对象性质相同2.试验条件要一致试验条件要一致 实验环境实验环境 仪器仪器 试剂试剂
10、 3.研究者或操作者要一致研究者或操作者要一致 交叉交叉 随机分配随机分配对照原则:对照种类空白对照 对照组不施加任何处理措施标准对照 公认有效的药物、现有的标准方法或常规方法相互对照 各比较组互为对照实验对照 在对实验组实施处理因素时必须伴随一个对试验有影响的因素,此因素称为实验因素,对照组必须施加实验因素。举例说明对照原则:对照种类自身对照:对照与实验措施在同一实验对象身上实施。安慰剂对照:对照组施加安慰剂。阳性对照:采用已肯定疗效的药物为对照,如标准对照、弱阳性对照。阴性对照:不含研究中处理因素的对照,如空白对照、安慰剂对照、(实验对照)。历史对照:不是实验研究中的对照。随机化原则u保证
11、各组间均衡可比的重要手段u在实验研究中,研究对象有同等的可能被分到比较各组中去u在调查研究中,总体中每个个体有同等的可能被抽到样本中来u随机数字表、随机排列表和计算机产生的随机数抽样方法抽样方法什么是抽样?什么是抽样?抽样是通过抽取总体中的部分单位,收集这些抽样是通过抽取总体中的部分单位,收集这些单位的信息,从而对总体进行推断的一种手段。单位的信息,从而对总体进行推断的一种手段。抽样方式概率抽样简单随机抽样分层抽样等比例抽样等距抽样整群抽样多阶段抽样非概率抽样方便抽样判断抽样滚雪球抽样自愿抽样配额抽样非概率抽样(non-probability sampling)非概率抽样含义:相对于概率抽样而
12、言抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查有随意抽样、判断抽样、志愿参加者抽样、滚雪球抽样、配额抽样、修正的概率抽样等方式 非概率抽样的应用范围和优缺点应用的条件:形成一种想法;形成一种想法;作为设计开发概率抽样调查的初始步骤;作为设计开发概率抽样调查的初始步骤;在后续步骤中帮助理解概率抽样调查结果;在后续步骤中帮助理解概率抽样调查结果;优点:快速简便;费用低廉;快速简便;费用低廉;不需要规范的抽样框;不需要规范的抽样框;对探索性研究和调查的设计开发有用;对探索性研究和调查的设计开发有用;缺点主观性,使结果有偏差;主观性,使结果有偏
13、差;无抽样框,不可能计算各个元素的入样概率,无法得到可靠的估计无抽样框,不可能计算各个元素的入样概率,无法得到可靠的估计值及抽样误差估计值,不能推断总体。值及抽样误差估计值,不能推断总体。调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在门诊等公共场所进行拦截调查调查员在门诊等公共场所进行拦截调查优点:容易实施,调查的成本低缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体方便抽样(随意抽样)自愿样本被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息例如,参与前列腺癌的研究,主动联系研究者要参与该项研究的,都属于自愿样本自愿样本与抽样的随
14、机性无关样本是有偏的不能依据样本的信息推断总体判断抽样研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本;有重点抽样,典型抽样,代表抽样等方式判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性;抽样成本比较低,容易操作;样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体。配额抽样先将群体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位;操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似;抽取具体样本单位时,不是依据随机原则,属于非概率抽样。滚雪球
15、抽样先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。在食物过敏研究中,就诊的患者家庭入选未研究对象后,让她们邀请同学和朋友来参加该项目。适合于对稀少群体和特定群体研究优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低修正的概率抽样是概率与非概率抽样的结合。如:前阶段用概率抽样,后阶段使用非概率抽样。先用概率抽样抽地区,后在每个地区内进行配额抽样。概率抽样(probability sampling)概率抽样也称随机抽样特点按一定的概率以随机原则抽取样本按一定的概率以随机原则
16、抽取样本抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可可以以计算出来的计算出来的。当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑虑到每个样本单位被抽中的概率。到每个样本单位被抽中的概率。应用范围:对总体最好估计用简单随机抽样;如果费用充足,用整群抽样;如果对总体推断,用分层抽样。优缺点优点:能用相对小的样本对总体作推断;缺点:复杂、费时、费钱,创建抽样框成本高;概率样本地理分布广,数据收集成本高。应用范围、优缺点应用范围、优缺点简单随机抽样(simple random
17、 sampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的。最基本的抽样方法,是其它抽样方法的基础。特点简单、直观,在抽样框完整时,可直接从中抽取样本;用样本统计量对目标量进行估计比较方便。局限性当N很大时,不易构造抽样框;抽出的单位很分散,给实施调查增加了困难;没有利用其它辅助信息以提高估计的效率。抽签法和利用随机数表抽签法和利用随机数表等距抽样(机械抽样)等距抽样(机械抽样)定义定义:将总体单位按某一标志排序,而后按一定:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。的间隔抽取样本单位。(总体单位按某一标志排序)(总体单位按某一标志排序)例例例
18、例:从从从从19001900人人人人中中中中抽抽抽抽取取取取190190人人人人,抽抽抽抽样样样样比比比比为为为为190/1900190/1900,可可可可以以以以先先先先在在在在1-101-10间间间间选选选选取取取取一一一一个个个个随随随随机机机机数数数数字字字字,比比比比如如如如4 4,下下下下一一一一个个个个为为为为1414,2424,3434,优缺点优点:样本分布好,比简单随机抽样简单。缺点:如果抽样间隔正好碰上总体的未知的周期性,就会得到“差的”样本;当N不能被n整除时,样本量不好确定。类型抽样(分层抽样)类型抽样(分层抽样)定义:将总体全部单位定义:将总体全部单位分层分层,形成若
19、干个层,后,形成若干个层,后从从各层中分别抽取样本单位各层中分别抽取样本单位,合成样本。,合成样本。总体总体N最优分配最优分配样本样本n等额分配等额分配等比例分配等比例分配优点:保证样本的结构与总体的结构比较相近,能提高对总体估计值的精度;能保证样本的代表性;操作与管理简单;在不同的层可以用不同的抽样框和抽样方法。缺点:要求抽样框中所有元素有高质量、能用于分层的辅助信息;调查框的创建更复杂;估计值的计算更复杂。优缺点整群抽样整群抽样(cluster samplingcluster sampling)定定义义:将将总总体体全全部部单单位位分分为为许许多多个个“群群”,然然后后随随机机抽抽取取若若
20、干干“群群”,对对被被抽抽中中的的各各“群群”内内的所有单位登记调查。的所有单位登记调查。例:例:例:例:总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量ABCDEFGHIJKLMNOPLHPD整群抽样优缺点整群抽样优缺点n优点:优点:n抽样时只需群的抽样框,可简化工作量,降低费抽样时只需群的抽样框,可简化工作量,降低费用;用;n当总体单位自然成群时,抽样简单;当总体单位自然成群时,抽样简单;n当群内单位差异大,群间差异小时,效率更高。当群内单位差异大,群间差异小时,效率更高。n缺点:缺点:n群内单位差异小,群间差异大时,效率不高;群内单位差异小,群间差异大时,效率不高;n无
21、法提前知道总样本量;无法提前知道总样本量;n调查组织和方差估计比简单随机抽样复杂。调查组织和方差估计比简单随机抽样复杂。多阶段抽样(multi-stage sampling)先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查;群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样。具有整群抽样的优点,保证样本相对集中,节约调查费用;需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开;在大规模的抽样调查中,经常被采用的方法。例如例如,某市有某市有2323个区个区,共共714
22、714万人万人,从中抽取从中抽取10001000人的样本人的样本,将区作为初级抽样单位将区作为初级抽样单位,每区人数每区人数不等不等,把每区人数的号码范围列出把每区人数的号码范围列出,东区是东区是1-1-120000120000号号,西区是西区是120001-270000120001-270000号号.一直排到一直排到71400007140000号号.从这些号码中用随机数字表确定从这些号码中用随机数字表确定1010个个号码号码,则这则这1010个号码所落入的区即为调查区个号码所落入的区即为调查区.如抽如抽中中340000340000号号,它落在南区它落在南区,则南区为调查区则南区为调查区,从这
23、从这1010个调查区中个调查区中,每区再随机抽取每区再随机抽取100100人就构成最终样人就构成最终样本本.多阶段抽样特别适用于调查范围大多阶段抽样特别适用于调查范围大,单位多单位多,情情况复杂的调查对象况复杂的调查对象,但多阶段抽样由于在每一阶段但多阶段抽样由于在每一阶段抽样是都会产生误差抽样是都会产生误差,因此经多阶段抽样得到的样因此经多阶段抽样得到的样本的误差也相应增大本的误差也相应增大.这是它的不足之处这是它的不足之处.缺点没有简单随机抽样的统计效率高;不能提前知道多阶段抽样的样本量;调查的组织比较复杂;估计值与抽样方差的计算比较复杂抽样技术的选择是否要以样本的结果作为基础推断总体?如
24、果是,则用概率抽样;是否有总体所有单位的名录?如果无,则用整群或多阶段抽样;如果有,则用简单随机抽样。调查是否要求在一个相当大的区域面访?如果是,则用二阶段抽样。总体单位是否自然形成群体,或是否有群体名录?如果有,则用一阶段或多阶段整群抽样。抽样框是否有能用作分层(如年龄、性别、省份、收入)或大小度量(如家庭规模)的辅助信息?如果有,则用分层抽样。如有准确且与主要调查指标相关的大小度量,则使用与规模成比例的概率抽样。重复原则(样本含量)意义 样本含量少,抽样误差大,样本含量大,非抽样误差也可能大;组间均衡性、实验结果的可靠性和重现性;概念 保证研究结论具有一定可靠性的前提条件下,所确定的最少样
25、本含量;考虑因素应用范围与人力、物力和财力;方法 查表法或计算法前提条件 允许误差、总体变异、资料类型与设计类型。样本大小估计的参数样本大小估计的前提条件(决定参数)允许误差:研究者提出的希望发现或允许控制的样本与总体或两样本间差别大小;如=|X1-X2|,=|X-|,=|p-|;和 大小已知或单双侧、设计类型、指标类型四、盲法p单盲、双盲、三盲p盲法的目的是什么?五、均衡原则p保证基线可比处理因素处理因素非处理因素非处理因素对象对象 O O效应效应误差误差 E E e eT TNTNT测测 量量 结结 果果 研究设计的本质研究设计的本质因素的性质因素的性质 外加、干预外加、干预 (给与或消除
26、)(给与或消除)固有、特征固有、特征 (性别、年龄(性别、年龄 遗传、个性等)遗传、个性等)行为、习惯行为、习惯 (人为、可变)(人为、可变)科研设计基本要素科研设计基本要素-研究因素研究因素 或或 处理因素处理因素单一因素单一因素 同一水平(等级)同一水平(等级)多个因素多个因素 不同水平(多水平)不同水平(多水平)把握主要因素把握主要因素交互作用交互作用 interaction interaction 协同作用协同作用 synergismsynergism拮抗作用拮抗作用 antagonismantagonism 因素的数量因素的数量诊断标准诊断标准 公认标准公认标准 自定标准自定标准排除
27、标准排除标准 哪些疾病哪些疾病/情况情况 /征候不宜征候不宜 如重病如重病 相似疾病相似疾病 孕妇孕妇 禁忌症禁忌症纳入标准纳入标准 根据研究目的根据研究目的科研设计基本要素科研设计基本要素-研究对象的确定研究对象的确定n让对象可能获得最大疗效让对象可能获得最大疗效n具有代表数(样本量)具有代表数(样本量)n均衡性(个体差异小)均衡性(个体差异小)n依从性依从性n志愿者志愿者 VolunteerVolunteer科研设计基本要素科研设计基本要素-研究对象的要求研究对象的要求n内涵明确(判定标准)内涵明确(判定标准)n标准化标准化n灵敏性灵敏性n特异性特异性n关联性关联性n易于质量控制易于质量控
28、制科研设计基本要素科研设计基本要素-指标的要求指标的要求测量(Measurement)n测量见于临床研究诸环节测量见于临床研究诸环节n临床症状与体征临床症状与体征n定性和定量描述定性和定量描述n各种化验和检查的数据各种化验和检查的数据避 免 误 差n为获得较准确的结果应实施严格为获得较准确的结果应实施严格的质量控制:的质量控制:方法的标准化方法的标准化仪器的校正仪器的校正数据的校验数据的校验资料整理数据录入:数据库文件Epi info、dBASE、FoxBASE、Lotus;Excel文件等;数据核查:1.专业检查专业检查:男性患者的调查表中不应出现妇科疾病等;从专业的角度对资料的一致性进行检
29、查,比如诊断和疗效的评定标准是否统一,胃镜下萎缩性胃炎的严重程度的评定标准是否一致等。2.逻辑检查逻辑检查:比如退休时的年龄不应出现小于20岁;六岁的孩子不应有大学文化程度。3.统计检查统计检查:检查报表(或报告卡)的纵向,横向的合计和总的合计是否吻合。体重8.5(公斤),身高69.0(cm),头围44.0(cm),胸围42.5(cm),坐高43.0(cm)。理论上算,这五个数据都是以0或5结尾可能性0.032%资料整理数据的真实性:双人双次录入;利用统计图;数据离群值的识别:离群值是指各变量中与整体数据相距太远的极值,由于它的夸大作用,常常会歪曲统计结果,导致犯一类和二类错误.利用统计图:柱
30、状图、箱丝图、茎叶图、正态检验的QQ图等检测.不符合逻辑的要剔除;剔除前后进行分析比较;利用散点图查找异常值BMI与年龄的散点图与年龄的散点图BMI的直方图的分布已知已知已知已知总体分布类型总体分布类型总体分布类型总体分布类型,对,对,对,对未知参数进行统计推断未知参数进行统计推断未知参数进行统计推断未知参数进行统计推断依赖于特定分布类依赖于特定分布类依赖于特定分布类依赖于特定分布类型,型,型,型,比较的是比较的是比较的是比较的是参数参数参数参数 参数检验参数检验 (parametric testparametric test)非参数检验非参数检验 (nonparametric testnon
31、parametric test)对总体的分布类型对总体的分布类型对总体的分布类型对总体的分布类型不作严格要求不作严格要求不作严格要求不作严格要求 不受分布类型的影响,不受分布类型的影响,不受分布类型的影响,不受分布类型的影响,比比比比较的是较的是较的是较的是总体分布位置总体分布位置总体分布位置总体分布位置 优点:优点:优点:优点:方法简便、易学易用,易于推广使用、方法简便、易学易用,易于推广使用、方法简便、易学易用,易于推广使用、方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值如等级资料,或含数值如等级资料,或含数值如等级资料,或含数值“50mg”50mg”等等等等 )缺点:缺点:方法比较粗糙,对于符合参数检验条件者,采用方法比较粗糙,对于符合参数检验条件者,采用非参数检验非参数检验会损失部分信息,其检验效能较低会损失部分信息,其检验效能较低;样本含;样本含量较大时,两者结论常相同量较大时,两者结论常相同谢 谢