收藏 分销(赏)

医学研究数据管理与分析.ppt

上传人:精**** 文档编号:2752432 上传时间:2024-06-05 格式:PPT 页数:246 大小:5.50MB 下载积分:20 金币
下载 相关 举报
医学研究数据管理与分析.ppt_第1页
第1页 / 共246页
医学研究数据管理与分析.ppt_第2页
第2页 / 共246页


点击查看更多>>
资源描述
医学研究数据管理医学研究数据管理与分析与分析数据决策2 2The basic purpose of epidemiology is to help us understand and prevent a wide The basic purpose of epidemiology is to help us understand and prevent a wide variety of health and safety problems.variety of health and safety problems.For example,as a result of epidemiological studies,we instituted a number of For example,as a result of epidemiological studies,we instituted a number of prevention and intervention programs that helped lower the rate of deaths from lung prevention and intervention programs that helped lower the rate of deaths from lung cancer.(And epidemiologists statistically showed that these programs had an effect cancer.(And epidemiologists statistically showed that these programs had an effect on lowering the death rate.)on lowering the death rate.)3 34 4伦敦霍乱死亡者居住地点分布伦敦霍乱死亡者居住地点分布伦敦霍乱死亡者居住地点分布伦敦霍乱死亡者居住地点分布5 5 f f(t t)=(=(标准正态曲线标准正态曲线标准正态曲线标准正态曲线)=5=5 =1=10.10.10.20.2-4-4-3-3-2-2-1-10 01 12 23 34 40.30.3正态分布正态分布6 6偏态分布0 01 12 23 34 45 50.00.00.20.20.40.40.60.60.80.81.01.07 7=?2 2=175.07cm=175.07cm j j=172.50cm=172.50cm n=140 n=140 n=140 n=140 n=140 n=140 1 1=173.86cm=173.86cm 总体估计总体估计8 8了解抽样误差规律的重要性总体同质个体、个体变异总体参数未知样本代表性、抽样误差随机随机抽样抽样样本统计量已知统计统计推断推断风风 险险9 9正常人正常人病人病人假阳性率假阳性率假阴性率假阴性率正常人及病人的数据分布重叠示意图(单侧)1010正常人正常人病人病人假阳性率假阳性率假阴性率假阴性率正常人及病人的数据分布重叠示意图(单侧)1111正常人正常人病人病人假阳性率假阳性率假阴性率假阴性率病人病人正常人及病人的数据分布重叠示意图(双侧)1212红细胞计数红细胞计数(RBC)参考值范围参考值范围成年男性:4.05.5(1012/L)成年女性:3.55.0(1012/L)新 生 儿:6.07.0(1012/L)1313白细胞计数参考值范围白细胞计数参考值范围成年:4.010.0(109/L)新生儿:15.020.0(109/L)6个月2岁:11.012.0(109/L)1414医院血常规正常值范围医院血常规正常值范围检查项目检查项目正常值范围正常值范围单位单位 血红蛋白(HGB)120160g/L红细胞计数(RBC)3.55.51012/L白细胞计数(WBC)4.010.0109/L 血小板计数(PLT)100300109/L1515医院生化检验参考值范围医院生化检验参考值范围检查项目检查项目正常值范围正常值范围单位单位肌酐(Crea)36144 mol/L尿素氮(Urea)2.17.2mmol/L谷草转氨酶(AST)45U/L谷丙转氨酶(ALT)45U/L1616参考值范围的特点参考值范围的特点及种族有关与年龄、性别有关与环境、气候有关与仪器本身有关不同的医院,参考值范围不同1717第一部分数据管理及分析概述1818一、调查研究设计思路及统计分析步骤的关系搜集资料搜集资料搜集资料搜集资料整理及分析资料整理及分析资料整理及分析资料整理及分析资料调查(研究)项目调查(研究)项目调查(研究)项目调查(研究)项目分析表(指标)分析表(指标)分析表(指标)分析表(指标)研究目的研究目的研究目的研究目的统计分析步骤统计分析步骤调查研究步骤调查研究步骤设 计 思 路设 计 思 路exposureexposure(factorfactor)DiseaseorhealthDiseaseorhealth第一节 研究设计及数据的管理及分析1919二、调查研究计划的制订和数据管理分析(一)明确调查和研究的目的了解参数,用以说明总体。描述分布,确定生理、生化等正常值;研究变量间的关系,通过确立统计学联系来验证因果联系(包括干预处理及效应的关系)。(二)确定观察对象和观察单位 根据调查和研究的目的和指标,确定观察对象和观察单位2020(三)调查和研究设计类型的选择主要取决于研究目的和客观条件的限制。1调查和研究设计的常用类型(1)描述性研究:包括普查、抽样调查和案例调查、病例分析等(2)分析性研究:包括病例对照研究、队列研究。(3)实验性研究:包括临床试验、现场实验和社区干预等。2实验设计类型2121(四)确定调查研究项目和调查表1调查和研究的项目 包括分析项目、备选项目。2调查表和原始记录表的设计(五)样本含量的估计 样本含量大小主要取决于研究单位的变异大小、两组或多组可能差异的大小、精确性的要求、第一类错误和第二类错误的设定。不同研究设计可用各自样本含量计算公式来估计。一般实际样本大于理论样本。Epi Info、EpiCalc、ps等。Power and sample size正交设计助手2222样本含量估计1(EpiCalc2000)2323样本含量估计2(EpiCalc2000)2424样本含量估计3(EpiCalc2000)25252626临床研究临床研究患者为对象患者为对象序贯法序贯法变异变异疗效疗效 PowerPower(1-1-)动物为对象动物为对象应用推广应用推广风险评估风险评估随访随访2727(六)收集原始资料的方式和数据(六)收集原始资料的方式和数据的类型的类型 原始资料的收集方式原始资料的收集方式原始资料的收集方式原始资料的收集方式直接观察法:包括体检、标本检测等。直接观察法:包括体检、标本检测等。直接观察法:包括体检、标本检测等。直接观察法:包括体检、标本检测等。采访法:面访、调查会及信访、电话访问等采访法:面访、调查会及信访、电话访问等采访法:面访、调查会及信访、电话访问等采访法:面访、调查会及信访、电话访问等医学研究的数据类型医学研究的数据类型医学研究的数据类型医学研究的数据类型 医学研究数据大体上可分为三种类型:定量医学研究数据大体上可分为三种类型:定量医学研究数据大体上可分为三种类型:定量医学研究数据大体上可分为三种类型:定量数据、等级数据和名义数据。数据、等级数据和名义数据。数据、等级数据和名义数据。数据、等级数据和名义数据。定量数据:定量数据:定量数据:定量数据:等级数据:等级数据:等级数据:等级数据:名义数据:名义数据:名义数据:名义数据:等级数据和名义数据也称定性数据或计数资料。等级数据和名义数据也称定性数据或计数资料。等级数据和名义数据也称定性数据或计数资料。等级数据和名义数据也称定性数据或计数资料。2828血糖不同数据类型的分析方法血糖不同数据类型的分析方法定量数据:空腹血糖(定量数据:空腹血糖(mmol/L)等级数据:等级数据:专业分组:专业分组:空腹血糖受损空腹血糖受损糖尿病糖尿病统计学分组:统计学分组:百分位数百分位数参考值范围参考值范围2929血糖分析注意事项血糖分析注意事项研究对象影响因素分布及定量资料分析是否分组的考虑分组的方法3030思考题血压研究血压研究研究对象研究对象影响因素影响因素分布及定量资料分析分布及定量资料分析是否分组的考虑是否分组的考虑分组的方法分组的方法3131(七)调查和研究的质量控制(七)调查和研究的质量控制质量控制是决定医学研究结果真实性和可靠质量控制是决定医学研究结果真实性和可靠性的关键。性的关键。归纳、比较、推理及科学性归纳、比较、推理及科学性系统误差(系统误差(systematic error),即偏倚),即偏倚(bias),包括选择性偏倚、信息偏倚和混),包括选择性偏倚、信息偏倚和混杂偏倚三类。杂偏倚三类。医学研究的质量控制即是控制这三类偏倚。医学研究的质量控制即是控制这三类偏倚。3232(八)数据资料的录入及整理v录入前的检查、核对、录入的质量控制v资料录入,建立databasev录入后的核对、分组、编码等。3333数据录入录入计算机,建立数据库(录入计算机,建立数据库(databasedatabase)可以通过统计分析软件和数据库软件录入。常用的可以通过统计分析软件和数据库软件录入。常用的软件有:软件有:Epi InfoEpi Info、EpiDataEpiData、SPSSSPSS、FoxBaseFoxBase、FoxProFoxPro、Visual FoxProVisual FoxPro(VFPVFP)、)、AccessAccess、ExcelExcel和和LotusLotus等。等。推荐应用推荐应用EpiDataEpiData软件录入数据。软件录入数据。3434Epidata3.03535录入后处理v 逻辑核对:v数据的编码和转换:v建立新变量3636研究数据处理过程DataDataEpidataEpidataSPSSSPSSQuestionnaireQuestionnaireFile(*.qes)File(*.qes)File(*.rec)File(*.rec)File(*.sav)File(*.sav)File(*.dat)File(*.dat)File(*.dbf)File(*.dbf)Foxpro,vfp,excellFoxpro,vfp,excellEpicalculatorEpicalculatorsamplesampleanalysisanalysis3737三、数据分析统计描述统计描述统计推断统计推断1 1定量数据的描述定量数据的描述 (1 1)集中和离散趋势)集中和离散趋势(2 2)正常值范围和总体可信)正常值范围和总体可信区间的估计区间的估计 2 2定性数据的统计描定性数据的统计描述:各种相对指标述:各种相对指标:率和比,如发病率、率和比,如发病率、病死率、罹患率、二病死率、罹患率、二代发病率、平均抗体代发病率、平均抗体滴度、保护率、效果滴度、保护率、效果指数、标化死亡比等。指数、标化死亡比等。1 1假设检验假设检验 (1 1)定量数据)定量数据)定量数据)定量数据 t t 检验检验检验检验方差分析(方差分析(方差分析(方差分析(ANOVAANOVA):):):):(2)(2)定性数据定性数据定性数据定性数据X2X2检验、检验、检验、检验、U U检验检验检验检验2 2变量之间的关系分析变量之间的关系分析 (1 1)相关分析)相关分析(2 2)回归分析)回归分析(3 3)定性数据之间得关系分析)定性数据之间得关系分析 数学模型数学模型Reed-FrostReed-Frost模型模型 3838定量数据统计描述方法小结定量定量数据数据中位中位位置位置正态分布正态分布均数均数非正态分布非正态分布对数正对数正态分布态分布几何几何均数均数其它分布其它分布中位数中位数离散度离散度标准差标准差变异系数变异系数均数相差大均数相差大 单位不同单位不同的比较的比较 3939定性数据统计描述方法小结定性定性数据数据二分类二分类率率 多分类多分类名义变量名义变量构成比构成比等级变量等级变量构成比、平均得分构成比、平均得分联系联系比值比比值比OROR各种设计各种设计对比对比相相对对危危险险度度RRRR队列研究设计队列研究设计患病比患病比横断面研究设计横断面研究设计4040(二)统计推断 1、假设检验 定量数据 t检验:样本均数及总体均数比较 配对设计资料均数比较 成组设计两样本均数比较 方差分析(ANOVA):成组设计多个样本均数的比较(one-way ANOVA)配伍组设计多个样本均数比较(two-way ANOVA)多个样本均数的两两比较(q检验,Student-Newman-Keuls法)多个实验组和一个对照组均数间的两两比较(LSD法和Duncan法)4141配对配对比较比较正态正态配对配对t t检验检验 非正态非正态数据转换数据转换 非参数成对比较非参数成对比较符号检验符号检验符号等级检验(符号等级检验(WilcoxonWilcoxon法)法)两组两组比较比较正态正态成组比较成组比较t t检验检验 非正态非正态数据转换数据转换 非非参参数数成成组比较组比较两样本等级秩和检验两样本等级秩和检验WilcoxonMannandWhitneyWilcoxonMannandWhitney法法配配 伍伍组组比较比较正态正态随机区组随机区组ANOVAANOVA多重比较多重比较非正态非正态数据转换数据转换非参数配伍组比较非参数配伍组比较-M-M检验检验(FriedmanFriedman法)法)多组多组比较比较正态正态完全随机设计完全随机设计ANOVAANOVA多重比较多重比较非正态非正态数据转化数据转化非参数多组比较非参数多组比较-H-H检验检验(KruskalandWallisKruskalandWallis法)法)定量数据差别的统计意义检验小结定量数据差别的统计意义检验小结 4242第二节 医学研究的数据管理和分析应遵循的原则 一、重视研究数据资料的处理过程一、重视研究数据资料的处理过程 保证被分析数据的正确性,和获得的客观结果尽可能保持一保证被分析数据的正确性,和获得的客观结果尽可能保持一致,控制信息偏倚;致,控制信息偏倚;使原始数据经过编码、转换、重新赋值后符合进一步统计分使原始数据经过编码、转换、重新赋值后符合进一步统计分析的需要。析的需要。二、选择合适的统计分析方法和指标二、选择合适的统计分析方法和指标 取决于数据及其分布得类型取决于数据及其分布得类型 (一)数据转换(一)数据转换(二)正态性检验(二)正态性检验(三)非参数统计法(三)非参数统计法 (四)分析指标的选择(四)分析指标的选择 434344444545三、忠实于原始数据是必须具备的科学精神 医医医医学学学学研研研研究究究究的的的的结结结结果果果果和和和和客客客客观观观观现现现现实实实实之之之之间间间间,总总总总会会会会存存存存在在在在或或或或多多多多或或或或少少少少的的的的不不不不一一一一致(即误差,致(即误差,致(即误差,致(即误差,errorerror)随机误差随机误差随机误差随机误差 系统误差系统误差系统误差系统误差 医医医医学学学学研研研研究究究究过过过过程程程程中中中中,应应应应尽尽尽尽量量量量通通通通过过过过科科科科学学学学的的的的设设设设计计计计和和和和严严严严格格格格的的的的质质质质量量量量控控控控制制制制措施,控制系统误差。措施,控制系统误差。措施,控制系统误差。措施,控制系统误差。任任任任何何何何篡篡篡篡改改改改研研研研究究究究数数数数据据据据的的的的行行行行为为为为,不不不不管管管管出出出出自自自自什什什什么么么么目目目目的的的的,都都都都违违违违背背背背科科科科学学学学精神。精神。精神。精神。4646第三节 不同研究设计类型的统计分析方法和指标选择一、病例报告一、病例报告/个案调查个案调查二、病例对照研究二、病例对照研究三、随访研究三、随访研究4747一、抽样调查一、抽样调查(一)分析思路和指标(一)分析思路和指标描述抽样方法,设计样本量、调查样本量、描述抽样方法,设计样本量、调查样本量、应答率等。应答率等。计算有关统计指标计算有关统计指标描述疾病或健康状态的分布描述疾病或健康状态的分布分析性描述分析性描述结果解释及注意事项结果解释及注意事项4848抽样调查结果及结论及其解释结果解释结果解释一般先说明样本的代表性、应答率等情况,一般先说明样本的代表性、应答率等情况,分析调查中有无偏倚及其来源、大小、方向和分析调查中有无偏倚及其来源、大小、方向和调整方法,调整方法,归纳疾病或健康状态分布规律的正确性及可能归纳疾病或健康状态分布规律的正确性及可能提供的病因线索。提供的病因线索。注意事项注意事项现况研究资料分析结果的价值,取决于资料质现况研究资料分析结果的价值,取决于资料质量的优劣和分组、归纳方法是否恰当,尤其是量的优劣和分组、归纳方法是否恰当,尤其是偏倚的影响至关重要。偏倚的影响至关重要。在和其它地区进行疾病频率比较时,必须考虑在和其它地区进行疾病频率比较时,必须考虑到年龄等非研究因素的影响,需将疾病频率按到年龄等非研究因素的影响,需将疾病频率按标准人口构成标准化后才具有可比性。标准人口构成标准化后才具有可比性。4949第四节 医学研究数据分析结果的解释 1 1遵循科学的思维逻辑遵循科学的思维逻辑2 2了解不同研究设计的效率了解不同研究设计的效率3 3遵循概率论的基本原则遵循概率论的基本原则4 4树立对比的观点树立对比的观点5 5深刻理解统计学联系的本质深刻理解统计学联系的本质一、数据分析结果解释应遵循的原则一、数据分析结果解释应遵循的原则5050二、统计学联系的本质二、统计学联系的本质 真实的联系真实的联系 机遇(机遇(chancechance)偏倚(偏倚(biasbias)三、解释的思路三、解释的思路 统计学统计学 逻辑学逻辑学 生物医学生物医学5151第五节 质量控制设计前设计预试验/调查实施/实验数据录入数据核查、整理合适的统计方法合理表达结果结果解释结论5252质量控制质量控制1数据录入数据录入软件选择高效、准确、易学准确双份录入范围设定必须输入有效性检查高效跳转、重复、标签数据便于管理及转换5353质量控制质量控制2数据核查、整理数据核查、整理核查排序缺失处理逻辑校对整理合并转换重新编码加权产生新指标5454质量控制质量控制3统计分析方法统计分析方法重视数据挖掘简单易懂多重比较及有序性分层多因素分析交互作用5555质量控制质量控制4合理表达结果合理表达结果结果不是结论一般描述指标检验统计量及P值统计表统计图5656质量控制质量控制5结果解释及评价结果解释及评价研究范围结果准确性结果可靠性有无其它原因可以解释影响结果的因素5757质量控制质量控制6结论结论严谨客观性、合理性可应用性局限性5858第二部分数据管理和统计分析的实现过程5959第一章随机化及样本含量计算6060随机化过程随机化过程随机化过程随机化过程随机抽样随机抽样随机抽样随机抽样随机分组随机分组随机分组随机分组样本量的估算样本量的估算样本量的估算样本量的估算研究功效的估算研究功效的估算研究功效的估算研究功效的估算61611 1张训张训张训张训2 2吴明吴明吴明吴明3 3李娜李娜李娜李娜4 4王金华王金华王金华王金华5 5王大勇王大勇王大勇王大勇6 6龚向荣龚向荣龚向荣龚向荣7 7胡玉胡玉胡玉胡玉8 8和平和平和平和平9 9刘平刘平刘平刘平1010黎明黎明黎明黎明1111李小林李小林李小林李小林1212李勇李勇李勇李勇1313陈泳陈泳陈泳陈泳1414向丽娜向丽娜向丽娜向丽娜1515吕明海吕明海吕明海吕明海1616吴大维吴大维吴大维吴大维1717王菲王菲王菲王菲1818窦唯窦唯窦唯窦唯1919周润发周润发周润发周润发2020张惠妹张惠妹张惠妹张惠妹2121章子怡章子怡章子怡章子怡2222刘玉文刘玉文刘玉文刘玉文2323周结伦周结伦周结伦周结伦2424韩红韩红韩红韩红2525林忆莲林忆莲林忆莲林忆莲2626梅艳芳梅艳芳梅艳芳梅艳芳2727刘嘉玲刘嘉玲刘嘉玲刘嘉玲2828张曼玉张曼玉张曼玉张曼玉2929张柏芝张柏芝张柏芝张柏芝3030周迅周迅周迅周迅3131巩俐巩俐巩俐巩俐3232刘晓庆刘晓庆刘晓庆刘晓庆3333瞿颖瞿颖瞿颖瞿颖3434刘德华刘德华刘德华刘德华3535刘青云刘青云刘青云刘青云3636梁朝伟梁朝伟梁朝伟梁朝伟3737杨家辉杨家辉杨家辉杨家辉3838钟镇涛钟镇涛钟镇涛钟镇涛3939刘松仁刘松仁刘松仁刘松仁4040汤镇业汤镇业汤镇业汤镇业4141汤镇宗汤镇宗汤镇宗汤镇宗4242孙楠孙楠孙楠孙楠4343张艺谋张艺谋张艺谋张艺谋4444冯小刚冯小刚冯小刚冯小刚4545雪村雪村雪村雪村4646英打英打英打英打4747赵本山赵本山赵本山赵本山4848催永远催永远催永远催永远EpiCalcEpiCalcSampleSampleRandom numbersRandom numbersListList随机抽样随机抽样随机抽样随机抽样6262EpiCalc 2000EpiCalc 20006363EpiCalc 2000EpiCalc 200064641 1张训张训张训张训2 2吴明吴明吴明吴明3 3李娜李娜李娜李娜4 4王金华王金华王金华王金华5 5王大勇王大勇王大勇王大勇6 6龚向荣龚向荣龚向荣龚向荣7 7胡玉胡玉胡玉胡玉8 8和平和平和平和平9 9刘平刘平刘平刘平1010黎明黎明黎明黎明1111李小林李小林李小林李小林1212李勇李勇李勇李勇1313陈泳陈泳陈泳陈泳1414向丽娜向丽娜向丽娜向丽娜1515吕明海吕明海吕明海吕明海1616吴大维吴大维吴大维吴大维1717王菲王菲王菲王菲1818窦唯窦唯窦唯窦唯1919周润发周润发周润发周润发2020张惠妹张惠妹张惠妹张惠妹2121章子怡章子怡章子怡章子怡2222刘玉文刘玉文刘玉文刘玉文2323周结伦周结伦周结伦周结伦2424韩红韩红韩红韩红2525林忆莲林忆莲林忆莲林忆莲2626梅艳芳梅艳芳梅艳芳梅艳芳2727刘嘉玲刘嘉玲刘嘉玲刘嘉玲2828张曼玉张曼玉张曼玉张曼玉2929张柏芝张柏芝张柏芝张柏芝3030周迅周迅周迅周迅3131巩俐巩俐巩俐巩俐3232刘晓庆刘晓庆刘晓庆刘晓庆3333瞿颖瞿颖瞿颖瞿颖3434刘德华刘德华刘德华刘德华3535刘青云刘青云刘青云刘青云3636梁朝伟梁朝伟梁朝伟梁朝伟3737杨家辉杨家辉杨家辉杨家辉3838钟镇涛钟镇涛钟镇涛钟镇涛3939刘松仁刘松仁刘松仁刘松仁4040汤镇业汤镇业汤镇业汤镇业4141汤镇宗汤镇宗汤镇宗汤镇宗4242孙楠孙楠孙楠孙楠4343张艺谋张艺谋张艺谋张艺谋4444冯小刚冯小刚冯小刚冯小刚4545雪村雪村雪村雪村4646英打英打英打英打4747赵本山赵本山赵本山赵本山4848催永远催永远催永远催永远6565SPSSSPSSDataDataSelect casesSelect casesRandom sample of Random sample of casescases留意种子数留意种子数留意种子数留意种子数6666简单随机分组简单随机分组简单随机分组简单随机分组6767EpiCalc 2000EpiCalc 20006868EpiCalc 2000EpiCalc 20006969估计样本量的意义估计样本量的意义估计样本量的意义估计样本量的意义过小过小过小过小:抽样误差大、代表性差、不易得出有意义抽样误差大、代表性差、不易得出有意义抽样误差大、代表性差、不易得出有意义抽样误差大、代表性差、不易得出有意义的结果的结果的结果的结果过大过大过大过大:不必要的浪费不必要的浪费不必要的浪费不必要的浪费7070预期的现患率预期的现患率预期的现患率预期的现患率:越高,所需样本量越小越高,所需样本量越小越高,所需样本量越小越高,所需样本量越小对调查结果精确性的要求对调查结果精确性的要求对调查结果精确性的要求对调查结果精确性的要求:允许误差越大,所允许误差越大,所允许误差越大,所允许误差越大,所需样本量越小需样本量越小需样本量越小需样本量越小现况研究现况研究影响样本含量的因素影响样本含量的因素影响样本含量的因素影响样本含量的因素7171 某卫生防疫站拟调查了解该地成人白细胞数某卫生防疫站拟调查了解该地成人白细胞数某卫生防疫站拟调查了解该地成人白细胞数某卫生防疫站拟调查了解该地成人白细胞数是否偏低,若用抽样调查,样本含量至少应有多是否偏低,若用抽样调查,样本含量至少应有多是否偏低,若用抽样调查,样本含量至少应有多是否偏低,若用抽样调查,样本含量至少应有多少人?据文献报道,正常成人白细胞数的标准差少人?据文献报道,正常成人白细胞数的标准差少人?据文献报道,正常成人白细胞数的标准差少人?据文献报道,正常成人白细胞数的标准差约约约约1000100010001000个个个个/mm3/mm3/mm3/mm3,规定容许误差为,规定容许误差为,规定容许误差为,规定容许误差为100100100100个个个个/mm3/mm3/mm3/mm3。现况研究现况研究李立明主编李立明主编李立明主编李立明主编.流行病学流行病学流行病学流行病学.第第第第4 4版版版版.北京北京北京北京:人民卫生出版社人民卫生出版社人民卫生出版社人民卫生出版社.1999.p47.1999.p47.EpiCalcEpiCalcSampleSamplePrecisionPrecisionSingle meanSingle mean1.1.计量资料计量资料计量资料计量资料7272EpiCalc 20007373EpiCalc 20007474 某卫生防疫站为了制订驱蛔虫计划,编制经某卫生防疫站为了制订驱蛔虫计划,编制经某卫生防疫站为了制订驱蛔虫计划,编制经某卫生防疫站为了制订驱蛔虫计划,编制经费、药品预算,需要抽样估计当地儿童蛔虫感染费、药品预算,需要抽样估计当地儿童蛔虫感染费、药品预算,需要抽样估计当地儿童蛔虫感染费、药品预算,需要抽样估计当地儿童蛔虫感染率。据该地以往经验,儿童蛔虫感染率一般不高率。据该地以往经验,儿童蛔虫感染率一般不高率。据该地以往经验,儿童蛔虫感染率一般不高率。据该地以往经验,儿童蛔虫感染率一般不高于于于于30%30%,若规定容许误差为,若规定容许误差为,若规定容许误差为,若规定容许误差为3%3%,则样本含量至,则样本含量至,则样本含量至,则样本含量至少应为多少人?少应为多少人?少应为多少人?少应为多少人?现况研究现况研究李立明主编李立明主编李立明主编李立明主编.流行病学流行病学流行病学流行病学.第第第第4 4版版版版.北京北京北京北京:人民卫生出版社人民卫生出版社人民卫生出版社人民卫生出版社.1999.p47.1999.p47.EpiCalcEpiCalcSampleSamplePrecisionPrecisionSingle proportionSingle proportion2.2.计数资料计数资料计数资料计数资料7575EpiCalc 20007676EpiCalc 20007777 已知某乡人口已知某乡人口已知某乡人口已知某乡人口45374537人,欲调查某病患病率。人,欲调查某病患病率。人,欲调查某病患病率。人,欲调查某病患病率。估计患病率为估计患病率为估计患病率为估计患病率为2%2%,允许误差为,允许误差为,允许误差为,允许误差为0.5%0.5%,设计效应,设计效应,设计效应,设计效应(design effectdesign effect)设为)设为)设为)设为2 2,计算所需样本量。,计算所需样本量。,计算所需样本量。,计算所需样本量。现况研究现况研究3.3.在有限总体中进行抽样调查在有限总体中进行抽样调查在有限总体中进行抽样调查在有限总体中进行抽样调查参考参考参考参考“杨树勤主编杨树勤主编杨树勤主编杨树勤主编.卫生统计学卫生统计学卫生统计学卫生统计学.第三版第三版第三版第三版.北京北京北京北京:人人人人民卫生出版社民卫生出版社民卫生出版社民卫生出版社.1996.”p138.1996.”p138.SampleXS7878SampleXS7979设计效应(设计效应(设计效应(设计效应(design effectdesign effect)单纯随机抽样或系统抽样单纯随机抽样或系统抽样单纯随机抽样或系统抽样单纯随机抽样或系统抽样:1:1整群抽样整群抽样整群抽样整群抽样:1(:1(根据经验、参考文献估计根据经验、参考文献估计根据经验、参考文献估计根据经验、参考文献估计)例如,免疫覆盖率调查和营养状况调查例如,免疫覆盖率调查和营养状况调查例如,免疫覆盖率调查和营养状况调查例如,免疫覆盖率调查和营养状况调查:2 28080练习练习1.1.固定其它参数,只增加或减少总体人数固定其它参数,只增加或减少总体人数固定其它参数,只增加或减少总体人数固定其它参数,只增加或减少总体人数(1,000(1,000、10,00010,000、100,000100,000、100,000,000)100,000,000),看样本,看样本,看样本,看样本量的变化趋势;量的变化趋势;量的变化趋势;量的变化趋势;2.2.固定总体人数在固定总体人数在固定总体人数在固定总体人数在1,000,0001,000,000,增加或减少现患率,增加或减少现患率,增加或减少现患率,增加或减少现患率(容许误差按容许误差按容许误差按容许误差按0.1P0.1P计算计算计算计算),看样本量变化趋势;,看样本量变化趋势;,看样本量变化趋势;,看样本量变化趋势;3.3.固定总体人数在固定总体人数在固定总体人数在固定总体人数在1,000,0001,000,000,并固定现患率,增加,并固定现患率,增加,并固定现患率,增加,并固定现患率,增加或减少容许误差,看样本量变化趋势;或减少容许误差,看样本量变化趋势;或减少容许误差,看样本量变化趋势;或减少容许误差,看样本量变化趋势;4.4.固定总体人数在固定总体人数在固定总体人数在固定总体人数在1,000,0001,000,000,同样的参数,分别用,同样的参数,分别用,同样的参数,分别用,同样的参数,分别用SampleXSSampleXS和和和和EpiCalc2000EpiCalc2000计算样本量,看两者之计算样本量,看两者之计算样本量,看两者之计算样本量,看两者之间的关系,可改变设计效应值试试。间的关系,可改变设计效应值试试。间的关系,可改变设计效应值试试。间的关系,可改变设计效应值试试。体会样本量影响因素的作用方式体会样本量影响因素的作用方式体会样本量影响因素的作用方式体会样本量影响因素的作用方式8181队列研究队列研究工作时序工作时序工作时序工作时序8282样本量计算中需考虑的几个问题样本量计算中需考虑的几个问题样本量计算中需考虑的几个问题样本量计算中需考虑的几个问题抽样方法抽样方法抽样方法抽样方法暴露组及非暴露组的比例暴露组及非暴露组的比例暴露组及非暴露组的比例暴露组及非暴露组的比例:非暴露组的非暴露组的非暴露组的非暴露组的样本量不宜少于暴露组,通常采取等样本量不宜少于暴露组,通常采取等样本量不宜少于暴露组,通常采取等样本量不宜少于暴露组,通常采取等量量量量失访率失访率失访率失访率:例如例如例如例如10%10%队列研究队列研究8383影响因素影响因素影响因素影响因素暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差/比比比比一般人群一般人群一般人群一般人群(对照人群对照人群对照人群对照人群)中所研究疾病的发中所研究疾病的发中所研究疾病的发中所研究疾病的发病率病率病率病率p0 p0 显著性水平显著性水平显著性水平显著性水平:效力效力效力效力(把握度把握度把握度把握度,power):1-,power):1-差差差差/比值越大,所需样本量越小比值越大,所需样本量越小比值越大,所需样本量越小比值越大,所需样本量越小队列研究队列研究8484影响因素影响因素影响因素影响因素暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差/比比比比一般人群一般人群一般人群一般人群(对照人群对照人群对照人群对照人群)中所研究疾病的发中所研究疾病的发中所研究疾病的发中所研究疾病的发病率病率病率病率p0 p0 显著性水平显著性水平显著性水平显著性水平:效力效力效力效力(把握度把握度把握度把握度,power):1-,power):1-率差固定率差固定率差固定率差固定:p0:p0越大越大越大越大 率比越小率比越小率比越小率比越小 所需样本量越大所需样本量越大所需样本量越大所需样本量越大率比固定率比固定率比固定率比固定:p0:p0越大越大越大越大 率差越大率差越大率差越大率差越大 所需样本量越小所需样本量越小所需样本量越小所需样本量越小暴露组人群发病率暴露组人群发病率暴露组人群发病率暴露组人群发病率p1p1固定固定固定固定:p0:p0越大越大越大越大 率比率比率比率比/差越小差越小差越小差越小 所需样本量越大所需样本量越大所需样本量越大所需样本量越大队列研究队列研究8585影响因素影响因素影响因素影响因素暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差/比比比比一般人群一般人群一般人群一般人群(对照人群对照人群对照人群对照人群)中所研究疾病的发中所研究疾病的发中所研究疾病的发中所研究疾病的发病率病率病率病率p0 p0 显著性水平显著性水平显著性水平显著性水平:效力效力效力效力(把握度把握度把握度把握度,power):1-,power):1-=0.01=0.01时所需样本量大于时所需样本量大于时所需样本量大于时所需样本量大于 =0.05=0.05队列研究队列研究8686影响因素影响因素影响因素影响因素暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差暴露组及对照组人群发病率之差/比比比比一般人群一般人群一般人群一般人群(对照人群对照人群对照人群对照人群)中所研究疾病的发中所研究疾病的发中所研究疾病的发中所研究疾病的发病率病率病率病率p0 p0 显著性水平显著性水平显著性水平显著性水平:效力效力效力效力(把握度把握度把握度把握度,power):1-,power):1-(1-(1-)越大,即越大,即越大,即越大,即越小,所需样本量越越小,所需样本量越越小,所需样本量越越小,所需样本量越大大大大=0.10=0.10或或或或=0.20=0.20队列研究队列研究8787 用队列研究探讨孕妇暴露于某药物用队列研究探讨孕妇暴露于某药物用队列研究探讨孕妇暴露于某药物用队列研究探讨孕妇暴露于某药物及及及及婴儿先婴儿先婴儿先婴儿先天性心脏病之间的联系。已知非暴露孕妇所生婴天性心脏病之间的联系。已知非暴露孕妇所生婴天性心脏病之间的联系。已知非暴露孕妇所生婴天性心脏病之间的联系。已知非暴露孕妇所生婴儿的先天性心脏病发病率儿的先天性心脏病发病率儿的先天性心脏病发病率儿的先天性心脏病发病率(p0)(p0)为为为为0.0070.007,估计该药,估计该药,估计该药,估计该药物暴露的物暴露的物暴露的物暴露的RRRR为为为为2.52.5,设,设,设,设=0.05=0.05(双侧),(双侧),(双侧),(双侧),=0.10=0.10,求调查所需的样本量。,求调查所需的样本量。,求调查所需的样本量。,求调查所需的样本量。队列研究队列研究李立明主编李立明主编李立明主编李立明主编.流行病学流行病学流行病学流行病学.第第第第5 5版版版版.北京北京北京北京:人民卫生出版社人民卫生出版社人民卫生出版社人民卫生出版社.2003.p68.2003.p68.EpiCalcEpiCalcSampleSampleSizeSizeTwo ratesTwo rates8888EpiCa
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服