1、第六章成本、收益数据的收集与分析成本、收益数据的收集与分析教学要求掌握:数据掌握:数据的收集方法,的收集方法,数据的分析数据的分析方法。方法。熟悉:数据熟悉:数据的类型,样的类型,样本量的测算。本量的测算。了解:马尔了解:马尔科夫模型,科夫模型,决策树模型。决策树模型。第一节数据的收集定义:根据研究中预定的目的和任务,运用相应的科学方法与手段有计划地收集数据的过程。数据收集的关键:保证数据的真实性、准确性和有用性。一、数据的类型数据的分类原则:1、按照所采用的计量尺度分类;2、按照统计数据的收集方法分类;3、按照被描述的对象与时间关系分类;4、按照药物经济学研究的特点分类。(一)按照所采用的计
2、量尺度分类1、计量数据(定量数据)指为观测每个视察单位某项指标的大小而获得的数据。特点:变量值是定量的,表现为数值大小,有度量衡单位;例:身高、体重、血压等;(一)按照所采用的计量尺度分类2、计数数据(定性数据)指为将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。特点:变量值是定性的,表现为互不相容的属性或类别,一般无单位;如:试验结果阴性或阳性。二分类:结果为两类,两类间相互对立,互不相容。多分类:结果为三个级以上。如血型分布。(一)按照所采用的计量尺度分类3、等级数据半定量数据,将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后得到的数
3、据。特点:变量值具有半定量性质,表现为等级大小或属性程度。例:某药物治疗效果分为:治愈、显效、好转、无效四级。(二)按照统计数据的收集方法观察数据:通过调查或者观测而收集到的数据。是自然的。实验数据:实验室中控制实验对象而收集到的数据。(三)按照被描述的对象与时间关系截面数据:指在相同或者近似相同的时间点上所收集的数据,用来描述现象在某一时刻的变化情况。时间序列数据:指在不同时间上所收集到的数据,用来描述现象随时间而变化的情况。二、数据的收集原则1、准确性原则2、及时性原则3、系统性原则4、完整性原则三、数据的收集方法直接来源数据的收集(一手数据)间接来源数据的收集(二手数据)(一)直接来源数
4、据的收集1 1、观察性研究:描述性研究和分析性研究、观察性研究:描述性研究和分析性研究描述性研究:全面调查、抽样调查和典型调查;分析性研究:病例对照研究和队列研究;队列研究:前瞻性、历史性和双向性;2 2、实验性研究:动物实验、实验性研究:动物实验、临床试验临床试验和和 现场试验现场试验观察性研究1、描述性研究:主要是对人群的疾病或健康状态在人群、时间、地区的分布和强度进行描述,特别是从样本中获得数据来推断和评估总体的参数,其应用最多的方法是“横断面研究”。调查方法:全面调查(普查)、抽样调查和典型调查普查:应设定时间“节点”,工作量大;抽样调查:应采取随机抽样,工作量小,获得较深入、准确的资
5、料;典型调查:在对研究对象作全面了解、分析的基础上,在目的地选定典型的人或群体进行深入剖析。可获得同一类事物特征的集中表现。观察性研究2、分析性研究主要任务是探索某些因素与结果之间的因果关系,一般分为病例对照研究和队列研究。(1)病例对照研究:通过调查患有某种疾病的人群(或一组)和一组(或几组)未患该病的对照人群,回忆过去有无“暴露”于某个或某些危险因素的历史,而这种危险因素正是被怀疑为与该病的发生有联系的因素,在比较上述两组暴露于某危险因素的百分率(暴露比)的基础上,以验证暴露因素与所研究疾病的因果关系,假设两组人群的暴露比有显著性差异,则可认为所研究疾病与因素之间存在某种联系。特点:回顾性
6、研究、可同时探特点:回顾性研究、可同时探索和验证造成因果干系的多个索和验证造成因果干系的多个因素、获得结果较快;缺点:因素、获得结果较快;缺点:资料的准确性差、对照组选择资料的准确性差、对照组选择比较困难比较困难群组病例对照研究群组病例对照研究和匹配病例对照研和匹配病例对照研究究病例对照研究举例:一组患肺癌的人群和一组健康人群,调查他们过去是否长期吸烟,结果患肺癌人群的抽烟率为90%,而健康组人群的抽烟率为10%,则可认为抽烟和患肺癌有一定的联系。同时本研究还可以同时调查、分析烟草的种类、开始吸烟的年龄、吸烟的年限、吸烟量等与肺癌之间的关系。观察性研究2、队列研究:群组研究、定群研究、前瞻性研
7、究。根据人群是否暴露于某种因素之下,将暴露者列入暴露组,未暴露者列入非暴露组。在一段时间内对这两组进行定群跟踪,密切观察这两组人群中发生的不良反应、疾病以及死亡的情况等,比较和分析暴露组和非暴露组的发病率(或死亡率)。如果暴露组某病的发病率或死亡率显著性地高于非暴露组,则可假设该暴露因素与某疾病的发生有联系。要求:要求:1.1.查阅资料,选择该暴露因素下最易出查阅资料,选择该暴露因素下最易出现的疾病为假设;现的疾病为假设;2.2.研究者在研究前要知道研究人群中的研究者在研究前要知道研究人群中的暴露者和非暴露者;暴露者和非暴露者;3.3.要知道暴露者的暴露强度和持续时间;要知道暴露者的暴露强度和
8、持续时间;4.4.暴露者和非暴露者均未患有所研究的暴露者和非暴露者均未患有所研究的疾病。疾病。队列研究特点1.属于观察法暴露不是人为给予的,而是在研究开始前就已客观存在,这一点根本区别于实验研究。2.设立对照队列研究作为一种分析流行病学研究方法区别于描述流行病学的根本特点就是设立对照组以利于比较。对照组的选择有多种方法。3.由“因”及“果”在研究过程中先确知其因(暴露因素),再纵向前瞻观察而究其果(发病或死亡)。这一点与实验研究方法一致。4.能确证暴露与疾病的因果联系由于队列研究能够得到确切数目人群中的发病人数(发病率),并通过比较暴露与非暴露人群发病率的差异而确定暴露对发病率的影响。队列研究
9、举例:吸烟致肺癌吗?将长期吸烟的健康人群和从不吸烟的健康人群分为两组进行队列研究观察他们肺癌的发生率。蕨菜致癌吗?队列研究队列研究按照研究时间的起止点可分为:队列研究按照研究时间的起止点可分为:A A:前瞻性队列研究(即时性队列研究):前瞻性队列研究(即时性队列研究)B B:历史性队列研究(非即时性队列研究):历史性队列研究(非即时性队列研究)C C:双向性队列研究:双向性队列研究前瞻性队列研究前瞻性队列研究释义:研究开始时暴露因素已经存在,但疾病尚未发生,研究的结局要前瞻一段时间才能得到。优点:研究者都可以亲自监督获得一手资料,偏倚较小,而且可根据在随访期间暴露的变动情况选用适当的新的检测方
10、法和观察指标;缺点:工作量大、花费大、时间长等。举例:吸烟与肺癌的关系历史性队列研究历史性队列研究释义:研究开始时暴露和疾病均已发生,即研究的结局在研究开始时已从历史资料中获得,研究对象的确定与分组是根据研究开始已掌握的历史资料。优点:省时;省人力、物力和财力;出结果快;缺点:研究者对资料收集不能进行质量控制,只有具备完整、准确、可靠资料时才能应用。研究药品不良反应发生与用法用量之间的关系双向性队列研究双向性队列研究是前两种方法的有机结合。即暴露资料在过去已经收集到或从现有记录中可查到,但结局资料不完全了解。研究人员必须随访,以获得结局资料。即在回顾性队列研究基础上,进行前瞻性的队列研究,以扬
11、长避短。实际工作中常常用到,适用范围较广。2、实验性研究是指研究者根据研究目的人为地对实验单位设置干预措施,按照对照、重复、随机化的基本原则控制非干预措施的影响,通过对实验结果的分析,评价干预措施的效果。根据实验对象不同分为:动物实验、临床试验、现场试验。实验研究是药物经济学获得数据的重要方法实验研究是药物经济学获得数据的重要方法临床试验释义:指对任何在人体(病人或健康志愿者)中进行的各种治疗方法或预防措施的干预性研究,以证实或揭示治疗方法或预防措施的疗效和安全性,从而综合评价治疗方法或预防措施的效果和价值。必须要医学伦理委员会同意。常见类型:随机对照试验(RCT)、实际临床试验、交叉试验、多
12、中心临床试验等多种。临床试验1、随机对照试验(RCT)是临床试验中应用最广的一种。将符合标准的研究对象随机分为试验组和对照组(或多个比较组),分别接受相应的试验措施,在一致的条件下或环境中,同步地进行研究和观测试验的效应。对照组是产生试验组对象的总体人群的一个随机样本,代表性较好;研究组和对照组随机分配,同时观察,可比性好。但是,在实际的工作中完全随机往往难以实现。临床试验2、基于随机临床试验的药物经济学研究(平行研究)是指经药物经济学研究与药物临床试验相结合,通常在药物III期临床试验中进行经济学研究。临床试验分为I、II、III、IV期临床试验临床试验3、实际临床试验(PCT)实际临床试验
13、(实际临床试验(PCT)和()和(RCT)不同之处是他)不同之处是他不要求对研究组和对照组做相同的检查或采用其不要求对研究组和对照组做相同的检查或采用其他相同的治疗手段等,它允许医生根据自己的临他相同的治疗手段等,它允许医生根据自己的临床经验修改治疗方案。床经验修改治疗方案。临床试验4、交叉试验、交叉试验释义:即在试验过程中将研究对象随机分为两组,在第一释义:即在试验过程中将研究对象随机分为两组,在第一阶段,一组人群为试验组,给予某一治疗措施,另一组则阶段,一组人群为试验组,给予某一治疗措施,另一组则为对照组,给予另一治疗措施,经过一定时期后,两组对为对照组,给予另一治疗措施,经过一定时期后,
14、两组对换治疗措施,进行第二阶段试验。研究期间内,两种治疗换治疗措施,进行第二阶段试验。研究期间内,两种治疗措施都交叉用于每个研究对象,可进行患者自身疗效的比措施都交叉用于每个研究对象,可进行患者自身疗效的比较,或不同患者间的疗效比较。较,或不同患者间的疗效比较。交叉设计试验应用随机分组,避免了组间差异,且同一患交叉设计试验应用随机分组,避免了组间差异,且同一患难与共者,前后分别接受两种难与共者,前后分别接受两种 治疗措施,消除了个体间治疗措施,消除了个体间的差异,故效果观察较准确。此类设计需要在两阶段试验的差异,故效果观察较准确。此类设计需要在两阶段试验中设立一定时间长度的洗脱期。药物的洗脱期
15、一般为中设立一定时间长度的洗脱期。药物的洗脱期一般为5 5个个半衰期。半衰期。临床试验5、自身前后对照对同一批受试对象分两个阶段,分别接受两种处理措施,并进行效果比较,以说明两种治疗措施的效果。由于是自身两个阶段疗效比较,可排除个体差异,结果可信。也要注意洗脱期。临床试验6、半随机对照试验与RCT唯一区别是实验对象分配方式是半随机。7、非等量随机对照试验试验对象按照一定比例随机分配到试验组和对照组。8、整群随机对照试验以多个个体的小群体作为分配单位9、基于单个患者的随机对照试验对患慢性疾病的单个个体进行的一种随机对照试验。临床试验10、非随机同期对照试验是对照组和试验组的对象同时进入研究,但是
16、研究对象进入哪一组并非随机分配。这样的方法简便易行,易为研究对象和观察者所接受,有时是出于满足伦理学要求,但这样的设计,试验组和对照组可比性往往较差,易影响临床试验的结论。例如,研究某新药的疗效,将一个医院的病人作为试验组,另一个医院的病人作为对照组,工作简便,易于进行,但两组间的可比性难以保证。临床试验11、多中心临床试验是由多位研究者按同一试验方案在不同地点和单位同时进行的临床试验。各中心同期开始与结束试验。多中心试验由一位主要研究者总负责,并作为临床试验各中心间的协调研究者。(二)间接来源数据的收集间接数据(二手数据)收集方法主要通收集方法主要通过查阅文献资料过查阅文献资料摘取已有数据进
17、摘取已有数据进行整理、融合、行整理、融合、调整、归纳后供调整、归纳后供药物经济学评价药物经济学评价使用。使用。二二手手数数据据的的来来源源零次文献零次文献一次文献一次文献二次文献二次文献三次文献三次文献计算机网络计算机网络四、数据的证据级别证据的等级是根据研究设计的严谨性、方法学的可靠性、研究特征和作用、可用性等方面划分证据优劣。等级强度越强,推荐强度越强。DouglasCoyle和KarenLee提出了关于药物经济学评价的数据等级标准,具体见教材P91.五、样本量五、样本量理论上,验证某一干预措施与对照之间的理论上,验证某一干预措施与对照之间的差异,样本量越大,试验结果越接近于真差异,样本量
18、越大,试验结果越接近于真实值,即结果越可靠。实值,即结果越可靠。样本量过大:增加临床研究难度,造成人力、物样本量过大:增加临床研究难度,造成人力、物力、时间和经济上的浪费,伦理问题,一些临床力、时间和经济上的浪费,伦理问题,一些临床意义不大的微弱疗效最终也可能会出现统计学上意义不大的微弱疗效最终也可能会出现统计学上的显著差异。的显著差异。五、样本量五、样本量试验样本量过小,无论试验结果是否存在差异,试验样本量过小,无论试验结果是否存在差异,均不能排除因机遇(随机误差)造成的假阳性或均不能排除因机遇(随机误差)造成的假阳性或假阴性错误。假阴性错误。样本量过少:结果不稳定,检验效能过低,结论样本量
19、过少:结果不稳定,检验效能过低,结论缺乏充分依据。缺乏充分依据。临床试验报告中有无预先的样本量估计是临床试验报告中有无预先的样本量估计是评价试验质量的重要依据之一。评价试验质量的重要依据之一。五、样本量五、样本量样本含量估算就是在保证科研结论具有一样本含量估算就是在保证科研结论具有一定可靠性条件下,确定的定可靠性条件下,确定的最少最少观察例数。观察例数。(一)随机对照试验样本量估计(一)随机对照试验样本量估计(二)净现值法的样本量估计(二)净现值法的样本量估计五、样本量五、样本量(一)随机对照试验样本量估计(一)随机对照试验样本量估计1 1、计数资料的样本大小的估计、计数资料的样本大小的估计如
20、果结局变量是计数指标,如发病率、感染率、病死率如果结局变量是计数指标,如发病率、感染率、病死率和治愈率等,可按下面公式计算样本量:和治愈率等,可按下面公式计算样本量:五、样本量五、样本量2、计量资料的样本量估计如果结局变量是计量资料,如血压、血糖等则可按以下公式计算样本量:五、样本量五、样本量净效益值法的样本量估计原理是对于某一待评价的方案(新方案),假设其与标准方案(旧方案)相比净效益值是大于0的,在此基础上计算样本量。净效益值法样本含量估计公式为:其中第二节数据的分析药物经济学评价分析主要涉及四类:统计分析成本-收益分析模型分析不确定性分析一、数据的统计学分析数据的统计分析包括统计描述和统
21、计推断(一)统计描述统计描述是对数据包含的信息加以整理、概括和浓缩,用适当的统计指标来表达数据的特征或规律。计量数据统计描述计数数据的统计描述计量数据统计描述1、算术平均数可用于反映一组呈对称分布的变量值在数量上的平均水平,其公式为:=X/n2、几何平均数可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,其公式为:Glg-1(lgX/n)3、中位数是将N个变量值从小到大排列,位置居于中间的那个数。当N为奇数时取位次居中的变量值,当N为偶数时取位次居中的两个变量值的均数。计量数据统计描述4、全距也称极差,用R表示,指总体各单位的两个极端标志值之差,它反映的是总体标志值的差异范围。R
22、=最大标志值-最小标志值5、方差与标准差总体方差计算公式:样本方差:6、变异系数标准差与均数之比,用百分数表示,CV=S/X*100%计数数据的统计描述在药物经济学评价中,大量资料都是按照事物的特征或者属性进行分类的,这类资料称为计数数据,也称分类数据或定性数据。常用的计数数据指标有构成比、率和相对比。计数数据的统计描述1、构成比是表示事物或现象内部各构成部分的比例,通常以100为比例基数,故常称百分比。如:性别构成比、年龄构成比等。计数数据的统计描述2、率又称频率指标,表示在一种条件下某种现象实际发生的例数与可能发生该现象的总例数的比,用来说明某种现象发生的频率。如感染率、死亡率、治愈率等。
23、计数数据的统计描述3、相对比是表示两有关指标之比,如:出生性别比例等。(二)统计推断1、计量数据的统计推断若收集的计量数据满足正态分布时,两组之间的比较,可采用t检验;两组及以上之间的比较,则可用方差分析(F检验)。若收集的计量数据不满足正态分布和方差齐性时,可用秩和检验。当考虑某一治疗性措施与结果的关系时,可做相关分析。计量数据的统计推断(1)t检验原理:假设两个样本均数来自同一个总体,同一总体的两个样本均数不一定相同,但一般不应相差太大,称为“无效假设”,在统计上无显著意义。如果两个样本均数相差很大,则表明这两个样本均数来自同一总体的概率P小,这两个样本均数的差别有显著意义,可否定无效假设
24、。判断标准:P0.05时,不能否定无效假设,可认为差别无显著意义P0.05时,可以否定无效假设,可认为差别有显著意义计量数据的统计推断(1)t检验方差齐性两正态总体均数比较的t检验,统计量样本值公式为:无方差齐性两正态总体均数比较的t检验,统计量样本值公式为:计量数据的统计推断(2)方差分析(F检验)指用于两个及两个以上样本均数差别的显著性检验应用条件:a、各样本是相互独立的随机样本;b、各样本都来自正态总体;c、各个总体方差相等(方差齐性)。基本步骤:1、建立检验假设;H0:多个样本总体均值相等;H1:多个样本总体均值不相等或不全等。检验水准为0.05。2、计算检验统计量F值;3、确定P值并
25、作出推断结果。注意:方差分析的结果若拒绝注意:方差分析的结果若拒绝H0,接受,接受H1,只只能说明总体均数不全相等,不能说明各组总体能说明总体均数不全相等,不能说明各组总体均数两两间都有差别。均数两两间都有差别。计数数据的统计推断当收集的数据是计数数据时,如结局变量是痊愈、好转、无效、死亡等计数数据。其主要评价指标一般用率、比等相对指标。其组间比较可用x2检验或Ridit分析等方法。x2检验主要可以用于计数资料的两组或两组以上的两类属性、两类或两类以上现象之间的比较,如检验两个样本率、构成比等之间的差别.Ridit分析法Ridit分析是一种Ridit值为统计量的等级资料的假设检验方法,是非参数
26、检验方法中的一种常用方法之一,其主要用于分析等级资料(有序分类资料)。二、药物经济学的成本-收益分析最小成本分析法(CMA)成本-效益分析法(CBA)成本-效果分析法(CEA)成本-效用分析法(CUA)近年来,越来越多的模型被应用于药物经济学评价中,如决策树模型、马尔科夫系列模型(MarkovFamilies)、代理模拟等。而在统计方法方面,生存分析(Cox比例风险回归分析)、回归分析、分层分析、协方差分析等在药物经济学评价中也越来越常见。三、模型分析近年来,越来越多的模型被应用于药物经济学评价中,如决策树模型、马尔科夫系列模型(MarkovFamilies)、代理模拟等。二建模步骤估算出每种
27、状态的发生概率和每种结果的损益值计算每种方案的期望效益值计算每种方案的期望效益值根据各方案的期望效益值进行决策根据各方案的期望效益值进行决策423建立决策树模型1目录 建模示例及注意事项建模示例及注意事项 三三 (一)决策树必须保持平衡(一)决策树必须保持平衡 (二)无嵌入式决策节点(二)无嵌入式决策节点 (三)决策树必须是对称的(三)决策树必须是对称的(synlmetry)(四)不需要担心顺序(四)不需要担心顺序 局限性局限性 四四第一第一,决策树模型中的事决策树模型中的事件都被视为发生在瞬间的件都被视为发生在瞬间的离散时间段。离散时间段。第二第二,当应用于复杂的当应用于复杂的、长长期的预测时期的预测时(尤其用于尤其用于慢性病时慢性病时),决策树模型会决策树模型会变得非常复杂变得非常复杂。马尔可夫模型目录 建模步骤建模步骤 二二(一)设立马尔科夫状态(一)设立马尔科夫状态,并确定可能的状态转移并确定可能的状态转移(二)选择合适的周期长度(二)选择合适的周期长度(三)确定每个周期中各状态间的转移概率(三)确定每个周期中各状态间的转移概率(四)对每个健康状态赋予成本和效用(四)对每个健康状态赋予成本和效用 模拟方法模拟方法 三三列队模拟蒙特卡模拟列队模拟原理半循环校正 局限性局限性五四、不确定分析详见第七章