1、艾滋病疗法的评价艾滋病疗法的评价及疗效的预测及疗效的预测全国大学生数学建模竞赛全国大学生数学建模竞赛2006年年B题题 艾滋病是当前人类社会最严重的瘟疫之一,从艾滋病是当前人类社会最严重的瘟疫之一,从19811981年发年发现以来的现以来的2020多年间,它已经吞噬了近多年间,它已经吞噬了近30003000万人的生命。万人的生命。艾滋病的医学全名为艾滋病的医学全名为“获得性免疫缺损综合症获得性免疫缺损综合症”,英文,英文简称简称AIDSAIDS,它是由艾滋病毒(医学全名为,它是由艾滋病毒(医学全名为“人体免疫缺损病毒人体免疫缺损病毒”,英文简称英文简称HIVHIV)引起的。这种病毒破坏人的免疫
2、系统,使人)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的疫系统的CD4CD4细胞在抵御细胞在抵御HIVHIV的入侵中起着重要作用,当的入侵中起着重要作用,当CD4CD4被被HIVHIV感染而裂解时,其数量会急剧减少,感染而裂解时,其数量会急剧减少,HIVHIV将迅速增加,导致将迅速增加,导致AIDSAIDS发作。发作。艾滋病治疗的目的,是尽量减少人体内艾滋病治疗的目的,是尽量减少人体内HIVHIV的数量,同时的数量,同时产生更多的产生更多的CD4CD4,至少要有效地降低,至少要有效地降
3、低CD4CD4减少的速度,以提高人减少的速度,以提高人体免疫能力。体免疫能力。迄今为止人类还没有找到能根治迄今为止人类还没有找到能根治AIDSAIDS的疗法,目前的的疗法,目前的一些一些AIDSAIDS疗法不仅对人体有副作用,而且成本也很高。许多国疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的家和医疗组织都在积极试验、寻找更好的AIDSAIDS疗法。疗法。现在得到了美国艾滋病医疗试验机构现在得到了美国艾滋病医疗试验机构ACTGACTG公布的两组公布的两组数据。数据。ACTG320ACTG320(见附件(见附件1 1)是同时服用)是同时服用zid.,lam.,
4、ind.3zid.,lam.,ind.3种种药物的药物的300300多名病人每隔几周测试的多名病人每隔几周测试的CD4CD4和和HIVHIV的浓度的浓度(每毫升血(每毫升血液里的数量)。液里的数量)。193A193A(见附件(见附件2 2)是将)是将13001300多名病人随机地分为多名病人随机地分为4 4组,每组按下述组,每组按下述4 4种疗法中的一种服药,大约每隔种疗法中的一种服药,大约每隔8 8周测试的周测试的CD4CD4浓度浓度(这组数据缺(这组数据缺HIVHIV浓度,它的测试成本很高)。浓度,它的测试成本很高)。4 4种疗法种疗法的日用药分别为:的日用药分别为:600mg zid.6
5、00mg zid.或或400mg did.400mg did.,这两种药按月轮,这两种药按月轮换使用;换使用;600 mg zid.600 mg zid.加加2.25 mg zal.2.25 mg zal.;600 mg zid.600 mg zid.加加400 mg 400 mg did.did.;600 mg zid.600 mg zid.加加400 mg did.400 mg did.,再加,再加400 mg nev.400 mg nev.。请你完成以下问题:请你完成以下问题:(1 1)利用附件)利用附件1 1的数据,的数据,预测继续治疗的效果,或者确预测继续治疗的效果,或者确定最佳治疗
6、终止时间定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。果认为继续服药效果不好,则可选择提前终止治疗)。(2 2)利用附件)利用附件2 2的数据,的数据,评价评价4 4种疗法的优劣种疗法的优劣(仅以(仅以CD4CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。佳治疗终止时间。(3)(3)艾滋病药品的主要供给商对不发达国家提供的药艾滋病药品的主要供给商对不发达国家提供的药品价格如下:品价格如下:600mg zid.1.60600
7、mg zid.1.60美元,美元,400mg did.0.85400mg did.0.85美元,美元,2.25 mg zal.1.852.25 mg zal.1.85美元,美元,400 mg nev.1.20400 mg nev.1.20美元。如果病人需美元。如果病人需要考虑要考虑4 4种疗法的费用,对(种疗法的费用,对(2 2)中的评价和预测(或者提前终)中的评价和预测(或者提前终止)有什么改变。止)有什么改变。附件附件1 ACTG3201 ACTG320数据数据同时服用同时服用3 3种药物的种药物的300300多名病人每隔几周测试的多名病人每隔几周测试的CD4CD4和和HIVHIV的浓度。
8、的浓度。第第1 1列是病人编号,第列是病人编号,第2 2列是测试列是测试CD4CD4的时刻(周),第的时刻(周),第3 3列是测得的列是测得的CD4CD4(乘以(乘以0.20.2个个/ml/ml),第),第4 4列是测试列是测试HIVHIV的时刻(周),第的时刻(周),第5 5列是测列是测得的得的HIVHIV(单位不详)。(单位不详)。PtIDPtIDCD4Date CD4Count RNADateCD4Date CD4Count RNADateVLoadVLoad23424 23424 0 01781780 0 5.5 5.523424 23424 4 42282284 4 3.9 3.92
9、3424 23424 8 81261268 8 4.7 4.72342423424 25 25 171171 25 25 4 423424 4023424 40 99 99 40 40 5 52342523425 0 0 14 140 0 5.3 5.32342523425 4 4 62 624 4 2.4 2.42342523425 9 91101109 9 3.7 3.72342523425 23 23 122122 23 23 2.6 2.62342523425 40 40 320320附件附件2 193A2 193A数据数据13001300多名病人按照多名病人按照4 4种疗法服药大约每
10、隔种疗法服药大约每隔8 8周测试的周测试的CD4CD4浓度。浓度。第第1 1列是病人编号,第列是病人编号,第2 2列是列是4 4种疗法的代码:种疗法的代码:第第3 3列是病人年龄,第列是病人年龄,第4 4列是测试列是测试CD4CD4的时刻(周),第的时刻(周),第5 5列是测得列是测得的的CD4CD4,取值,取值log(CD4+1).log(CD4+1).ID ID 疗法疗法 年龄年龄 时间时间 Log(CD4 count+1)Log(CD4 count+1)1 12 236.427136.42710 03.1355 3.1355 1 12 236.427136.42717.57147.571
11、43.0445 3.0445 1 12 236.427136.427115.571415.57142.7726 2.7726 1 12 236.427136.427123.571423.57142.8332 2.8332 1 12 236.427136.427132.571432.57143.2189 3.2189 1 12 236.427136.42714040 3.0445 3.0445 2 24 447.846747.84670 0 3.0681 3.0681 2 24 447.846747.84678 8 3.8918 3.8918 2 24 447.846747.84671616 3
12、.9703 3.9703 2 24 447.846747.84672323 3.6109 3.6109 2 24 447.846747.846730.714330.71433.3322 3.3322 2 24 447.846747.84673939 3.0910 3.0910 CD4CD4大致有先增后减的趋势,大致有先增后减的趋势,HIVHIV有先减后增的有先减后增的趋势,启示应建立时间的二次函数模型趋势,启示应建立时间的二次函数模型问题(问题(1 1)利用附件利用附件1 1的数据,预测继续治疗的效果的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。或者确定最佳治疗终止时间。分析数据分析数
13、据如随机取如随机取2020个病人,画出他们个病人,画出他们CD4CD4和和HIVHIV浓度随时间变化的图形(折线),浓度随时间变化的图形(折线),若先用一次模型,应与二次模型做统计分析比较若先用一次模型,应与二次模型做统计分析比较CD4HIV1 1)总体回归模型总体回归模型 用全部数据拟合一个模型,用全部数据拟合一个模型,如如 y yijij=b b0 0+b b1 1t tijij+b b2 2t tijij2 2,t tijij,y yijij分别为第分别为第i i病人第病人第j j次测量的时间和次测量的时间和CD4CD4(或(或HIVHIV),估计),估计b b0 0,b b1 1,b
14、b2 2建立模型建立模型有以下形式的回归模型(一次有以下形式的回归模型(一次与二次模型比较,二次较优):与二次模型比较,二次较优):对对HIVHIV,b b2 20,0,b b1 10,0,t t=-=-b b1 1/2/2b b2 2 达到最小达到最小对对CD4CD4,b b2 20,0,0,t t=-=-b b1 1/2/2b b2 2 达到最达到最大大平均地应在平均地应在25302530(周)结束治疗。(周)结束治疗。可对可对CD4CD4统计统计b b2i2i0,00(存在正最大点)及(存在正最大点)及b b2i2i00(不存在最大点)的频率,分别作为及时结(不存在最大点)的频率,分别作
15、为及时结束治疗与继续治疗的概率;也可用它们的均值和束治疗与继续治疗的概率;也可用它们的均值和均方差在确定分布下计算这些概率。均方差在确定分布下计算这些概率。2)2)个人回归模型个人回归模型用每个病人的数据拟合一个模型,如用每个病人的数据拟合一个模型,如y yijij=b b0 0i i+b b1 1i it tijij+b b2 2i it tijij2 2,计算计算b b0 0i i,b,b1 1i i,b,b2 2i i的均值和均方差,的均值和均方差,用均值可得用均值可得CD4CD4的最大点和的最大点和HIVHIV的最小点。的最小点。将模型将模型 y yijij=b b0 0i i+b b
16、1 1i it tijij+b b2 2i it tijij2 2 的系数分解的系数分解:b bkiki=b bk k+ikik(k=0,1,2k=0,1,2),设),设 ikik服从零均值服从零均值正态分布,利用极大似然估计可以得到正态分布,利用极大似然估计可以得到b bk k的估计值及的估计值及 ikik的方差。的方差。3)3)纵向数据回归模型纵向数据回归模型b bk k的估计值用于计算的估计值用于计算CD4CD4的最大点和的最大点和HIVHIV的最小的最小点,它与点,它与 ikik的方差一起可以在正态分布假定下的方差一起可以在正态分布假定下计算及时结束治疗与继续治疗的概率。计算及时结束治
17、疗与继续治疗的概率。如果考虑病人初始状态(如果考虑病人初始状态(t t=0=0时的时的CD4CD4和和HIVHIV)的不同对模型的影响,可以将模型)的不同对模型的影响,可以将模型中的中的y yijij定义为第定义为第i i病人第病人第j j次测量的次测量的CD4CD4(或(或HIVHIV)与初始值之差或之比。)与初始值之差或之比。或者先按照病人初始状态分类(如轻度、中或者先按照病人初始状态分类(如轻度、中度、重度),然后对于每一类建立回归模型。度、重度),然后对于每一类建立回归模型。建立模型建立模型问题(问题(2 2)利用附件利用附件2 2的数据,评价的数据,评价4 4种疗法的种疗法的优劣,并
18、对较优的疗法预测继续治疗的效果,优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。或者确定最佳治疗终止时间。对于每种疗法随机取对于每种疗法随机取2020个病人,画出他们个病人,画出他们CD4CD4随时间随时间变化的图形(折线),可以看出疗法变化的图形(折线),可以看出疗法1313的的CD4CD4基本基本上水平,略有下降,而疗法上水平,略有下降,而疗法4 4有先增后减的趋势。启有先增后减的趋势。启示应建立时间的一次与二次函数模型,经统计分析示应建立时间的一次与二次函数模型,经统计分析比较,确定哪种较优。比较,确定哪种较优。分析数据分析数据THANK YOUSUCCESS2024/
19、5/7 周二13可编辑可以引入可以引入4 4(或(或3 3)个)个0-10-1变量表示变量表示4 4种疗法建立种疗法建立统一模型,或者对每种疗法各建立一个模型统一模型,或者对每种疗法各建立一个模型(一般来说前者较优)。(一般来说前者较优)。1 1)回归模型)回归模型以总体回归模型为例,只需增加年龄变量,分别以总体回归模型为例,只需增加年龄变量,分别用一次与二次时间函数模型进行比较,可知疗法用一次与二次时间函数模型进行比较,可知疗法1313用一次模型较优,且一次项系数为负,即用一次模型较优,且一次项系数为负,即CD4CD4在减少,从数值看疗法在减少,从数值看疗法3 3优于疗法优于疗法2 2和和1
20、 1;疗法;疗法4 4用用二次模型较优,即二次模型较优,即CD4CD4先增后减,先增后减,建立模型建立模型做疗法有无显著性差异的两两比较:做疗法有无显著性差异的两两比较:用用1 1个个0-10-1变量构造两种疗法的统一模型,可变量构造两种疗法的统一模型,可以用以用t t检验作回归系数是否为零的假设检验。检验作回归系数是否为零的假设检验。结果是疗法结果是疗法1 1与与2 2无显著性差异,而疗法无显著性差异,而疗法1 1与与3 3,2 2与与3 3,3 3与与4 4均有显著性差异。均有显著性差异。2 2)假设检验)假设检验疗法是必选的因素,如果还考虑年龄和初始疗法是必选的因素,如果还考虑年龄和初始
21、状态,用双因素分析则比较复杂,可以先按状态,用双因素分析则比较复杂,可以先按这些因素分类,再做疗法的单因素分析。这些因素分类,再做疗法的单因素分析。3 3)方差分析)方差分析论文中出现问题的评析论文中出现问题的评析 1 1只做数据拟合,不做统计检验。只做数据拟合,不做统计检验。用回归分析方法做统计检验:用回归分析方法做统计检验:得到的模型有无显著意义,它的置信度多大,用得到的模型有无显著意义,它的置信度多大,用它作预测时准确程度如何。它作预测时准确程度如何。最小二乘最小二乘拟合:拟合:已知一组数据已知一组数据(x xk k,y,yk k),k=1,2,),k=1,2,n,n 和一个形式已和一个
22、形式已定、参数定、参数 待定的模型(曲线)待定的模型(曲线)y=f(x,y=f(x,),),确定确定参参数数 使数据与模型在误差平方和最小的意义下拟合使数据与模型在误差平方和最小的意义下拟合得最好。得最好。有现成的计算公式和软件有现成的计算公式和软件确定参数确定参数 x0123456789y1.041.221.381.591.801.992.212.392.652.83z0.280.612.192.562.491.173.171.292.113.27y=ay=a1 1x+bx+b1 1=0.2013x+1.0040=0.2013x+1.0040z=az=a2 2x+bx+b2 2=0.2025
23、x+1.0025=0.2025x+1.0025两个模型的结果一样,但是可靠性和准确性一样吗?两个模型的结果一样,但是可靠性和准确性一样吗?需要做需要做统计检验统计检验!简例简例最小二乘最小二乘拟合拟合yxzx决定系决定系数数R2F值值p值值剩余方剩余方差差 2a的置信区的置信区间间b的置信区的置信区间间y=a1x+b10.998552940.00010.00060.1950,0.20770.9699,1.0381z=a2x+b20.35284.3610.07020.7761-0.0211,0.4262-0.1915,2.1966 R R2 2=0.3528=0.3528在在z z的变化中只有的
24、变化中只有35%35%是由是由x x决定的决定的 p p值大于值大于0.050.05在常用的置信度在常用的置信度=5%=5%下该模型没有显著意义下该模型没有显著意义 a a2 2的置信区间包含零点的置信区间包含零点a=0a=0落在置信水平为落在置信水平为95%95%的区间内的区间内 若若x=5.5x=5.5预测区间预测区间 y y:2.06212.0621,2.1606 2.1606,z z:0.38990.3899,3.84323.8432,预测值预测值 y=2.1113,z=2.1165y=2.1113,z=2.1165回归分析结果回归分析结果z z的预测没有什么价值!的预测没有什么价值!
25、2 2对原始数据先取平均,再用平均值做拟合对原始数据先取平均,再用平均值做拟合 数据中大多数病人的测试时间是数据中大多数病人的测试时间是0,4,8,0,4,8,(周),(周),个别病人是个别病人是5,7,5,7,(周),为了得到(周),为了得到CD4(CD4(或或HIV)HIV)的变化趋势,先在每个时间点上对的变化趋势,先在每个时间点上对CD4CD4取平均,再取平均,再用平均值做拟合用平均值做拟合这样做有什么问题呢?这样做有什么问题呢?注意:有的时间点上有上百个病人的注意:有的时间点上有上百个病人的CD4CD4,而有的时间点上只有几个病人的而有的时间点上只有几个病人的CD4CD4。数据数据(x
26、,y)(x,y):x=0,y=0:0.05:2;x=0,y=0:0.05:2;x=1,y=1:0.05:3;x=2,y=0,2,x=1,y=1:0.05:3;x=2,y=0,2,在图上共在图上共8484个点。个点。简例简例对数据对数据(x,y)(x,y)拟合一条直线,拟合一条直线,得得y=0.7647x+1.0784 y=0.7647x+1.0784 先在先在x=0,1,2x=0,1,2对对y y取平均得到取平均得到3 3个个点点,再拟合直线,得再拟合直线,得y=1.3333 y=1.3333 取平均后的取平均后的3 3个点在做拟合时的个点在做拟合时的权重相同权重相同;但是但是x=0,1x=0
27、,1的点都是的点都是4141个数据的平均值个数据的平均值,而而x=3x=3的点的点只是只是2 2个数据的平均值个数据的平均值 3 3拟合过度拟合过度用用4 4次、次、5 5次甚至更高次数的多项式作拟合次甚至更高次数的多项式作拟合 数据的起伏是由与时间本身无关的其它随机因数据的起伏是由与时间本身无关的其它随机因素引起的,不应该用增加时间的高次项来拟合素引起的,不应该用增加时间的高次项来拟合 注意拟合与插值在应用场合的差别注意拟合与插值在应用场合的差别 一般地说,多项式拟合不要超过一般地说,多项式拟合不要超过3 3次,对于次,对于本题如果用统计检验做显著性分析,可以本题如果用统计检验做显著性分析,
28、可以发现多数情况是以时间的发现多数情况是以时间的2 2次多项式为好次多项式为好 适用本题的显然是拟合而非插值适用本题的显然是拟合而非插值 4 4只按照图形做直观的定性判断,不做定量分析只按照图形做直观的定性判断,不做定量分析 为了比较为了比较4 4种疗法的优劣,对每种疗法的种疗法的优劣,对每种疗法的CD4CD4(或取平均)做散点图(或取平均)做散点图,或折线(散点连线)或折线(散点连线)图图,直观地比较疗法的优劣直观地比较疗法的优劣 没有普遍的指导意义,对于其它问题或没有普遍的指导意义,对于其它问题或数据,这样做不一定能得到结果数据,这样做不一定能得到结果 一种疗法的一种疗法的CD4CD4散点
29、图散点图(或折线图或折线图)在另一种在另一种疗法的上面疗法的上面,从统计意义上并不能表明其显著从统计意义上并不能表明其显著性性 作为数学建模题目应该给出作为数学建模题目应该给出定量的处理方法定量的处理方法!5 5双指标处理不当双指标处理不当 对于对于CD4CD4和和HIVHIV两个指标的处理,常用的方法是用某两个指标的处理,常用的方法是用某种函数形式将二者结合在一起种函数形式将二者结合在一起.由于由于CD4CD4越大越好,越大越好,HIVHIV越小越好,一些同学取二者越小越好,一些同学取二者之差或二者之商为综合指标之差或二者之商为综合指标 .这样简单处理的问题在于,这两个指标量纲不同这样简单处理的问题在于,这两个指标量纲不同,数量级差别较大数量级差别较大.恰当的办法是,先分别将其归一化(如将数值恰当的办法是,先分别将其归一化(如将数值变换到变换到0-10-1之间),然后取加权平均之间),然后取加权平均 .微分方程微分方程层次分析层次分析6.6.对其它建模方法的评价对其它建模方法的评价灰色系统预测灰色系统预测模糊评价模糊评价时间序列时间序列神经网络神经网络THANK YOUSUCCESS2024/5/7 周二25可编辑
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100