1、第 卷第 期运 筹 与 管 理 ,年 月 收稿日期:基金项目:国家自然科学基金面上项目()作者简介:李清(),通讯作者,女,江苏常州人,讲师,博士,研究方向:诊疗链优化与资源配置;苏强(),男,河北石家庄人,教授,博士生导师,博士,研究方向:运营管理,医疗健康管理;邓国英(),男,河南濮阳人,住院医师,博士,研究方向:创伤急救。基于随机恢复时间的骨盆骨折创伤患者手术分配优化李 清,苏 强,邓国英(上海政法学院 经济管理学院,上海 ;同济大学 经济与管理学院,上海 ;上海市第一人民医院 创伤中心,上海 )摘要:骨盆骨折是一种高能量创伤且通常伴有多发伤,手术是主要的治疗方法,本文制定并优化创伤患者
2、的手术分配计划。首先根据患者入院时的生命稳定状态,将手术患者分为恢复期和计划期两类;针对两类患者的不同特点,为恢复期患者设置随机恢复时间,以最大期望收益为目标建立马尔可夫决策过程模型;根据医院实际情况设计实验,采用后向迭代算法求解得到最优分配策略;改变惩罚函数形式和恢复期患者数量,制定不同场景的分配策略,提高医疗资源利用率。采用二次惩罚函数时,最优分配曲线呈现开关曲线形式;恢复期患者数量越多,其享有的优先权越高。关键词:骨盆骨折;马尔可夫决策过程;随机恢复时间中图分类号:文章标识码:文章编号:():,(,;,;,):,:,(),()(),()(),(),()()(),(),:,:;引言骨盆骨折
3、是由骨盆直接挤压引起的严重创伤,常伴有其他器官和系统损伤,致残率高达 。近年来,机动车和工伤事故频繁发生,骨盆骨折已成为骨科常见的损伤 。严重的骨盆骨折会导致失血性休克和重要脏器损伤,救治不当会产生高达 的死亡率。根据骨盆的稳定性,骨科创伤协会采用 分型方法将其分为 稳定型,部分稳定型和 不稳定型三类 ,型和 型患者通常建议手术治疗。骨盆骨折急救遵守创伤生命支持原则,首先抢救生命,生命体征稳定后再进行相关检查,确定创伤类型,制定骨折手术计划。在医疗资源共享背景下,优化手术安排,合理分配医疗资源至关重要。本文创新点如下:()根据患者入院时生命状态将其分为恢复期和计划期两类,恢复期患者经过随机恢复
4、时间到生命稳定状态后手术。()建立马尔科夫决策过程模型,得到最优分配策略,分析最优策略结构性质。()调整恢复期患者的恢复时间、数量和参数,设置不同形式惩罚函数,进行敏感性分析。文献综述手术是医院重要的收入来源,也是不可忽视的成本中心,手术资源利用直接影响手术服务水平。在预约调度和手术分配方面,以传统预约排期模型为基础,等 建立三类患者临床预约的随机规划模型,采用先进调度方法优化性能指标。等 考虑不同部门的计划和容量,统计住院时间和住院人数,建立 模型制定每日手术安排计划。医疗设备动态分配方面,朱黎敏等 考虑三类患者,以最大化满足患者检查为目标建立有限阶段马尔科夫决策支持模型,制定最优预约调度策
5、略。针对 室的管理,周杰等 以最大化系统期望收益为目标,建立 模型,制定不同容量的管理策略,研究不同策略对患者等待时间的影响。和 考虑两类不同等待时间和收益的患者,建立 模型,优化门诊调度。刘阳和耿娜 考虑患者不同需求、患者失约和医生加班等情况,以最大化检查的期望收益和最小化加班惩罚成本为目标,建立有限时间 模型。考虑随机因素是手术调度研究的热点。基于随机手术时间、住院时间和手术室容量有限等情况,和 以最小化手术成本和延误成本为目标建立混合整数非线性规划,设计自适应列约束生成算法求解。等 综合考虑手术时间和恢复室容量的不确定,研究骨科手术患者的择期手术排序问题。等 考虑手术时间随机和患者随机缺
6、席情况,建立分布式鲁棒优化模型,对手术室调度问题进行优化。已有研究多面向全院患者,设计一台或多台设施的分配策略。本文聚焦创伤领域,为骨盆骨折患者制定手术分配策略。第 节建立马尔科夫决策运 筹 与 管 理 年第 卷过程模型;第 节设计实验,分析得出相关结论;第节总结全文,指出文章不足和未来拓展研究。考虑随机恢复时间的马尔科夫决策过程模型 问题描述本文将手术患者分为恢复期和计划期两类,计划期患者入院时生命状态稳定,确定骨折类型后制定手术方案。生命状态不稳定的患者首先抢救生命,术后恢复至稳定状态再接受骨盆骨折手术,这类患者为恢复期患者。恢复时间受到患者年龄、身体状况和骨折类型等因素影响,设置随机恢复
7、时间。系统中同时存在两类患者时,从中选择一类患者进行手术,以最大化期望收益。模型建立每次选择一个患者进行手术,产生收益;满足条件而没手术的患者在队列等候,产生等待成本;规划期结束仍没手术的患者产生惩罚成本。符号的定义和说明如下:(,):服务周期总数 ,:决策集合:恢复期患者:计划期患者(,):恢复期患者恢复时间 ,:周期计划期患者的预约计划:恢复期患者每台手术收益:计划期患者每台手术收益:恢复期患者每周期等待成本:计划期患者每周期等待成本:恢复期患者的惩罚成本:计划期患者的惩罚成本 ,:不同恢复期患者的到达概率:计划期患者接受手术的概率:周期等待手术的恢复期患者:周期等待手术的计划期患者:周期
8、进行手术的恢复期患者数量:周期进行手术的计划期患者数量:周期后没有手术的恢复期患者数量:周期后没有手术的计划期患者数量(,):周期状态空间(,):周期状态 选择决策 的收益(,):惩罚函数线性形式:(,)非线性形式:(,)本文以最大化期望收益为目标,建立有限阶段马尔科夫决策过程模型,采用后向迭代算法求解。()状态空间系统状态采用向量(,)表示,其中,表示第 周期等待手术的计划期患者数量;,表示第 周 期 恢 复 时 间 为 的 恢 复 期 患 者 数 量。,(,)表示第 周期恢复时间为 的恢复期患者数量。()决策集合种决策,选择恢复期患者手术,选择计划期患者手术,不选择患者手术。()转移概率计
9、划期患者以概率(,)转移到 周期,如式()。(,),()为第 周期决策;为第 周期手术的计划期患者数量,时,。恢复时间为 的恢复期患者,其转移概率为式()。(,),()表示第 周期手术的恢复期患者数量,时,。恢复时间为 的恢复期患者,其转移概率如式()。(,),(),为患者的联合到达概率。()收益函数本文以最大化期望收益为目标,制定手术安排。周期时,状态(,)下选择决策 的收益为(,)。根据 方程,最佳收益如式():第 期李 清,等:基于随机恢复时间的骨盆骨折创伤患者手术分配优化(,)(,)(,)()式()是一个递归结构,其详细展开式如式()。(,),()(,),(,)(,)()(,)(,)(
10、,)()(,)(,),(,),(,),(,),(,),()周期有 ,个恢复期患者和 个计划期患者,等待成本为 ,。若恢复时间为 的恢复期患者在 周期到达,且无计划期患者,概率为 ,(),系统进入新状态(,);若计划期患者按时接受手术,且恢复时间为 的 恢 复 期 患 者 在 周 期 到 达,概 率 为,系统进入新状态(,)。最优决策见式()。式()的最终状态见式()。(,)(,)(,)()式()为未手术患者的惩罚成本。该问题的目标函数如式()。(,)()为最佳期望收益,(,)为初始状态的最佳期望收益。初始状态设置为:,个恢复期患者,个计划期患者和 ,个恢复时间为(,)的恢复期患者。案例分析与讨
11、论采用 自带求解器,笔记本电脑的操作系统为 ,为:,主频为 ,内存为 。数据收集和参数设定收集上海市第一人民医院 年骨科的数据,设置 种恢复期患者,其恢复时间分别为,和 ,参数设置见表 。等待成本等于每日住院费用加每日平均工资,等待帮助恢复期患者达到更稳定的生命状态,因此其等待成本小于计划期患者。规划期末没有安排手术的患者将流失,恢复期患者有更高的收益和风险,因此其惩罚成本大于计划期患者。表 参数设置恢复期患者计划期患者收益 等待成本 惩罚成本 到达概率 实验结果与讨论()决策路径分析初始状态(期初各患者数量)和各服务周期患者到达情况已知,考虑 个服务周期,求解 模型得到状态路径(各周期等待患
12、者数量)和决策路径(各周期决策),见表 。表 决策路径分析初始状态各服务周期患者到达情况各服务周期状态路径决策路径 ()最优分配策略 开关曲线任一周期患者的最大数量为 ,。第三个周期中患者最多等待人数为 ,本文采用第三个周期来解释最优分配策略。运 筹 与 管 理 年第 卷采用非线性惩罚函数得到最优分配策略,如图。该场景有 个恢复期患者,其恢复时间分别为,和 ,记为 ()。图 ()的最优分配策略()在任一服务周期,给定计划期患者数量,当恢复期患者数量小于关键指标时,选择计划期患者手术,反之,选择恢复期患者手术。开关曲线展示了实时动态资源分配情况。()关键指标单调性任一周期状态(,),存在关键指标
13、()。当 ()时,选择恢复期患者进行手术,当 ()时,选择计划期患者进行手术。关键指标()呈 现 单 调 递 增 形 式,若 ,则 有()()。图 中关键指标(),计划期患者为 时,当恢复期患者小于 ,选择计划期患者手术;否则,选择恢复期患者手术。关键指标随计划期患者数量增加而增加()()(),最优分配曲线呈现出逐步上升趋势。()关键指标与恢复期患者数量的关系假设恢复时间为 ,和 的恢复期患者数量最多为 ,和 个,构造 ()种场景。分别表示 类恢复期患者数量。定义 种场景:,;,;,;,;,。表 比较了各场景下 ,和 的值。表示恢复期患者数量,表示 与其他场景 的差值,表示 与其他场景关键指标
14、的差值。表 不同场景下关键指标值()的比较()场景 ()()()等()等 ()图 ()最优分配策略图 ()最优分配策略第 期李 清,等:基于随机恢复时间的骨盆骨折创伤患者手术分配优化图 ()最优分配策略综上,相同的场景有相同分配策略,和 除外。相同,恢复时间为 的恢复期患者为 个时,最初的 个关键指标与其他场景不同,后续值一样。当恢复时间为 的恢复期患者数量大于 时,恢复期患者比计划期患者享有优先权。与其他场景关键指标差值 与其他场景间 差值;随着计划期患者的增加,不同场景间关键指标差值不断增加,直至到达最大值 。关键指标值越大,恢复期患者优先权越低;越大,恢复期患者优先权越高。()恢复期患者
15、数量对最优策略的影响图 图 分别展现了 的最优分配情况。与 ()相比,的最优分配曲线有不同程度的下降。()中关键指标()的值为 ,中关键指标()的值分别为 ,和 ,都小于 。()中,对任一 ,其关键指标()的值要大于 (),()和 ()。系统中,恢复期患者数量越多,其享有的优先权越高。此外,和 ,中 的差值分别为,和 ,其关键指标的差值也都不大于 ,和 ,即关键指标差值小于等于场景间 的差值。结论本文在有限规划期内,研究了计划期和恢复期两类骨盆骨折创伤患者的手术安排问题。收集上海市第一人民医院的数据,设计患者参数,得到如下结论:()惩罚函数采用二次函数形式时,最优分配曲线呈现出开关曲线形式。惩
16、罚函数为一次函数时,选择哪一类患者手术取决于患者参数。采用二次函数形式的惩罚函数时,有以下结论成立。()存在关键指标(),当恢复期患者数量()时,选择恢复期患者进行手术;当 ()时,选择计划期患者进行手术。此外,关键指标具有单调性,如果,则有()()。()在任一服务周期,恢复期患者总数相同的场景通常有相同的分配策略,和 时存在例外。恢复期患者数量越多,其享有的优先权越高。此外,各场景关键指标差值小于等于不同场景中 的差值,随着计划期患者数量增加,关键指标的差值呈现出逐渐增大的趋势。本文也存在较多不足:首先,初始状态随机设置患者数量;其次,没有考虑患者批量到达的情况,模型中假设每个服务周期只有一
17、个患者到达。再者,由于骨盆骨折类型、患者身体情况和手术方案不同,手术时间因人而异,文中假设手术时间为一个服务周期。未来研究中,应考虑上一规划周期未手术的患者数量,设置合理的系统初始值。根据实际情况修改患者的到达模式,延长规划周期,作出连续决策,更符合现实情况。参考文献:,():,:,():,():,():朱黎敏,耿娜,谢晓岚 基于 的门诊病人图像检查最优预约调度 工业工程与管理,():周杰,李军,郭鹏,等 急诊非强占优先权下 排队系统常规病人等待时间及损失率 系统工程理论与实践,():,():刘阳,耿娜 面 向 多检 查 的 门 诊 患 者 调 度 研 究 运筹与管理,():,():,():,():运 筹 与 管 理 年第 卷