[发明专利]关于疾病的多状态模型的机器学习在审
申请号: | 202111595755.7 | 申请日: | 2021-12-24 |
公开(公告)号: | CN115132358A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | A·科坦;N·佩居谢;A·吉尤;S·卡萨希安 | 申请(专利权)人: | 达索系统公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/50;G06N20/00;G06K9/62 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 赵腾飞 |
地址: | 法国韦利济*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关于 疾病 状态 模型 机器 学习 | ||
本公开内容特别涉及一种用于机器学习函数的计算机实现的方法,所述函数被配置为:基于表示患者的医学特征的输入协变量,关于具有多个状态和多个状态之间的转变的疾病的多状态模型,输出针对间隔集合中的每个间隔的转变特定概率的分布,间隔集合形成随访期的细分。机器学习方法包括提供患者集合的协变量和事件发生时间数据的数据集,以及基于数据集来训练该函数。这形成了用于确定关于疾病的多状态模型的准确患者数据的改进的解决方案。
技术领域
本公开内容涉及生物统计学领域,并且具体而言,涉及与机器学习函数有关的方法、数据结构和设备,所述函数被配置为基于表示患者的医学特征的输入协变量,关于具有多个状态和多个状态之间的转变的疾病的多状态模型,输出转变特定概率的分布。
背景技术
疾病预后对于医生在做出医疗决策时是非常重要的,并且它涉及估计患者风险的专门算法。事件历史分析,也称为存活分析,旨在预测直到发生一个或多个未来感兴趣事件为止的时间,并且在疾病预后的背景下,其用于包括健康护理的多个领域。特别地,存活分析在健康护理中非常经常用于对患者结果存活进行建模,以便评估治疗功效。在临床实践中,临床医生可能对疾病的完全演变更感兴趣,而不仅仅是对独特或复合事件更感兴趣。因此,已经开发了多状态方法作为存活分析的推广(generalization),其中多个事件可以随时间连续发生(参见参考文献1)。
疾病-死亡模型是由三种状态:“健康”、“复发”或“患病”和“死亡”组成的特定多状态模型。这是用于跟踪癌症患者通过中间非致命复发状态和死亡状态的演变的最常见结构,例如在卵巢癌(参见参考文献2)或慢性骨髓性白血病(参见参考文献3)中。疾病-死亡模型的其他应用包括阿尔茨海默病(参见参考文献4)和心血管疾病(参见参考文献5)。
在这一背景下对事件历史分析有两个主要的文献流派。
第一流派是基于传统统计理论的,包括三种方法。(i)非参数方法,特别包括Kaplan Meier估计器(参见参考文献6)和Nelson-Aalen估计器(参见参考文献7)。它们传统上用于对事件的风险进行建模,而不对事件时间的分布进行任何假设,并且它们不能进行个性化建模。(ii)参数方法实现个性化建模。事件时间通过线性回归函数与各个协变量相关,并且它们根据潜在的概率分布进行分布。(iii)半参数方法允许非参数模型和参数模型之间的折衷。它们通过线性回归函数引入协变量效应,但是它们没有对事件时间的分布做出任何假设。Cox比例风险(P.H.)模型是多变量存活分析中最广泛使用的半参数模型(参见参考文献8)。在多状态分析中,大多数现有文献使用转变特定的Cox P.H.模型作为(半)马尔可夫过程来描述多个状态之间转变的风险(参见参考文献9和10)。然而,这些传统方法依赖于关于事件时间的分布或关于协变量与事件时间之间关系的强统计假设。特别是CoxP.H.模型做出关于协变量与事件风险之间关系的线性假设。该假设在许多现实世界应用中显示出局限性,因为协变量的效应可以响应于事件风险的变化而以非线性方式变化。在Cox模型中默认不考虑协变量之间的相互作用。这限制了该模型对大数据的应用,因为大多数变量不与建模的结果直接相关,而是将与协变量效应相互作用。例如,代谢途径中的遗传变异可能不直接影响癌症复发的风险,但它可能降低或增强抗肿瘤治疗效果。Cox模型的这些局限性在临床环境中是众所周知的。
为了应对这些挑战,已经出现了采用新机器学习算法的第二种文献。特别地,已经开发了神经网络来在无统计假设框架中扩展Cox P.H.模型。Faraggi和Simon已经特别成功地将传统的人工神经网络引入生存分析(参见参考文献11)。最近,Luck等人(参见参考文献12)、Katzman等人(参见参考文献13)、Fotso(参见参考文献14)、Kvamme等人(参见参考文献15)以及其他人(还参见参考文献16、17和18)已经扩展了深度神经网络。通过采用最先进的深度学习方法和更大的临床数据集,与Cox P.H.模型相比,他们在预测患者存活方面显示出明显改善。无论如何,它们的方法仍然局限于独特临床事件的情况。此外,大多数最近的方法直接预测事件时间的离散时间分布,作为神经网络的输出。作为对连续时间生存数据的近似,它们都执行将连续时间尺度划分为离散时间间隔。这导致相对明显的近似误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达索系统公司,未经达索系统公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111595755.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:布片信息数字化系统及其方法
- 下一篇:一种全固相合成醋酸亮丙瑞林的方法