[发明专利]基于第二组训练数据调整机器学习模型在审
申请号: | 201980029535.2 | 申请日: | 2019-04-16 |
公开(公告)号: | CN112055878A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | E·高希;L·J·埃谢曼 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 孟杰雄 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 第二 组训 数据 调整 机器 学习 模型 | ||
用于基于第二组训练数据来调整采取临床数据作为输入的第一机器学习模型的系统和方法。所述第一机器学习模型已经在第一组训练数据上被训练。方法包括:将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且使用第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的输出作为输入并且提供经调节的输出。
技术领域
本文中的公开内容涉及用于基于第二组训练数据调整机器学习模型的系统和方法。
背景技术
一般背景是在临床设置中使用(例如在临床决策支持系统中使用以进行临床预测、分析或诊断)的机器学习模型中。机器学习模型(诸如基于经验的预测模型)可以在特定训练数据集上使用数据集的特性特征来训练。如果在使用中经训练的模型被用于对未在用于训练模型的训练数据集中表示的数据(例如来自与用于训练模型的(一个或多个)群体相比不同的群体的新数据)进行分类或处理,那么其也不能够执行。这样一来,机器学习模型通常仅能够用在与用于训练模型的训练数据集类似的群体上。由于非常难以创建涵盖所有可能的群体(例如所有不同疾病类型、医院类型、地理和经济环境)的范例的训练数据集,此类机器学习模型因此能够不适于与不同的患者群体一起使用,例如不适于在具有不同护理实践的不同医院或区域处处置的具有不同慢性状况的患者。
发明内容
如上面指出的,在与特定患者群体有关的训练数据上训练的机器学习模型可能不产生针对其他患者群体的准确的输出。
解决这种问题的一种标准方法是例如使用特异于该群体的训练数据训练针对每个群体的新的模型(或使用新的训练数据重新训练老的模型)。这实质上针对模型被训练的每一个数据集创建了新的模型。然而,这种方法会是资源密集的。其还能够导致非常不同的模型,例如,如果模型在其能够被部署之前需要监管批准,则这会造成问题。不同的模型也会使模型的接口与工作流的集成更困难。此外,临床决策支持工具的不同版本将理想地对类似的患者具有类似的寻找输出。如果模型已经被使用并且想要部署其用于具有不同状况或特征的患者,这些问题会是更成问题的。
每次重新训练模型的备选方法是使用新的状况/特征训练新的模型,并且然后集成(例如平均或以其他方式组合)两个经训练的模型的输出。用于组合两个或更多个模型的输出的现有技术解决方案被称为“堆叠”。尽管这种方法使用原始模型的输出,当与第二完全分开的模型的输出组合时,组合的输出可能与原始模型的输出几乎没有相似之处。这会削弱对输出的信任,并且最终输出会缺乏透明性,例如讲述输出如何通过堆叠过程改变会是不容易的。
因此存在对以透明和鲁棒的方式改进上面描述的解决方案以使得机器学习模型能够基于额外训练数据更新的系统和方法的需要。
根据第一方面,提供了一种基于第二组训练数据来调整第一机器学习模型的方法,所述第一机器学习模型采取临床数据作为输入,所述第一机器学习模型已经在第一组训练数据上被训练。所述方法包括:将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且使用所述第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的输出作为输入并且提供经调节的输出。
根据第二方面,提供了一种用于基于第二组训练数据来调整第一机器学习模型的系统,所述第一机器学习模型采取临床数据作为输入,所述第一机器学习模型已经在第一组训练数据上被训练。所述系统包括存储器和处理器,所述存储器包括表示一组指令的指令数据,所述处理器被配置为与所述存储器通信并且执行所述一组指令。所述一组指令当由所述处理器执行时使所述处理器:将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且使用所述第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的输出作为输入并且提供经调节的输出。
根据第三方面,提供了一种包括非瞬态计算机可读介质的计算机程序产品,所述计算机可读介质具有被实现在其中的计算机可读代码,所述计算机可读代码被配置为使得在由合适的计算机或处理器执行时使所述计算机或处理器执行第一方面的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980029535.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:提取原料的粉碎装置
- 下一篇:抗VEGFR-2抗体
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置