[发明专利]非小细胞肺癌集成预后预测模型及其构建方法、装置和应用有效

专利信息
申请号: 202110500821.1 申请日: 2021-05-08
公开(公告)号: CN113223727B 公开(公告)日: 2022-07-12
发明(设计)人: 吕旭东;胡丹青;段会龙 申请(专利权)人: 浙江大学
主分类号: G16H50/70 分类号: G16H50/70;G06K9/62
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 曹兆霞
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 细胞 肺癌 集成 预后 预测 模型 及其 构建 方法 装置 应用
【说明书】:

发明公开了一种非小细胞肺癌集成预后预测模型及其构建方法、装置和应用,首先,通过数据平衡训练数据集训练得到最初的基预后预测模型;然后,通过主动采样机制,基于所选择的查询策略,在每一次迭代中选取一组包含信息最多的未标注样本,标注后加入到训练集中,重新训练基预后预测模型;之后,通过从基预后预测模型池中选择一组预测性能最佳的基预后预测模型作为集成预后预测模型的基础。此外,多次随机初始化训练数据集及K折验证集设置,增加集成预后预测模型的稳定性和泛化能力。依据此来解决数据不平衡问题导致的模型性能下降问题,进而提高集成预后预测模型的鲁棒性。

技术领域

本发明属于医疗数据挖掘领域,特别涉及癌症预后预测方面,具体为一种非小细胞肺癌集成预后预测模型及其构建方法、装置和应用。

背景技术

肺癌(Lung cancer)是肺部的恶性肿瘤,是指由肺组织细胞异常生长,并可能侵袭邻近组织器官,是指转移扩散到身体其他部位的疾病。常见症状有咳嗽、咳血、体重减轻、气短和胸痛等。肺癌根据其组织病理分型,可大致分为非小细胞肺癌(NSCLC,Non-small celllung cancer)和小细胞肺癌(SCLC,Small cell lung cancer)。其中,非小细胞肺癌大约占全部肺癌患者的85%,且其5年相对存活率仅有23.3%,已经成为我国社会医疗的重大负担。

近年来,随着精准医学的不断发展,大量新的治疗措施不断涌现,相应的临床证据也为医生在进行治疗方案决策时提供了强有力的证据支撑。除了癌症本身的一些特征,癌症的分期,患者的既往诊疗历史等,癌症的预后在复杂的多学科治疗方案选择过程中起到越来越重的作用。特别地,对于术后的非小细胞肺癌患者,癌症的复发可能发生在手术之后的任意时间,并且将会严重威胁患者的生命。因此,精准的预后预测,能够优化临床实践中的决策,例如个性化的随访方案、后续治疗的时机和方式等,从而使患者能够接受最为合适的管理,进而提升他们的生存质量甚至延长他们的生存期。

在这一背景下,许多研究采用各种机器学习和数据挖掘方法,利用大量临床、影像、组学数据,构建各种预后预测模型。理论上,构建一个典型的预后预测模型,首先需要确定一个时间段,然后来判断患者从接受手术之后的这一时间段中是否发生复发、死亡等结局事件;然后将这些结局事件作为目标,采用合适的监督学习算法,构建预后预测模型。尽管这些模型能够从历史数据中学习到一些不平凡的知识,并且展现了良好的预测性能,但是,数据不平衡问题依然是构建高鲁棒性预后预测模型所要面临的主要问题。针对我们的数据,仅有7.6%的患者在术后一年内复发,而一年内死亡的患者更少,仅有4.6%。尽管数据不平衡问题会随着时间的延长而在一定程度上得以缓解,但依然会使得中短期预后预测模型偏向于多数类样本,从而影响模型预测性能。

因此,迫切需要一种训练方法来解决数据不平衡导致预后预测模型鲁棒性低的问题。

发明内容

鉴于上述,为解决现有预后预测方法处理不平衡数据时性能下降的问题,本发明提供一种非小细胞肺癌集成预后预测模型及其构建方法、装置和应用,得到高鲁棒性的预后预测模型。

第一方面,本发明实施例提供了一种非小细胞肺癌集成预后预测模型的构建方法,包括以下步骤:

(1)将原始数据集按K折交叉验证机制分割成K个子集,并从K个子集中选择1个子集作为验证集Ddev,其余子集合并成训练数据池Dpool

(2)根据预定义的训练集样本个数Ninit,针对每个类别,从训练数据池Dpool中抽取Ninit/2个样本组成训练数据集Dtrain,并从训练数据池Dpool中移除组成训练数据集Dtrain的样本;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110500821.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top