[发明专利]一种高维删失数据下预测癌症预后风险的系统和方法在审
申请号: | 202110753724.3 | 申请日: | 2021-07-02 |
公开(公告)号: | CN113409946A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 杨跃东;张仲岳;柴华;王一 | 申请(专利权)人: | 中山大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/80;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高维删失 数据 预测 癌症 预后 风险 系统 方法 | ||
本发明提出一种高维删失数据下预测癌症预后风险的方法,包括:构建Cox神经网络模型,获取目标数据库的训练数据集、验证数据集;根据贝叶斯先验知识约束对训练数据集进行随机采样扰动;根据随机采样扰动后的训练数据集合,定义Cox神经网络模型的风险函数并计算损失函数;通过损失函数对Cox神经网络模型进行训练,更新Cox神经网络模型的网络权重;利用验证数据集对更新后的网络权重进行验证,若验证通过,则得到深度贝叶斯扰动模型,对目标癌症患者的癌症预后风险进行预测;否则,重新进行随机采样扰动;本发明还提出一种预测癌症预后风险的系统,用于解决现有预测方法在此类数据中表现不佳的问题,提高癌症生存分析的深度学习方法的性能。
技术领域
本发明涉及癌症预后生存分析领域,具体涉及一种高维删失数据下预测癌症预后风险的系统和方法。
背景技术
随着医学辅助技术的发展,研究者越来越多地尝试将其应用于癌症的辅助治疗。其中,癌症预后生存分析是一种关键的辅助技术,它能根据病人的各项生理指标去预测病人的潜在风险,从而帮助医生选择相应的治疗方案。
癌症生存分析的最大难点在于利用删失样本的信息,揭示高维组学数据对患者预后风险的复杂关联机制。现有技术包括:针对删失数据设计的一种数理统计方法:Cox比例风险模型(简称Cox模型)应用到深度学习中,将Cox比例风险的线性函数替换为用神经网络拟合的函数,建立了基于Cox比例风险的神经网络模型,并将该深度学习模型应用于样本数量较多的疾病预后生存分析;将基于Cox比例风险的神经网络模型应用于癌症患者的生存分析中,并且结合了正则化、Dropout等多项深度学习的优化技术,用于提升模型在小样本数据的预测精度。然而,此方法将对数据样本量要求较高的深度学习模型应用于小样本数据集中,也没有对删失数据做进一步的处理,因此让拟合能力强的神经网络对删失数据的预测具有偏向性,存在较强的过拟合问题。现有技术针对此问题,修改了Cox模型中的比例风险假设,向模型引入了时间信息,提升了基于Cox比例风险的神经网络模型在样本较多的数据集中的性能。该改良方法主要提升了基于Cox比例风险的神经网络模型在样本量较多,时间信息格式符合要求的数据集中的表现,没有解决基于Cox比例风险的神经网络模型在小样本数据集中的过拟合问题,方法的性能被限制。
中国发明专利公开号CN111312393A(公开日为2020-06-19),公开了一种结合主动学习的时序深度生存分析系统,该系统包括数据采集模块、主动学习模块、时序深度生存分析模块;数据采集模块用于获取待分析对象的生存数据;主动学习模块结合主动学习方法选择部分右删失数据标注生存时间;时序深度生存分析模块构建时序深度生存分析神经网络模型,将未删失数据和右删失数据作为模型输入,得到待分析对象的生存时间预测结果。该发明能够充分利用生存数据中的右删失数据及时序特征。较之以往传统的生存分析模型,该发明解决了高维度数据难处理的问题,以及生存分析中仅有少量未删失数据情况下模型表现不佳的问题;同时增加了数据时间维度特征的提取和利用,扩大了模型的应用范围,提高了模型的表现效果,但是存在时间复杂度高,算力开销大,普适性不够高的缺陷。
发明内容
本发明的目的是针对现有技术存在的缺陷,提供一种时间复杂度低、算力开销小、普适性高的高维删失数据下预测癌症预后风险的系统和方法。
为解决上述技术问题,本发明的技术方案如下:
一种高维删失数据下预测癌症预后风险的方法,包括以下步骤:
S1:构建Cox神经网络模型,获取目标数据库的训练数据集、验证数据集;
S2:根据贝叶斯先验知识约束对训练数据集进行随机采样扰动;
S3:根据随机采样扰动后的训练数据集合,定义Cox神经网络模型的风险函数并计算损失函数;
S4:通过损失函数对Cox神经网络模型进行训练,更新Cox神经网络模型的网络权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110753724.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置