[发明专利]一种高维删失数据下预测癌症预后风险的系统和方法在审
申请号: | 202110753724.3 | 申请日: | 2021-07-02 |
公开(公告)号: | CN113409946A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 杨跃东;张仲岳;柴华;王一 | 申请(专利权)人: | 中山大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/80;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高维删失 数据 预测 癌症 预后 风险 系统 方法 | ||
1.一种高维删失数据下预测癌症预后风险的方法,其特征在于,包括以下步骤:
S1:构建Cox神经网络模型,获取目标数据库的训练数据集、验证数据集;
S2:根据贝叶斯先验知识约束对训练数据集进行随机采样扰动;
S3:根据随机采样扰动后的训练数据集合,定义Cox神经网络模型的风险函数并计算损失函数;
S4:通过损失函数对Cox神经网络模型进行训练,更新Cox神经网络模型的网络权重;
S5:利用验证数据集对更新后的网络权重进行验证,若验证通过,则得到深度贝叶斯扰动模型,执行步骤S6;否则,则返回步骤S2重新进行随机采样扰动;
S6:将目标癌症患者的数据输入深度贝叶斯扰动模型中,输出该患者的癌症预后风险的预测值。
2.根据权利要求1所述的一种高维删失数据下预测癌症预后风险的方法,其特征在于,在所述步骤S2中,所述贝叶斯先验知识约束表示删失数据生存时间存在上界,且不会偏离非删失数据生存时间过多的约束;其中,删失数据和非删失数据存在于所述训练数据集中;训练数据集还包括生存时间;所述步骤S2具体过程为:
对训练数据集中的样本按照生存时间进行排序,并将生存时间转换为排序值;
将转换后的排序值作为高斯分布的均值,根据设置的高斯分布的方差,从该分布中重新采用得到样本新的生存时间,完成随机采用扰动。
3.根据权利要求2所述的一种高维删失数据下预测癌症预后风险的方法,其特征在于,在所述随机采样扰动过程中,对于拥有删失数据的删失样本,通过设置一个常数值,若该删失样本采样的结果处于高斯分布右侧比例为设置的常数值的面积中,那么该样本将被标记为非删失样本。
4.根据权利要求2所述的一种高维删失数据下预测癌症预后风险的方法,其特征在于,在所述步骤S3中,定义Cox神经网络模型的生存函数S(t),具体表示为:S(t)=Pr,其中,Pr表示患者在时间t之前的存活率,t小于数据收集到患者最后一次观察的时间,即生存时间T;由此,t时刻的风险函数定义为:
其中,δ表示常数;根据风险函数的定义,得到Cox比例风险函数为:
λ(t|x)=λ0(t)*exph(x)
其中,x∈X,X表示训练数据集中所有患者的组学数据,x表示影响患者生存时间的协变量,风险函数h(x)=βxi,λ0(t)代表t时刻的基线风险函数,β为常数,表示风险函数是患者生存时间协变量的线性组合;因此Cox神经网络模型的优化目标,也即最大似然函数表示为:
其中,Ei表示样本i的删失标签,Ei=1表示非删失样本,Ei=0表示删失样本;R(Ti)表示在样本i死亡时,仍然存活的样本集合,j为该样本集合的个体;由此,基于Cox比例风险的神经网络的损失函数为:
其中,θ表示Cox神经网络模型的网络权重;接着对预测损失函数进行改写,得到通过扰动采样机制引入贝叶斯先验知识后的损失函数,具体表示为:
其中,Tipb表示经过扰动后的新的生存时间;接着,结合深度学习优化技术,向损失函数中引入L2正则化项,损失函数最终表示为:
5.根据权利要求4所述的一种高维删失数据下预测癌症预后风险的方法,其特征在于,在所述步骤S6中,首先获取目标癌症患者的组学数据X、生存时间T和删失标签E,将其作为深度贝叶斯扰动模型的输入,由深度贝叶斯扰动模型进行风险预测,最后输出目标癌症患者的风险预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110753724.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置