[发明专利]基于对比的包含竞争风险的动态生存分析设备有效
申请号: | 202110692395.6 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113314218B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 黄正行;洪草根;陈晋飙 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 盛影影 |
地址: | 310012 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对比 包含 竞争 风险 动态 生存 分析 设备 | ||
1.一种基于对比的包含竞争风险的动态生存分析设备,其特征在于,包括:数据输入单元、数据增强单元、表征提取单元、轨迹生成单元、轨迹鉴别单元、对比学习单元和生存分析预测单元;
所述数据输入单元用于向所述数据增强单元和表征提取单元输入训练数据对其进行训练,所述训练数据所在数据集其中代表患者多次入院所记录的轨迹信息,代表第k次入院时第i位患者的特征,代表观察第k次入院时第i位患者存活情况的时间窗口,代表观察第i位患者第k次入院时距离第1次入院的相对时间,代表第k次入院时第i位患者在时的存活情况;
所述数据增强单元包括:
患者轨迹随机打乱模块,用于随机打乱患者的轨迹顺序;
患者轨迹随机遮罩模块,用于随机对患者轨迹数据中第k次入院的特征数据xk进行遮罩,由相同维度的全零向量替换xk;
所述表征提取单元主要用于分别提取患者真实轨迹、随机打乱后的患者轨迹与随机遮罩后的患者轨迹的表征;
所述轨迹生成单元主要基于所述的随机遮罩后的患者轨迹的表征,生成遮罩数据所对应的特征数据并用与真实的轨迹数据xk拟合;
所述轨迹鉴别单元主要用来鉴别表征提取单元所提取的轨迹表征是否来自于患者的真实轨迹;
所述对比学习单元包括:
基于患者真实轨迹表征与随机打乱轨迹表征的对比模块,通过提高患者真实轨迹表征与自身随机打乱轨迹表征的相似度,降低自身真实轨迹表征与其他患者随机打乱轨迹表征的相似度,来加强表征提取单元的表征提取能力;
基于患者真实轨迹表征与轨迹生成后表征的对比模块,通过提高患者真实轨迹表征与自身轨迹生成后表征的相似度,降低自身真实轨迹表征与其他患者轨迹生成后表征的相似度,来加强表征提取单元的表征提取能力;
所述生存分析预测单元用于对表征提取单元输出的所述患者真实轨迹表征进行拟合,得到患者生存情况的预测结果;
所述生存分析预测单元由e个第二多层感知器与一个第二Sigmoid输出层组成,通过以下公式进行计算:
…
其中,表示输入层,e代表所述数据集D中患者的死因数目,Wt1为所述第二Sigmoid输出层的第一层网络的权重矩阵,bt1为所述第二Sigmoid输出层的第一层网络的偏置,表示所述生存分析预测单元的对患者关于第e个死因的生存分析的预测结果;
所述数据输入单元向所述数据增强单元输入训练数据对其进行训练的具体方法为:
将所述数据集D按照一定比例划分为训练集和测试集;
将所述数据集D的训练集输入所述数据增强单元,生成随机打乱后的患者轨迹δs与随机遮罩后的患者轨迹δm,并与初始患者轨迹数据δ一起输入所述表征提取单元,提取各自的轨迹表征将患者轨迹遮罩表征输入所述轨迹生成单元,生成遮罩数据所对应的特征数据并作为填充物替换δm中的遮罩数据构建患者遮罩后生成的轨迹δg,δg又作为所述表征提取单元的输入,提取相应的表征所述轨迹鉴别单元以轨迹表征作为输入,输出对应的轨迹表征的鉴别结果之后所述对比学习单元以轨迹表征以及轨迹表征的鉴别结果作为输入,通过学习患者自身特征之间的关系来增强所述表征提取单元,最后将输入所述生存分析预测单元来展开预测工作,并对其进行训练;
将所述数据集D的测试集输入所述表征提取单元,生成患者初始轨迹特征表示并输入所述生存分析预测单元,对其进行验证;
将所述数据集D的训练集输入所述数据增强单元与所述表征提取单元,生成所述轨迹表征并输入所述轨迹生成单元、所述轨迹鉴别单元、所述对比学习单元和所述生存分析预测单元,对其进行训练的具体方法为:
选择绝对误差函数作为所述轨迹生成单元的重建损失函数,
其中为所述轨迹生成单元的损失函数,为数学期望函数,
选择交叉熵函数作为所述轨迹鉴别单元的损失函数,
其中,为所述轨迹鉴别单元的损失函数,分别为所述表征提取单元提取出来的第i位患者第k次入院时的初始患者轨迹表征、患者生成遮罩数据后的轨迹表征以及患者轨迹随机打乱后的表征,表示所述轨迹鉴别单元的鉴别结果,为数学期望函数;
所述基于患者真实轨迹表征与随机打乱轨迹表征的对比模块的损失函数公式为:
所述基于患者真实轨迹表征与轨迹生成后表征的对比模块的损失函数公式为:
所述生存分析预测单元的损失函数由两部分组成,分别为分类损失和负对数似然损失所属损失各自公式为:
其中,为所述生存分析预测单元的分类损失,为所述生存分析预测单元的负对数似然损失,代表第k次入院时第i位患者在时的存活情况,代表临床目标生存情况预测结果;
所述轨迹生成单元、所述轨迹鉴别单元和所述生存分析预测单元的总损失函数为:
其中,λ1,λ2,λ3,λ4为超参数;
优化所述总损失函数在所述总损失函数不再下降时,停止训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110692395.6/1.html,转载请声明来源钻瓜专利网。