[发明专利]一种恶性肿瘤合并静脉血栓栓塞症风险预测方法有效

申请号：	202111007447.8	申请日：	2021-08-30
公开（公告）号：	CN113674864B	公开（公告）日：	2023-08-11
发明（设计）人：	徐玲;邓忠阳;刘海霞;罗兆林;雷海科;龙波;罗敏	申请（专利权）人：	重庆大学
主分类号：	G16H50/30	分类号：	G16H50/30;G16H50/70;G06F18/2415;G06F18/214;G06F18/25
代理公司：	重庆晟轩知识产权代理事务所(普通合伙) 50238	代理人：	王海凤
地址：	400044 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种恶性肿瘤合并静脉血栓栓塞风险预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种恶性肿瘤合并静脉血栓栓塞症风险预测方法，其特征在于，包括如下步骤：

S100:采集疑似患有和患有恶性肿瘤合并静脉血栓栓塞症病人的信息，一个病人对应一个样本，对采集的信息进行预处理得到基础数据集，对基础数据集中的所有样本标注标签确定负样本和正样本；

S200:对S100得到的基础数据集进行双向联合重采样得到训练集，该训练集中负样本和正样本数量相同；

S300:对训练集中每个训练样本进行特征筛选，去掉冗余特征得到新训练样本，所有新训练样本构成新训练集；

S400:构建和训练StackingXgbMlp模型

S410：所述StackingXgbMlp模型包括两层，第一层包括并联的一个XGBoost模型和一个MLP模型，第二层包括一个XGBoost模型，第一层中XGBoost模型和MLP模型输出作为第二层XGBoost模型的输入；

S420：初始化StackingXgbMlp模型参数，设定概率阈值；

S430：将新训练集中所有新样本同时输入第一层XGBoost模型和MLP模型中，对第一层XGBoost模型和MLP模型进行训练；

S440：当第一层XGBoost模型输出的新样本的预测概率值大于概率阈值时，则认为该新样本的预测标签为正样本，否则该新样本的预测标签为负样本；计算当前迭代次数中第一层XGBoost模型对所有新样本的预测准确率；

若MLP模型输出的新样本的预测概率值大于概率阈值时，则认为该新样本的预测标签为正样本，否则该新样本的预测标签为负样本；计算当前迭代次数中MLP模型对所有新样本的预测准确率；

若当前迭代次数中第一层XGBoost模型预测准确率与之前迭代次数中对应的预测准确率相比没有变化，同时MLP模型预测准确率与之前迭代次数中对应的预测准确率相比也没有变化时，则当前迭代次数中的第一层为训练好的第一层，将当前迭代次数中每个新样本对应的第一层XGBoost模型的输出和MLP模型的输出构成一个最新样本并执行下一步，所述最新样本的标签与其对应的新样本的标签一致；

若当前迭代次数中第一层XGBoost模型预测准确率与之前迭代次数中对应的预测准确率相比有变化或MLP模型预测准确率与之前迭代次数中对应的预测准确率相比有变化时，返回S430；

S450：将最新样本输入第二层XGBoost模型，对第二层XGBoost模型进行训练；

S460：若第二层XGBoost模型输出的最新样本的概率大于概率阈值时，则认为该最新样本的预测标签为正样本，否则该最新样本的预测标签为负样本；计算当前迭代次数中第二层XGBoost模型对所有最新样本的预测准确率；

若当前迭代次数中第二层XGBoost模型预测准确率与之前迭代次数中的预测准确率相比不再变化时，得到训练好的第二层，否则返回S450；

在第二层训练完成后得到训练好的StackingXgbMlp模型；

S500：对于一个未知是否患病的病人，将该病人的信息采用S100的方法进行预处理，再采用S300的方法进行特征筛选得到待预测样本，将该待预测样本输入训练好的StackingXgbMlp模型中，输出待预测样本患病的预测概率。

2.如权利要求1所述的恶性肿瘤合并静脉血栓栓塞症风险预测方法，其特征在于，所述S100中对采集的信息进行预处理的过程如下：

1)数据结构化，将获得疑似患有和患有静脉血栓栓塞症的恶性肿瘤病人的信息处理成Boolean类型的结构化数据；

2)缺失值处理，设定缺失率阈值，遍历所有病人的信息，对于某一类信息缺失率高于缺失率阈值，则删除该类信息，对于缺失率低于缺失率阈值信息，若某个病人的该类信息缺失，则采用该类信息的均值进行填充；

3)数据合并，数据结构化和缺失值处理后，按照病人的ID将病人的血检信息数据和病人临床基本信息数据对应合并起来，每个病人由一个向量来表示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆大学，未经重庆大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111007447.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种移动协同计算系统的任务分配方法和设备
下一篇：目标对象处理方法及装置

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种恶性肿瘤合并静脉血栓栓塞症风险预测方法有效

专利文献下载