[发明专利]基于xgboost模型的慢性病复发预测方法、装置和计算机设备有效
申请号: | 201811560282.5 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109493975B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 郑劲平;陈一君;梁振宇;李菁;张冬莹;罗俊宇 | 申请(专利权)人: | 广州医科大学附属第一医院;广州天鹏计算机科技有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30 |
代理公司: | 广州文冠倪律知识产权代理事务所(普通合伙) 44348 | 代理人: | 倪小敏 |
地址: | 510120 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xgboost 模型 慢性病 复发 预测 方法 装置 计算机 设备 | ||
1.一种基于xgboost模型的慢性病复发预测的装置,其特征在于,所述装置包括:
数据获取模块,用于获取待测诊断数据;所述待测诊断数据包括进出院时间;
样本确定模块,用于根据所述进出院时间,将所述待测诊断数据作为模型训练样本,其中当所述进出院时间包括初次出院时间和再次入院时间时,获取所述初次出院时间和所述再次入院时间;计算所述再次入院时间与所述初次出院时间的间隔时间;当所述间隔时间小于365天时,生成所述待测诊断数据的正标签,并且,当所述间隔时间大于等于365天时,生成所述待测诊断数据的负标签,将所述正标签的待测诊断数据与所述负标签的待测诊断数据按预设比例,作为所述模型训练样本;
模型获取模块,用于采用所述模型训练样本训练所述xgboost模型,得到训练后模型;所述训练后模型用于对所述待测诊断数据进行慢性病复发预测。
2.根据权利要求1所述的装置,其特征在于,所述将所述正标签的待测诊断数据与所述负标签的待测诊断数据按1:1.5的比例,作为所述模型训练样本。
3.根据权利要求1所述的装置,其特征在于,包括:
所述数据获取模块,用于获取慢性病诊断数据;
所述样本确定模块,用于将所述慢性病诊断数据按照正则表达方式,或命名实体识别方式,提取有用的诊断数据,作为所述待测诊断数据。
4.根据权利要求1所述的装置,其特征在于,所述装置还包括:
缺失数据确定模块,用于确定所述待测诊断数据中的单项缺失数据;
缺失量获取模块,用于获取所述单项缺失数据的数据缺失量;
空值处理模块,用于根据所述数据缺失量,对所述待测诊断数据进行空值处理,得到有效的待测诊断数据。
5.根据权利要求4所述的装置,其特征在于,所述空值处理模块包括:
数据总量获取子模块,用于获取所述待测诊断数据的单项数据总量;
百分比计算子模块,用于计算所述数据缺失量与所述单项数据总量的比值,得到数据缺失百分比 ;
平均值处理子模块,用于当所述数据缺失百分比小于预设的百分比阈值时,计算所述待测诊断数据中的单项数据平均值,作为所述单项缺失数据的数值。
6.根据权利要求5所述的装置,其特征在于,所述空值处理模块还包括:
数据删除子模块,用于当所述数据缺失百分比大于等于所述百分比阈值时,删除所述单项数据。
7.根据权利要求1所述的装置,其特征在于,还包括:
预测结果获取模块,用于获取所述慢性病复发预测的预测结果;
预测结果计算模块,用于计算所述预测结果的精确率和召回率;
评价结果生成模块,用于根据所述精确率和所述召回率,生成模型评价结果;所述模型评价结果用于表示所述训练后模型的预测准确性。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下的步骤:
获取待测诊断数据;所述待测诊断数据包括进出院时间;
根据所述进出院时间,将所述待测诊断数据作为模型训练样本,其中当所述进出院时间包括初次出院时间和再次入院时间时,获取所述初次出院时间和所述再次入院时间;计算所述再次入院时间与所述初次出院时间的间隔时间;当所述间隔时间小于365天时,生成所述待测诊断数据的正标签,并且,当所述间隔时间大于等于365天时,生成所述待测诊断数据的负标签,将所述正标签的待测诊断数据与所述负标签的待测诊断数据按预设比例,作为所述模型训练样本;
采用所述模型训练样本训练xgboost模型,得到训练后模型;采用所述训练后模型对所述待测诊断数据进行慢性病复发预测。
9.根据权利要求8所述的计算机设备,其特征在于,所述将所述正标签的待测诊断数据与所述负标签的待测诊断数据按1:1.5的比例,作为所述模型训练样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州医科大学附属第一医院;广州天鹏计算机科技有限公司,未经广州医科大学附属第一医院;广州天鹏计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811560282.5/1.html,转载请声明来源钻瓜专利网。