[发明专利]基于机器学习的预后生存阶段预测方法和系统有效
申请号: | 202210109421.2 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114496306B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 彭歆;王海辉;贾梦琪;王学超;高敏;俞光岩;章文博;杜文;于尧;叶鹏 | 申请(专利权)人: | 北京大学口腔医学院;北京航空航天大学 |
主分类号: | G16H70/60 | 分类号: | G16H70/60;G16H50/70;G16H50/30;G16H10/60;G06N5/00 |
代理公司: | 北京悦和知识产权代理有限公司 11714 | 代理人: | 司丽春 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 预后 生存 阶段 预测 方法 系统 | ||
本发明公开了一种基于机器学习的预后生存阶段预测方法和系统,所述方法包括:获取既往预设时间段内的患者原始信息数据,并对所述患者原始信息数据进行整合,以得到无复发时间的第一数据集和带有复发时间的第二数据集;基于各对应患者所述术前信息、术后信息和生存状态,分析得到所述术前信息、所述术后信息与所述生存状态之间的相关程度;在所述第一数据集中训练得到术后生存几率预测模型;根据所述术后生存几率模型,判定目标患者的生存几率小于或等于预设值,则在所述第二数据集中训练得到生存时间段预测模型。解决了无法基于大数据作出预后生存情况判断的技术问题。
技术领域
本发明涉及数据统计技术领域,尤其涉及一种基于机器学习的预后生存阶段预测方法和系统。
背景技术
目前,手术、放疗、化疗、生物治疗是治疗癌症的四大手段。以唾液腺癌的治疗为例,对于唾液腺癌的治疗目前主张采用综合序列治疗,即针对患者的具体情况,采取有计划、分步骤的多种治疗手段,以期取得最佳治疗效果。但是,在医疗手段实施开始之前,目前无法结合大数据给出基本的预后生存情况判断,无法为医患提供较为准确的预后结果预测。并且,现有技术无法规范化保存患者的病情和预后信息,无法形成历史患者数据积累。
发明内容
本发明的目的是提供一种基于机器学习的预后生存阶段预测方法和系统,以至少部分解决现有技术中存在的无法基于大数据作出预后生存情况判断的技术问题。该目的是通过以下技术方案实现的:
本发明提供一种基于机器学习的预后生存阶段预测方法,所述方法包括:
获取既往预设时间段内的患者原始信息数据,并对所述患者原始信息数据进行整合,以得到无复发时间的第一数据集和带有复发时间的第二数据集,各数据集均包括对应患者的术前信息、术后信息和生存状态;
基于各对应患者所述术前信息、术后信息和生存状态,分析得到所述术前信息、所述术后信息与所述生存状态之间的相关程度;
基于所述术前信息、所述术后信息与所述生存状态之间的相关程度,在所述第一数据集中训练得到术后生存几率预测模型;
根据所述术后生存几率模型,判定目标患者的生存几率小于或等于预设值,则在所述第二数据集中训练得到生存时间段预测模型。
进一步地,所述分析得到所述术前信息、所述术后信息与所述生存状态之间的相关程度,之后还包括:
分析多种所述术前信息、多种所述术后信息对所述生存状态的影响程度,以得到多个影响因素对应的影响程度结果;
基于所述影响程度结果对各所述影响因素进行排序。
进一步地,所述分析多种所述术前信息、多种所述术后信息对所述生存状态的影响程度,具体包括:
利用卡方检验、F检验、信息增益、Pearson相关性、Spearman相关性和决策树算法,分析多种所述术前信息、多种所述术后信息对所述生存状态的影响程度。
进一步地,所述分析得到所述术前信息、所述术后信息与所述生存状态之间的相关程度,具体包括:
利用Kaplan-Meier分析法,分析得到所述术前信息、所述术后信息与所述生存状态之间的相关程度。
进一步地,所述对所述患者原始信息数据进行整合,具体包括:
将术前信息、术后信息和生存状态分别划分为多个必要特征;
遍历所述患者原始信息数据,并删除未包含全部必要特征的数据;
对删除后的剩余数据进行预处理,并将预处理后的数据划分为训练集和验证集。
进一步地,所述对删除后的剩余数据进行预处理,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学口腔医学院;北京航空航天大学,未经北京大学口腔医学院;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210109421.2/2.html,转载请声明来源钻瓜专利网。