[发明专利]结直肠癌术后LARS预测模型的构建方法及预测系统有效
申请号: | 202310088636.5 | 申请日: | 2023-02-09 |
公开(公告)号: | CN115938590B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 汪晓东;黄明君;李立;叶林 | 申请(专利权)人: | 四川大学华西医院 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06F18/23;G16H50/70;G06N20/00;G06F18/241 |
代理公司: | 成都四合天行知识产权代理有限公司 51274 | 代理人: | 张超 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直肠癌 术后 lars 预测 模型 构建 方法 系统 | ||
1.结直肠癌术后LARS预测模型的构建方法,其特征在于,包括:
从样本库中获取第一样本对;所述第一样本对为患者变量和LARS评分的对应关系;
对所述第一样本对中患者变量进行预处理生成第二样本对;
从所述第二样本对中选出训练集,并通过所述训练集对多种模型进行训练生成多个对应不同模型的预测模型;
从所述第二样本对中选出多组对应不同患者变量的测试集对所有所述预测模型进行测试生成测试评价数据;
以所述测试评价数据和对应的所述患者变量构建聚类空间,并在所述聚类空间内标定所有的所述预测模型;
根据所述测试评价数据对所有第二样本对进行半监督聚类分析生成聚类结果;所述聚类结果为所述第二样本对中患者变量对应的最优的预测模型;
将所述患者变量作为结直肠癌术后LARS预测模型的输入数据,将对应的所述最优的预测模型的输出数据作为结直肠癌术后LARS预测模型的输出数据完成结直肠癌术后LARS预测模型的构建。
2.根据权利要求1所述的结直肠癌术后LARS预测模型的构建方法,其特征在于,所述患者变量包括人口学资料、肿瘤位置、肿瘤长短径、手术术式、预防性造口、新辅助治疗和肿瘤距齿状线距离。
3.根据权利要求1所述的结直肠癌术后LARS预测模型的构建方法,其特征在于,对所述第一样本对中患者变量进行预处理生成第二样本对包括:
基于随机森林方法对所述患者变量中缺失值进行插补形成插补患者变量;
对所述插补患者变量进行特征选择,筛选出所述插补患者变量中相互之间相关性大于预设值的特征作为相关特征,并将所述相关特征进行去相关性计算形成修正患者变量;
对所述修正患者变量进行标准化处理生成第二样本对。
4.根据权利要求3所述的结直肠癌术后LARS预测模型的构建方法,其特征在于,筛选出所述插补患者变量中相互之间相关性大于预设值的特征作为相关特征,并将所述相关特征进行去相关性计算形成修正患者变量包括:
计算所述插补患者变量中特征的变量方差膨胀因子,并将所述变量方差膨胀因子大于10的特征作为所述相关特征;
将所述相关特征进行拆分,并从拆分结果中剔除相关部分形成修正患者变量。
5.根据权利要求1所述的结直肠癌术后LARS预测模型的构建方法,其特征在于,多种模型包括逻辑回归、支持向量机、决策树、随机森林和神经网络中的至少三种。
6.根据权利要求1所述的结直肠癌术后LARS预测模型的构建方法,其特征在于,所述训练集和所述测试集的选取包括:
将所述第二样本对排列为开发队列;
从开发队列中随机选取第一预设比例的样本对作为训练集,并选取第二预设比例的样本对作为测试集;所述第一预设比例和第二预设比例之和为1;
通过所述训练集训练预测模型,并通过所述测试集测试预测模型;
根据所述第一预设比例和所述第二预设比例循环选取训练集和测试集进行预测模型的训练和测试,直至每种模型均训练出的预测模型的数量满足预期。
7.根据权利要求1所述的结直肠癌术后LARS预测模型的构建方法,其特征在于,构建聚类空间及进行半监督聚类分析包括:
根据所述患者变量构建聚类空间,并根据所述测试评价数据在所述所述聚类空间内标定所述预测模型;
以所述预测模型在所述聚类空间中的位置作为聚类中心进行聚类分析,将所述第二样本对聚类至不同的聚类中心附近形成多个类别;
将同一类别聚类中心对应的预测模型作为该类别中的患者变量的对应的最优的预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学华西医院,未经四川大学华西医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310088636.5/1.html,转载请声明来源钻瓜专利网。