[发明专利]疾病预测模型的交叉验证方法、装置及电子设备在审
申请号: | 202210397082.2 | 申请日: | 2022-04-15 |
公开(公告)号: | CN114708111A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 李任重;郭小川;高惠庭;李春萌;王睿 | 申请(专利权)人: | 阳光人寿保险股份有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G16H10/60;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 荣颖佳 |
地址: | 572000 海南省三亚市*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病 预测 模型 交叉 验证 方法 装置 电子设备 | ||
1.一种疾病预测模型的交叉验证方法,其特征在于,所述方法包括:
获取第一地区的第一原始医疗数据,及第二地区的第二原始医疗数据;
基于所述第一原始医疗数据和所述第二原始医疗数据,确定第一地区对应的第一原始特征样本集和第一公共特征样本集,及第二地区对应的第二原始特征样本集和第二公共特征样本集;每个样本集中均包括训练样本集和测试样本集;
基于所述第一原始特征样本集和所述第一公共特征样本集中的训练样本集,构建所述第一地区分别对应的第一疾病预测原始模型和第一疾病预测公共模型;基于所述第二原始特征样本集和所述第二公共特征样本集中的训练样本集,构建所述第二地区分别对应的第二疾病预测原始模型和第二疾病预测公共模型;
应用所述第一原始特征样本集、所述第一公共特征样本集、所述第二原始特征样本集和所述第二公共特征样本集中的测试样本集,对所述第一疾病预测原始模型、所述第一疾病预测公共模型、所述第二疾病预测原始模型和所述第二疾病预测公共模型进行对应测试和交叉测试,得到多个测试结果;
根据所述多个测试结果进行交叉验证,确定所述第一疾病预测原始模型、所述第一疾病预测公共模型、所述第二疾病预测原始模型和所述第二疾病预测公共模型间的可替代性。
2.根据权利要求1所述的方法,其特征在于,基于所述第一原始医疗数据和所述第二原始医疗数据,确定第一地区对应的第一原始特征样本集和第一公共特征样本集,及第二地区对应的第二原始特征样本集和第二公共特征样本集的步骤,包括:
确定所述第一原始医疗数据和所述第二原始医疗数据中对应的公共特征;
将所述第一原始医疗数据和所述第二原始医疗数据分别作为当前医疗数据,均执行以下步骤:
对所述当前医疗数据进行预处理,并按照指定比例将所述当前医疗数据划分为训练样本集和测试样本集,得到所述当前医疗数据对应的原始特征样本集;
基于所述公共特征,从所述当前医疗数据中提取对应的样本数据,并按照指定比例将所述样本数据划分为训练样本集和测试样本集,得到所述当前医疗数据对应的公共特征样本集。
3.根据权利要求1所述的方法,其特征在于,基于所述第一原始特征样本集和所述第一公共特征样本集中的训练样本集,构建所述第一地区分别对应的第一疾病预测原始模型和第一疾病预测公共模型;基于所述第二原始特征样本集和所述第二公共特征样本集中的训练样本集,构建所述第二地区分别对应的第二疾病预测原始模型和第二疾病预测公共模型的步骤,包括:
分别以所述第一原始特征样本集、所述第一公共特征样本集、所述第二原始特征样本集和所述第二公共特征样本集中的训练样本集作为当前训练样本集,均执行以下操作:
基于所述当前训练样本集和预设算法进行模型训练;所述预设算法包括以下之一:CatBoost算法、LightGBM算法、XGBoost算法;
对训练后的模型进行模型调参处理,得到所述当前训练样本集对应的疾病预测模型;所述模型调参处理至少包括以下之一:调整迭代次数、调整学习率、调整树的深度、调整L2正则化系数。
4.根据权利要求1所述的方法,其特征在于,应用所述第一原始特征样本集、所述第一公共特征样本集、所述第二原始特征样本集和所述第二公共特征样本集中的测试样本集,对所述第一疾病预测原始模型、所述第一疾病预测公共模型、所述第二疾病预测原始模型和所述第二疾病预测公共模型进行对应测试和交叉测试,得到多个测试结果的步骤,包括:
应用所述第一原始特征样本集中的测试样本集对所述第一疾病预测原始模型进行测试,得到第一测试结果;
应用所述第一公共特征样本集中的测试样本集对所述第一疾病预测公共模型进行测试,得到第二测试结果;
应用所述第二公共特征样本集中的测试样本集对所述第一疾病预测公共模型进行测试,得到第三测试结果;
应用所述第一公共特征样本集中的测试样本集对所述第二疾病预测公共模型进行测试,得到第四测试结果;
应用所述第二公共特征样本集中的测试样本集对所述第二疾病预测公共模型进行测试,得到第五测试结果;
应用所述第二原始特征样本集中的测试样本集对所述第二疾病预测原始模型进行测试,得到第六测试结果;
其中,每个测试结果包括AUC和提升度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光人寿保险股份有限公司,未经阳光人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210397082.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种功能性货架
- 下一篇:站点识别方法及装置、计算机可读存储介质、处理器