[发明专利]基于集成学习的2型糖尿病肾脏疾病患病风险评估系统在审
申请号: | 202011011930.9 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112117006A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 向天雨;刘小株;王惠来 | 申请(专利权)人: | 重庆医科大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/50;G06N20/20;G06N3/00 |
代理公司: | 重庆双马智翔专利代理事务所(普通合伙) 50241 | 代理人: | 顾晓玲;陈香兰 |
地址: | 400016*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 糖尿病 肾脏 疾病 患病 风险 评估 系统 | ||
1.一种基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,包括数据收集模块、影响指标数据提取模块和集成学习模块,所述数据收集模块的输出端与影响指标数据提取模块的第一输入端连接,影响指标数据提取模块的输出端与集成学习模块的输入端连接;
所述数据收集模块从医院数据库中获取待评估病人的一组临床指标数据;
所述影响指标数据提取模块从所述数据收集模块获取的一组临床指标数据中提取出影响指标数据;
所述集成学习模块将所述影响指标数据输入集成学习模型,集成学习模型输出待评估病人是否患2型糖尿病肾脏疾病的判断结果。
2.如权利要求1所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,还包括显示模块,所述显示模块的输入端与集成学习模块的输出端连接。
3.如权利要求1所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,还包括影响指标生成模块,所述影响指标生成模块的输入端与数据收集模块的输出端连接,影响指标生成模块的输出端与影响指标数据提取模块的第二输入端连接;
所述影响指标生成模块通过数据收集模块从医院数据库中获取多组包含单纯2型糖尿病和2型糖尿病肾脏病人的临床指标数据,对多组临床指标数据进行单因素回归分析获得各指标的单因素回归分析P值,将单因素回归分析P值小于第一阈值的指标记为影响指标,将所有影响指标输入影响指标数据提取模块中存储。
4.如权利要求1所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,所述集成学习模块还执行以下步骤:
对于影响指标数据中的每个影响指标,按照设定比例改变所述影响指标数值,其余影响指标数值不变,将改变后的影响指标数据输入集成学习模型获得第二判断结果,设原影响指标数据输入集成学习模型获得的判断结果为第一判断结果,获取第二判断结果与第一判断结果的差异度;
按照差异度从大到小的顺序对影响指标进行排序,将排序结果作为影响指标重要度排序输出。
5.如权利要求1所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,还包括集成学习模型获取模块,所述集成学习模型获取模块执行以下步骤:
步骤一,选择一个以上初始机器学习模型;
步骤二,通过数据收集模块从医院数据库中提取多组包含单纯2型糖尿病人和2型糖尿病肾脏病人的临床指标数据,并为每组数据打上是否患2型糖尿病肾脏疾病的标签,基于多组临床指标数据构建训练集和验证集;
步骤三,分别通过训练集和验证集对各机器学习初始模型进行训练、验证以及参数更新获得优化后的机器学习模型,比较各优化后的机器学习模型的评估指标,选择评估指标最优的优化后的学习模型进行内部验证并作为集成学习模型;
步骤四,输出集成学习模型至集成学习模块。
6.如权利要求5所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,所述初始机器学习模型为随机森林模型或XGBoost模型。
7.如权利要求5所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,所述内部验证采用的方法为X折交叉验证方法,X为正整数。
8.如权利要求1所述的基于集成学习的2型糖尿病肾脏疾病患病风险评估系统,其特征在于,还包括设于数据收集模块的输出端与影响指标数据提取模块的输入端之间的预处理模块;
所述预处理模块对数据收集模块输出的指标数据进行数据清洗、数据填补、数据集成和数据规约处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆医科大学,未经重庆医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011011930.9/1.html,转载请声明来源钻瓜专利网。