[发明专利]一种患病风险的预测方法及装置在审
申请号: | 201910980973.9 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110838366A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 代心灵 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70;G16H10/60 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 患病 风险 预测 方法 装置 | ||
1.一种患病风险的预测方法,其特征在于,包括:
接收关键因素,所述关键因素用于指示目标疾病的疾病类型或指示影响所述目标疾病的影响因子;
根据所述关键因素对目标用户的体检数据进行数据筛选并处理,获得风险数据,所述风险数据包括血压数据、血脂数据以及血糖数据中的一种或多种;
根据所述风险数据通过目标评分模型,确定所述目标用户的风险分数,所述目标评分模型为基于Xgboost算法和K-Folds交叉验证算法方法训练出的预测模型;
根据所述风险分数确定所述目标用户患病风险的风险等级。
2.根据权利要求1所述方法,其特征在于,所述体检数据包括外科基本检查数据、内科基本检查数据、口腔检查数据、超声数据、心电图数据、眼科检查数据、妇科检查数据、生化检查数据、血压测量结果、血脂测量结果以及血糖测量结果中的一种或多种。
3.根据权利要求1所述方法,其特征在于,所述关键因素包括M个关键字,所述M个关键字用于指示所述目标疾病的疾病类型,其中,M为大于或等于1的正整数;
所述根据所述关键因素对目标用户的体检数据进行数据筛选并处理,获得风险数据,包括:
根据所述M个关键字对所述体检数据进行数据筛选,确定筛选出的与所述M个关键字对应的体检数据为所述风险数据。
4.根据权利要求1所述方法,其特征在于,所述关键因素包括M个关键字,所述M个关键字用于指示所述目标疾病的疾病类型,其中,M为大于或等于1的正整数;
所述根据所述关键因素对目标用户的体检数据进行数据筛选并处理,获得风险数据,包括:
将所述M个关键字对应的所述体检数据按照正则表达方式处理为0-1特征数据,获得所述风险数据。
5.根据权利要求1所述方法,其特征在于,所述根据所述风险数据通过目标评分模型,确定所述目标用户的风险分数之前,还包括:
获取N个用户的体检数据为样本体检数据,其中,N个用户不包括所述目标用户,N为大于1的正整数;
根据所述K-Folds交叉验证算法将获取的N个样本体检数据分成K-1个训练集及1个测试集,其中,K为大于1的正整数;
基于Xgboost算法,在所述K-1个训练集上建立i个回归树训练预测模型,所述预测模型用于对患病的风险大小进行评分预测,其中,i为大于1的正整数;
根据所述1个测试集测试,通过训练后的所述预测模型对患病的风险大小进行评分预测;
若评分预测的结果在预设误差范围内,则确定所述预测模型为所述目标评分模型。
6.根据权利要求5所述方法,其特征在于,所述方法还包括:
基于Xgboost算法,在所述K个训练集上建立i个回归树,确定所述体检数据中影响所述风险数据的s个不同的关键因子,其中,s为大于1的正整数;
所述关键因素包括所述s个不同的关键因子;所述根据所述关键因素对目标用户的体检数据进行数据筛选并处理,获得风险数据,包括:
确定在所述s个关键因子的影响力值中所述影响力值最大的前j个关键因子对应的所述目标用户的体检数据,其中,j为大于1且小于s的正整数;
对所述前j个关键因子对应的目标用户的体检数据进行数据筛选,获得所述风险数据。
7.根据权利要5所述方法,其特征在于,所述方法还包括:
根据所述N个样本体检数据和所述目标评分模型,确定所述N个样本体检数据对应的风险分数;
根据确定所述N个样本体检数据对应的风险分数,划分风险等级并确定所述风险分数与所述风险等级的映射关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910980973.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种脱硫系统及锅炉系统
- 下一篇:一种扶梯底部进水检测装置