[发明专利]一种基于体检数据建模的空腹血糖预测方法有效
申请号: | 201610065891.8 | 申请日: | 2016-01-31 |
公开(公告)号: | CN107194138B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 纪俊;于滨;肖文翔;王嵩;朱易辰 | 申请(专利权)人: | 北京万灵盘古科技有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;G16H50/20 |
代理公司: | 深圳舍穆专利代理事务所(特殊普通合伙) 44398 | 代理人: | 黄贤炬 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于体检数据建模的空腹血糖预测方法,其包括以下步骤,数据选择与处理;包括从海量体检数据中提取关键信息以及对数据的清洗和转换;数据集的建立;对处理后的数据进行特征构建,每行表示为一个人的体检记录,每列表示一项体检项特征,得到包含所有特征集合的数据集dataset1;重要特征选取;按以下步骤进行:血糖预测模型构建与评价。本发明将大量的人员的体检数据进行系统的分析、建模,并给出模型评价方法,通过该模型能够基于大数据体检项数据与血糖的相关性对病人未来的血糖状况有效预测和判断,使在发病前期进行有效的的预防干预或阻断、延缓成为可能,为达到最佳治疗效果提供依据。 | ||
搜索关键词: | 一种 基于 体检 数据 建模 空腹 血糖 预测 方法 | ||
【主权项】:
一种基于体检数据建模的空腹血糖预测方法,其特征在于:其包括以下步骤:步骤1:数据选择与处理;包括从海量体检数据中提取关键信息以及对数据的清洗和转换; 步骤2:数据集的建立;对处理后的数据进行特征构建,每行表示为一个人的体检记录,每列表示一项体检项特征,得到包含所有特征集合的数据集dataset1;步骤3:重要特征选取;按以下步骤进行:(3.1)利用随机森林方法对特征集合中的每一个特征计算其特征重要性,并据此计算体检项重要性得分;(3.2)结合序列后向选择算法:从dataset1全部特征集合s开始,对s对应训练集进行建模,并计算其在测试集上AUC,然后去掉得分最低的体检项对应特征,建模并计算在测试集上AUC,直至特征集合s中只含有一个体检项,选取具有最大AUC值得特征集合为最优特征子集optimalset;步骤4:血糖预测模型构建与评价,其步骤如下:(4.1)使用随机划分的方式,将op‑dataset按比例分割为训练集Xtrain和测试集Xtest;(4.2)使用包含大量决策树的随机森林拟合训练集Xtrain,每棵决策树使用数据由原数据随机抽取,决策树生成过程中,每个分割节点从全部特征集合中随机选择p个特征,从中选择最佳划分特征;随机森林生成后,对血糖预测值是各决策树血糖预测值的均值,此时,血糖预测的回归模型建立完毕;(4.3)根据模型对测试集Xtest进行预测,得到未来一年的空腹血糖预测值,以该值减体检者上一年的空腹血糖值,差值为正说明预测该体检者空腹血糖上升,差值为负说明该体检者空腹血糖下降,得到关于体检者空腹血糖变化的预测,空腹血糖变化上升表示为1,下降表示为0,差值表示预测得分;(4.4)根据测试集,使用体检者第四年空腹血糖减第三年空腹血糖,得到体检者真实空腹血糖变化,将其转化为0‑1表示;(4.5)根据预测得分和体检者真实数据变化的0‑1表示,通过ROC曲线对应的AUC值,对模型性能进行评价;步骤5:空腹血糖变化预测的概率化打分:(5.1)将最优数据集optimaldataset划分为训练集、测试集、验证集三部分;(5.2) 使用训练集结合随机森林方法建立空腹血糖值预测模型,使用测试集计算不同概率化打分对应阈值,预测验证集的概率化打分;(5.3)结合验证集概率化打分,假设概率化得分80分以上体检者为血糖变化概率较大人群,基于80分为阈值,验证模型表现。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京万灵盘古科技有限公司,未经北京万灵盘古科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610065891.8/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置