[发明专利]一种基于电子病历数据挖掘的糖尿病预测模型构建方法在审
申请号: | 201910161929.5 | 申请日: | 2019-03-05 |
公开(公告)号: | CN109920547A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 闫健卓;孔永辉;谭绍峰;贺东东 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70;G16H10/60 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子病历 构建 糖尿病预测模型 糖尿病性肾病 清洗 基本信息 数据挖掘 数据存入数据库 糖化 模型评价指标 错误数据 生化检查 数据包括 数据清洗 数据通过 算法模型 卫生资源 异常数据 预测模型 诊断信息 重复数据 病案 检出率 分类 整合 去除 服务器 糖尿病 样本 诊断 合并 防治 人群 预测 改进 | ||
本发明公开了一种基于电子病历数据挖掘的糖尿病预测模型构建方法,该方法从电子病历数据清洗和预测模型的构建出发,将从各个服务器导出来的电子病历数据通过唯一的病案号进行数据的整合,数据包括基本信息以及诊断、糖化以及生化检查数据,将基本信息,诊断信息等合并成一个完整的样本。对数据进行了数据的清洗,去除异常数据、重复数据和存在的错误数据,将清洗后的数据存入数据库。对清洗后的糖尿病数据进行了分类预测,通过结果可以得出,改进的BP神经网络模型无论分类精度还是模型评价指标都优于其他算法模型。本方法提高了人群中未诊糖尿病性肾病的检出率,增强糖尿病性肾病防治效果,并节省大量的卫生资源。
技术领域
本发明属于医疗大数据挖掘的慢性病风险预测领域,涉及一种模型构建的方法,特别是关于一种基于电子病历数据挖掘的慢性病风险预测模型构建方法。
背景技术
糖尿病是当下危害人们健康生活的一种较为普遍的慢性病。糖尿病已成为继心脑血管疾病、恶性肿瘤后的第三大威胁人类健康的慢性病。随着我国人民生活水平的普遍提高以及生活节奏的加快,糖尿病患病者数量正在以惊人的速度增长,且向低龄化发展。最新调查显示,我国成年糖尿病患者高达1.14亿,呈现高发病率状态,然而知晓率、治疗率和达标率偏低。没有得到及时治疗与控制的糖尿病患者可能有心脑血管以及糖尿病足等各种并发症,这不仅严重影响了糖尿病患者的生活质量,也为家庭和社会带来了沉重的负担。因此,预防和控制糖尿病的发生,对于节约医疗资源、降低我国医疗支出具有重要战略意义。
随着信息时代的到来,信息化的浪潮同样促进了医院信息化的发展,电子病历成为了医院综合信息系统的主要组成部分,现在电子病历的应用也成为了一种趋势。医院的电子病历中存在大量的糖尿病患者的诊疗过程的全部临床数据,主要包括电子病历基本信息(姓名、性别、职业等等)、用药信息、指标检测数据、医嘱等诊疗信息等。存在的这些大量的信息中隐藏着一些与糖尿病并发症发病规律和诊疗手段的知识。通过电子病历数据挖掘患病风险做出预测,利用好这些挖掘出来的隐藏规律,辅助医生进行糖尿病并发症的预测,使得医生针对并发症风险,提早进行相关的治疗,控制病情的发展,进一步降低糖尿病在人群中的发病率,最终大大降低糖尿病的危害,这对糖尿病的诊疗是一个很重要的帮助。
目前还没有根治糖尿病的方法,一般是采用一些治疗手段来控制病情的发展。但是糖尿病引起的并发症却是危害人们健康甚至导致四往往的杀手,糖尿病并发症有以下两个特点,一是并发症早期不易发现,且当前的糖尿病诊疗还是以医生的诊疗为主,从医人员根据患者的病征表现、各项身体指标的情况、历史治疗情况等结合医生的自身经验积累得出电子病历的诊疗方法,而且由于电子病历的个体特征存在差异,相似的病情使用相同的诊疗方法往往结果也是迥然不同;二是并发症一旦产生,药物治疗很难逆转,且造成的结果是很严重的,甚至导致死亡。因此强调尽早预防糖尿病并发症,及早发现、及早治疗。
目前国内使用数据挖掘的方法对疾病分析的早期研究大多用的是成熟的数据挖掘软件例如(SPSS、SAS等),结合所获得的医疗数据对给定的数据属性集合进行发病风险和因素的分析。还有一些学者使用分类回归树、支持向量机等机器学习方法对电子病历数据进行模型的建立并获得相应的危险因素。国外的学者应用数据挖掘技术进行慢性病的预测起步比较早,方法上相对比较成熟,有很多的方法和模型应用于研究过程。他们比较了不同的特征选择算法和不同的机器学习算法对糖尿病的预测效果,并使用拓展的关联规则研究与糖尿病和相关的因素和易患糖尿病人群。
近年来,随着深度学习的研究的不断深入,人工智能在医疗行业的应用越来越多,也是未来的一个大的潜在的发展方向。人工智能的本质是神经网络,本次构建的预测模型也将引入神经网络进行训练预测。神经网络层数会依据样本量进行选取,一旦样本量数据太小,造成识别错误率大大提升。糖尿病的临床诊疗数据会涉及很多维度的数据以及很多字段属性,针对所得到的数据的特点,选取了BP神经网络作为基础的预测模型,同时针对数据的不规则时序性特点对该算法进行了改进,使其能狗更好的达到预测的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910161929.5/2.html,转载请声明来源钻瓜专利网。