[发明专利]一种基于循环神经网络的患病风险预测建模方法有效
申请号: | 201611247218.2 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106778014B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 吴健;林志文;顾盼;周立水;邓水光;李莹;尹建伟;吴朝晖 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70;G16H50/50 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 神经网络 患病 风险 预测 建模 方法 | ||
本发明公开了一种基于循环神经网络的患病风险预测方法,包括:(1)利用诊断的疾病作为训练样本,进行疾病名称分布式词向量训练,得到词向量映射矩阵,并进行存储;(2)再次利用诊断的疾病作为训练样本,进行循环神经网络训练,得到患病风险预测模型;(3)将病人历史记录中每种诊断疾病作为一个测试样本输入患病风险预测模型,得到患病风险预测结果。该方法利用循环神经网络与分布式词向量表达嵌入技术,解决了因医疗诊断数据具有维度高、数据稀疏、时序性强等特点导致的训练模型过于复杂、训练成本高以及训练准确率低等问题,实现了针对历史患病信息进行具有时序性的建模过程。
技术领域
本发明属于医疗数据挖掘领域,具体涉及一种基于循环神经网络的患病风险预测建模方法。
背景技术
疾病风险预测是根据大量患者的历史患病信息进行建模,并根据建立的模型进行疾病风险预测的综合系统。疾病患病风险预测大致可以分为经验预测和定量预测。
经验预测作为一种主要依靠预测人员经验和直观判断能力的预测方法,不需要或只需要少量的计算,较适用于缺乏历史数据的场景。其主要方法包括:模糊聚类预测法、Delphi法、主观概率法。经验预测主要依托于人为经验与主观判读,且人工成本高,无法实现大量高准确度的预测。
定量预测是依托于大量历史数据,运用统计、机器学习等方法对疾病患病风险进行数学建模。随着医疗信息化和计算机科学技术的飞速发展,医疗行业积累了大量丰富的医疗数据,越来越多的医疗诊断、健康检查数据存储在医疗机构数据中心。因此,越来越多的研究人员及企业在研究如何利用这些电子健康记录进行疾病风险定量预测。
目前,针对疾病预测的某一特定领域,已经有许多专业人士通过机器学习等方法建立了预测某一种特定疾病的模型。在Dimitrios H.Mantzaris 等人发表的文献“Medicaldisease prediction using artificial neural networks[C]//BioInformatics andBioEngineering”中,提出了使用人工神经网络的思想对疾病进行预测。他们针对骨质疏松疾病,把其患病风险预测问题作为一种模式分类问题,使用多层感知器(MLPs)及概率神经网络 (PNN)建立预测模型,实现了较为准确的疾病预测结果。由于医疗诊断数据目前存在两大问题,使得难以建立合理的预测模型。
问题一:由于疾病种类繁多,导致将疾病诊断数据利用传统单热 (One-hot)式词向量表示方式来表示的向量维度高且十分稀疏。在传统单热式词向量表达方式中,首先,按顺序将每个疾病进行编号,创建词表库;然后,按词表库的顺序将疾病转换为向量形式,该向量的维度为疾病的总类别数。向量的元素只有0或1,其中:0表示未患该位置对应词表库的疾病;1表示患得该位置对应词表库的疾病。例如,现在共有A、B、C 三种疾病,按ABC顺序生成词表库,若一个人某次患A、C两种疾病,则对应的疾病向量为[1,0,1]。如果,就诊数据包含1万中疾病,则对应的疾病向量将达到1万维。这使得建立的模型过于复杂,增加模型训练成本,且降低模型的预测准确率。
问题二:疾病发展过程具有很强的时序性,传统的疾病预测模型,仅使用单次诊断及检测数据作为模型输入,未考虑将多次诊断及检测作为输入。因此,能否设计出一种兼顾上诉问题的合理预测模型,成为当前亟待解决的问题。
发明内容
解决了因医疗诊断数据具有维度高、数据稀疏的特点导致的训练模型过于复杂、训练成本高以及训练准确率低等问题。鉴于上述,本发明提供了一种基于循环神经网络的患病风险预测建模方法,主要是利用循环神经网络与分布式词向量表达嵌入技术,实现了利用医疗诊断数据等电子健康记录进行疾病风险预测。
一种基于循环神经网络的患病风险预测建模方法,包括以下步骤:
(1)利用诊断的疾病作为训练样本,进行疾病名称分布式词向量训练,得到词向量映射矩阵,并进行存储;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611247218.2/2.html,转载请声明来源钻瓜专利网。