[发明专利]一种基于图深度学习的EMR信息关联及演化方法有效
申请号: | 202011353177.1 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112466462B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 王华珍;刘晓聪;何霆 | 申请(专利权)人: | 华侨大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G16H10/20;G06F40/289;G06F40/30;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 emr 信息 关联 演化 方法 | ||
本发明公开一种基于图深度学习的EMR信息关联及演化方法,包括如下步骤:EMR数据预处理:获取EMR数据集,得到EMR的实体词典;EMR图构建:实体词典中的词转换为向量表示,并得到EMR图的向量矩阵以及EMR图的邻接矩阵,组合构成EMR图;EMR图深度学习模型构建:根据得到的EMR数据集对应的所有EMR图,构建出EMR图深度学习模型的输入图数据集,从而进一步获得图深度学习模型F;EMR信息关联及演化:将任意一条EMR数据,喂入图深度学习模型F,构建EMR图的演化序列。本发明提出一种基于图深度学习的EMR信息关联及其演化方法,采用图深度学习方法对电子病历数据进行建模,利用网络关系图可视化技术展示电子病历结构信息的演化过程,实现知识发现和可解释深度学习。
技术领域
本发明涉及自然语言处理与深度学习领域,特别是指一种基于图深度学习的EMR信息关联及演化方法。
背景技术
临床文本蕴含着丰富的健康医疗信息,以电子病历(Electronic MedicalRecord,EMR)为代表的临床文本是医疗活动过程中产生的一种重要信息资源。电子病历分为门诊电子病历和住院电子病历,包含有社会人口学信息、主诉、现病史、检查记录、疾病诊断等。可见,电子病历是医疗知识高度密集的多源异构数据集合,包含了丰富的实体,如:症状、疾病、检查等,这些实体之间常常隐藏着某种医学关系。目前,电子病历的有效建模已成为学术界和工业界的一个重要课题。已有研究表明,利用电子病历数据进行机器学习可实现疾病诊断、药物推荐、治疗方案推荐、风险预测等智能化临床应用。但是电子病历大多以非结构化文本的形式存储,导致病历的应用效率低、阻碍医疗信息化程度,临床工作者也无法清晰地获取病人病情的结构化关联信息和医学知识。如何从海量的电子病历数据中发现临床知识是健康医疗领域面临的挑战,也是提高医学科研效率以及寻求临床诊断可靠证据的重要途径。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于图深度学习的EMR信息关联及其演化方法,采用图深度学习方法对电子病历数据进行建模,利用网络关系图可视化技术展示电子病历结构信息的演化过程,实现知识发现和可解释深度学习。
本发明采用如下技术方案:
一种基于图深度学习的EMR信息关联及演化方法,其特征在于,包括如下步骤:
EMR数据预处理:获取EMR数据集,对获取的EMR数据进行预处理,得到EMR的实体词典;
EMR图构建:利用word2vec方法将实体词典中的词转换为向量表示,得到对应EMR数据的EMR图的向量矩阵;选取实体词典的实体词作为EMR图的节点,实体词典中实体词的数量为EMR图节点个数最大值V_num,通过计算任意两个图节点的条件概率,获取EMR图的邻接矩阵并进行归一化,得到EMR图的邻接矩阵;所述EMR图的向量矩阵和EMR图的邻接矩阵构成EMR图;其中,针对EMR图中任意两个节点vi和vj,(i,j=1,2,..,V_num,且i≠j),vj到vi的边权值为P(vi|vj),即vi在vj出现的条件下出现的概率,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011353177.1/2.html,转载请声明来源钻瓜专利网。