[发明专利]基于深度学习的乳腺电子病历联合关系抽取与结构化系统在审

专利信息
申请号: 201810699364.1 申请日: 2018-06-29
公开(公告)号: CN109243616A 公开(公告)日: 2019-01-18
发明(设计)人: 潘乔;陈德华;朱立峰;左铭;赵艳;王梅;俞春濡 申请(专利权)人: 东华大学;上海交通大学医学院附属瑞金医院
主分类号: G16H50/70 分类号: G16H50/70;G16H10/60;G06F16/25;G06F16/35;G06N3/08
代理公司: 上海泰能知识产权代理事务所 31233 代理人: 宋缨;钱文斌
地址: 201620 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电子病历 乳腺 关系抽取 结构化 结构化系统 学习 结构化模型 结构化数据 非结构化 评估结果 评估算法 文本数据 可识别 智能化 自动化 联合 转化
【说明书】:

发明涉及一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,包括乳腺电子病历数据的结构化模块和乳腺电子病历数据的关系抽取模块,所述乳腺电子病历数据的结构化模块基于深度学习将大量非结构化的文本数据转化为评估算法可识别的结构化数据;所述乳腺电子病历数据的关系抽取模块基于深度学习建立电子病历结构化模型,得到评估结果。本发明能够有效提高乳腺电子病历中的结构化以及关系抽取的自动化和智能化水平。

技术领域

本发明涉及医疗设备技术领域,特别是涉及一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统。

背景技术

随着医疗信息化的快速发展,医疗机构在临床诊断的过程中产生了大量的原始电子病历数据,这些电子病历是记录患者诊断与治疗过程的重要信息,蕴含着丰富的知识。由于电子病历多为非结构化、叙述性文本,不能较好地存储、组织和管理病历中的临床信息,因此,未被结构化的电子病历文本很难被充分利用。所以目前对电子病历分析的研究主要集中在电子病历结构化的方面,通过对疾病的检查指标数据进行结构化,从杂乱、冗余、高复杂的非结构化电子病历数据获取规范、有价值的数据,最后利用人工智能算法对患者所患疾病进行诊断已成为研究热点。另外,如今大多数乳腺电子病历仍是由自然语言书写而成,海量错综复杂的半结构化,甚至是非结构化的数据挑战着医疗行业。这使得尽管病人的数据充足,但难以从这些数据中获取知识,也使得资源难以合理地分配,给整个医疗行业的发展带来了巨大的压力。就乳腺这一疾病而言,其患者的电子病历记录信息分散在叙述性医疗文本中,无法直接交由计算机识别分析。所以首要解决的问题就是实现中文文本的结构化。常规的中文文本结构化方法,传统的pipeline管道模型在生物医疗的结构化过程中也有大量的应用,它的主要特点之一是的基础上增加了实体间的关系抽取。首先通过结构化技术识别给定医疗临床文本中的实体,检查每个实体对,再使用关系分类模型来确定它们是否具有特定关系。仍存在如下问题:1)结构化实体抽取的过程中会产生的错误,可能传播到关系分类的任务中去,没有将结构化、关系分类这两个任务的之间的依赖考虑在内。2)在pipeline管道模型的基础上产生的联合实体关系抽取模型虽然在一定程度上通过同时处理两个子任务,来减少错误传播以及子任务之间的依赖问题,但这种模型大部分是基于特征的方法,需要大量的特征工程,并且还会遭受特征稀疏性问题,因为联合任务的组合特征空间明显大于其子任务的特征空间。常规结构化方法并不适用于乳腺电子病历报告的实体以及关系提取。

发明内容

本发明所要解决的技术问题是提供一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,能够有效提高乳腺电子病历中的结构化以及关系抽取的自动化和智能化水平。

本发明解决其技术问题所采用的技术方案是:提供一种基于深度学习的乳腺电子病历联合关系抽取与结构化系统,包括乳腺电子病历数据的结构化模块和乳腺电子病历数据的关系抽取模块,所述乳腺电子病历数据的结构化模块基于深度学习将大量非结构化的文本数据转化为评估算法可识别的结构化数据;所述乳腺电子病历数据的关系抽取模块基于深度学习建立电子病历结构化模型,得到评估结果。

所述乳腺电子病历数据的结构化模块首先选取较完整的乳腺电子病历文本数据进行数据清洗、分词和标注,形成初步的数据训练集文件;其次读取已标注的训练数据,依据文本的字符特征构建字向量,以字向量构建文本特征向量作为整个模型的输入;最后经过文本的预处理操作后,得到由字向量构建的文本特征向量,再利用神经网络模型进行进一步的特征抽取以及分类操作,获得非结构化文本中的实体。

所述乳腺电子病历数据的结构化模块根据医疗领域的分词算法得到更加准确的分词结果,再对词语或字进行相关标注以及词向量或字向量训练;其中,模型训练提供用于训练预测模型的算法支持,通过预配置的CNN和LSTM算法调用,同时实现一个自定义的模型类以及内部相应的接口函数用于网络模型训练;最后,通过模型训练生成能够进行结构化的模型,从而能够提取非结构化的乳腺电子病历中的疾病、症状、检查和治疗的实体。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学;上海交通大学医学院附属瑞金医院,未经东华大学;上海交通大学医学院附属瑞金医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810699364.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top