[发明专利]一种基于知识图谱的电子病历问答方法及系统在审
申请号: | 202010047420.0 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111274373A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 崔立真;柏欣雨;何伟;鹿旭东;郭伟 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G16H10/60 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 电子 病历 问答 方法 系统 | ||
本公开公开了一种基于知识图谱的电子病历问答方法及系统,包括构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;将SPARQL查询语句输入知识图谱中进行查询,得到答案。可以更好地描述患者和医疗事件之间的关系,可以快速准确地帮助用户查询出所需的电子病历信息。
技术领域
本公开涉及知识图谱和医学自然语言处理技术领域,特别是涉及一种基于知识图谱的电子病历问答方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
在社会高速发展的今天,数据量的飞速增长使信息越来越多,人们对信息的精准度要求也越来越高。传统的信息检索方法基于关键词检索经常不能理解用户真正想要表达的内容,返回的排序后的相关文档,仍需用户手动从中检索出答案。区别于传统的关键词检索,问答系统的输入是自然语言问题,返回的是简洁而准确的答案。问答系统具有解读用户的检索语句的能力,可以快速准确地帮助用户获取目标信息。在此背景下,针对不同领域的问答系统和语义搜索成为了研究热点。
医疗电子病历是记录病人信息的主要媒介,对电子病历的查询和分析,在医疗卫生管理和临床科研中有着广泛的用途。传统的关键词检索难以从海量的文本数据中找到医学工作者真正关注的电子病历信息,对于不熟悉SPARQL等形式化查询语言的医学工作者来说,从电子病历信息中搜索自己感兴趣的信息成为了一项几乎无法完成的任务。
发明内容
为了解决上述问题,本公开提出了一种基于知识图谱的电子病历问答方法及系统,针对结构化电子病历特点构建了知识图谱,并依照构建的知识图谱中的RDF关系对问题进行解析,依据从问题中解析的实体和构建属于该问题的SPARQL语句,从知识图谱中查询答案。
为了实现上述目的,本公开采用如下技术方案:
第一方面,本公开提供一种基于知识图谱的电子病历问答方法,包括:
构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
将SPARQL查询语句输入知识图谱中进行查询,得到答案。
作为可能的一些实现方式,将电子病历构建成基于资源描述框架的数据表示模型的知识图谱,以患者、疾病、药物、化验、就诊、治疗和检查字段作为知识图谱的主体,以描述事件主客体关系和时序关系作为知识图谱的属性,以知识图谱中主体和属性关系作为基本的模式描述数据之间的关系。
作为可能的一些实现方式,所述构建提问语句模版,通过分析历史问题的内容对其进行关键词标注,统计关键词的种类和数量,构建提问语句模版;
根据知识图谱中主体和属性关系,对获取的问句采用BIO标注法进行基于字的标注。
作为可能的一些实现方式,对获取的问句进行字的嵌入过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010047420.0/2.html,转载请声明来源钻瓜专利网。