[发明专利]一种基于知识图谱的电子病历问答方法及系统在审
申请号: | 202010047420.0 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111274373A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 崔立真;柏欣雨;何伟;鹿旭东;郭伟 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G16H10/60 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 电子 病历 问答 方法 系统 | ||
1.一种基于知识图谱的电子病历问答方法,其特征在于,包括:
构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
将SPARQL查询语句输入知识图谱中进行查询,得到答案。
2.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,
将电子病历构建成基于资源描述框架的数据表示模型的知识图谱,以患者、疾病、药物、化验、就诊、治疗和检查字段作为知识图谱的主体,以描述事件主客体关系和时序关系作为知识图谱的属性,以知识图谱中主体和属性关系作为基本的模式描述数据之间的关系。
3.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,所述构建提问语句模版,通过分析历史问题的内容对其进行关键词标注,统计关键词的种类和数量,构建提问语句模版;
根据知识图谱中主体和属性关系,对获取的问句采用BIO标注法进行基于字的标注。
4.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,对获取的问句进行字的嵌入过程包括:
将问句进行字符级别分割后训练word2vec模型,利用训练好的word2vec模型将问句转化为文本向量,计算问句中每个字的字嵌入向量。
5.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,对句子表示矩阵使用双向长短期记忆模型包括:
句子表示矩阵经过前向LSTM后,每个字符所在的位置得到融合上文信息的隐藏层表示向量;经过后向LSTM后,每个字符所在的位置得到融合下文信息的隐藏层表示向量;将上文和下文信息的隐藏层表示向量进行拼接,每个字符得到融合上下文的表示向量。
6.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,使用条件随机场包括:
对融合上下文的表示向量,根据问句中的顺序组成序列,使用条件随机场从所有可能的标签序列中选取概率最高的序列中的词标注结果作为输出。
7.如权利要求6所述的一种基于知识图谱的电子病历问答方法,其特征在于,使用条件随机场具体包括:
获取需要学习的标签转移概率矩阵,通过模型预测序列标签,得到预测某一标签路径分数;
通过Softmax函数对标签路径分数进行归一化,得到预测该标签路径的概率值;
基于极大似然估计法,使标签路径概率最大化;根据维特比算法,从所有路径中选择概率值最高的作为最佳路径输出。
8.一种基于知识图谱的电子病历问答系统,其特征在于,包括:
知识图谱和提问语句模板构建模块,被配置为构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
字的标注和嵌入模块,被配置为对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
查询语言生成模块,被配置为将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
查询模块,被配置为将SPARQL查询语句输入知识图谱中进行查询,得到答案。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010047420.0/1.html,转载请声明来源钻瓜专利网。