[发明专利]一种基于知识图谱与深度学习的疾病问答方法及装置有效
申请号: | 202010261943.5 | 申请日: | 2020-04-05 |
公开(公告)号: | CN111475631B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 穆欣;何昆仑;张诗慧;刘春祥;阎岩;赵晓静;石金龙;贾志龙;宋欣雨 | 申请(专利权)人: | 北京亿阳信通科技有限公司;中国人民解放军总医院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/2455;G06F16/28 |
代理公司: | 北京领科知识产权代理事务所(特殊普通合伙) 11690 | 代理人: | 张丹 |
地址: | 100093 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 深度 学习 疾病 问答 方法 装置 | ||
1.一种基于知识图谱与深度学习的疾病问答方法,其特征在于,所述方法包括:
步骤110:获得输入问题,并对所述输入问题进行数据清洗处理;
步骤120:对所述步骤110中数据清洗处理后的所述输入问题进行意图识别预处理,并判断所述输入问题是否满足第一预设条件;其中,
意图识别预处理意在只保留医学相关问题,也就是说,将输入问题为非医学问题的部分进行过滤,此过程利用深度学习技术搭建模型网络进行,并且,需要对输入问题判断其是否满足第一预设条件,即判断输入问题是否为医学问题;
满足第一预设条件的输入问题即为对输入问题进行判断之后,且判定结果为医学问题的问题;
步骤130:按照预设策略,对所述步骤120中满足所述第一预设条件的所述输入问题进行二次意图识别,并获得所述输入问题的意图类型;其中,
二次意图识别将问题类型细化包括:a.疾病定义、b.疾病症状或体征、c.疾病原因、d.疾病预防措施、e.检查方案、f.治疗方案、g.并发症;
步骤140:将所述输入问题进行实体识别,并与所述输入问题的意图类型相结合,获得实体结果;
步骤150:根据所述步骤130中获得的所述输入问题的意图类型,以及所述步骤140中获得的所述实体结果,利用Cypher语句在neo4j图数据库中进行实体及关系的直接及推理查询;
步骤160:获得问答结果;
其中,
在所述步骤120中,所述意图识别预处理,具体包括:
将所述输入问题的文本信息通过词向量技术转换为第一输入向量;
将所述第一输入向量通过CNN网络进行第一特征信息提取;
将所述第一特征信息通过Softmax分类器、Adam算法进行参数的迭代优化更新;
在所述步骤130中,所述对所述步骤120中满足所述第一预设条件的所述输入问题进行二次意图识别,具体包括:
将所述输入问题的文本信息通过词向量技术转换为第二输入向量;
将所述第二输入向量通过RNN网络进行第二特征信息提取;
将所述第二特征信息通过Softmax分类器、Adam算法进行参数的迭代优化更新;
在所述步骤140中,将所述输入问题进行实体识别,并与所述输入问题的意图类型相结合,获得实体结果,具体包括:
将输入文本通过词向量技术转换为第三输入向量;
将所述第三输入向量通过多层LSTM网络进行第三特征信息提取;
将所述第三特征信息通过条优随机场分类器、Adam算法进行参数的迭代优化更新。
2.如权利要求1所述的方法,其特征在于,在所述步骤110中,所述数据清洗处理包括无效字符判断,问题长度判断。
3.一种执行权利要求1至2任一所述的方法的、基于知识图谱与深度学习的疾病问答装置,其特征在于,所述装置包括:
第一执行单元,用于获得输入问题,并对所述输入问题进行数据清洗处理;
第二执行单元,用于对所述步骤110中数据清洗处理后的所述输入问题进行意图识别预处理,并判断所述输入问题是否满足第一预设条件;
第一获得单元,用于按照预设策略,对所述步骤120中满足所述第一预设条件的所述输入问题进行二次意图识别,并获得所述输入问题的意图类型;
第二获得单元,用于将所述输入问题进行实体识别,并与所述输入问题的意图类型相结合,获得实体结果;
第三执行单元,用于根据所述步骤130中获得的所述输入问题的意图类型,以及所述步骤140中获得的所述实体结果,利用Cypher语句在neo4j图数据库中进行实体及关系的直接及推理查询;
第三获得单元,用于获得问答结果。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-2任一项所述方法的步骤。
5.一种基于知识图谱与深度学习的疾病问答装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-2任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亿阳信通科技有限公司;中国人民解放军总医院,未经北京亿阳信通科技有限公司;中国人民解放军总医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010261943.5/1.html,转载请声明来源钻瓜专利网。