[发明专利]一种基于知识图谱与深度学习的疾病问答方法及装置有效
申请号: | 202010261943.5 | 申请日: | 2020-04-05 |
公开(公告)号: | CN111475631B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 穆欣;何昆仑;张诗慧;刘春祥;阎岩;赵晓静;石金龙;贾志龙;宋欣雨 | 申请(专利权)人: | 北京亿阳信通科技有限公司;中国人民解放军总医院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/2455;G06F16/28 |
代理公司: | 北京领科知识产权代理事务所(特殊普通合伙) 11690 | 代理人: | 张丹 |
地址: | 100093 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 深度 学习 疾病 问答 方法 装置 | ||
本发明提供了一种基于知识图谱与深度学习的疾病问答方法及装置,通过获得输入问题,并对所述输入问题进行数据清洗处理;对数据清洗处理后的所述输入问题进行意图识别预处理,并判断所述输入问题是否满足第一预设条件;按照预设策略,对满足所述第一预设条件的所述输入问题进行二次意图识别,并获得所述输入问题的意图类型;将所述输入问题进行实体识别,并与所述输入问题的意图类型相结合,获得实体结果;根据所述意图类型,以及获得的所述实体结果,利用Cypher语句在neo4j图数据库中进行实体及关系的直接及推理查询;获得问答结果,达到了提高传统意图识别及实体抽取环节的正确率,提高答案的准确率及全面性的技术效果。
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种基于知识图谱与深度学习的疾病问答方法及装置。
背景技术
知识图谱是在2012年由Google首次提出,是一种揭示实体之间关系的语义网络,同年基于深度学习也进入了快速发展期,其技术涉及领域包括但不仅限于图像、自然语言处理、语音等。目前已有基于知识图谱的问答算法主要流程包括意图识别、实体抽取、图数据库查询、推理,返回结果。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
目前基于知识图谱的问答算法中意图识别环节多采用模版匹配,即一种类型问题采用一个模版集合,此方法缺点是问题模版需要人为制定,当问题类型增多,需要制定的模版相应增多,会出现同一问题同时符合多个不同类型问题模版的情况,从而导致意图识别错误。实体抽取环节采取先分词再基于特定规则进行组合抽取。这种方式无法根据语义进行实体判断,会导致识体抽取错误,无法获得理想查询结果。
发明内容
本说明书实施例提供及一种基于知识图谱与深度学习的疾病问答方法及装置,解决了现有技术中问答算法中易出现意图识别错误、识体抽取错误,无法获得理想查询结果的技术问题,达到了提高传统意图识别及实体抽取环节的正确率,提高答案的准确率及全面性的技术效果。
鉴于上述问题,提出了本申请实施例以便提供一种基于知识图谱与深度学习的疾病问答方法及装置。
第一方面,本说明书实施例提供一种基于知识图谱与深度学习的疾病问答方法,所述方法包括:步骤110:获得输入问题,并对所述输入问题进行数据清洗处理;步骤120:对所述步骤110中数据清洗处理后的所述输入问题进行意图识别预处理,并判断所述输入问题是否满足第一预设条件;步骤130:按照预设策略,对所述步骤120中满足所述第一预设条件的所述输入问题进行二次意图识别,并获得所述输入问题的意图类型;步骤140:将所述输入问题进行实体识别,并与所述输入问题的意图类型相结合,获得实体结果;步骤150:根据所述步骤130中获得的所述输入问题的意图类型,以及所述步骤140中获得的所述实体结果,利用Cypher语句在neo4j图数据库中进行实体及关系的直接及推理查询;步骤160:获得问答结果。
优选地,在所述步骤110中,所述数据清洗处理包括无效字符判断,问题长度判断。
优选地,在所述步骤120中,所述意图识别预处理,具体包括:将所述输入问题的文本信息通过词向量技术转换为第一输入向量;将所述第一输入向量通过CNN网络进行第一特征信息提取;将所述第一特征信息通过Softmax分类器、Adam算法进行参数的迭代优化更新。
优选地,在所述步骤130中,所述对所述步骤120中满足所述第一预设条件的所述输入问题进行二次意图识别,具体包括:将所述输入问题的文本信息通过词向量技术转换为第二输入向量;将所述第二输入向量通过RNN网络进行第二特征信息提取;将所述第二特征信息通过Softmax分类器、Adam算法进行参数的迭代优化更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亿阳信通科技有限公司;中国人民解放军总医院,未经北京亿阳信通科技有限公司;中国人民解放军总医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010261943.5/2.html,转载请声明来源钻瓜专利网。