[发明专利]基于知识图谱子图检索的智能问答系统有效
申请号: | 202110846067.7 | 申请日: | 2021-07-26 |
公开(公告)号: | CN113297369B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 陶建华;于敏;张大伟;刘通;杨国花 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/295 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孙剑锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 检索 智能 问答 系统 | ||
本发明提供基于知识图谱子图检索的智能问答系统,包括:所述问句处理模块识别用户输入问句中的实体,根据所述实体构建输入问句的句法依存树,得到实体之间的关系谓词;利用知识图谱嵌入得到知识图谱中三元组的低维稠密向量表示;将得到的用户输入问句中的实体映射到知识图谱中,得到每个实体在知识图谱中对应的候选实体列表,选择起点实体,引入关系谓词,在知识图谱中检索与之相匹配的知识图谱子图,再引入实体和关系谓词继续检索,迭代至全部的实体和关系谓词都引入完毕,输出检索到的知识图谱子图;再利用知识图谱子图过滤将检索得到的知识图谱子图进行剪枝;最后,输出相应结果。
技术领域
本发明涉及知识图谱领域,具体涉及基于知识图谱子图检索的智能问答系统。
背景技术
随着科学技术的发展,互联网应用已经渗透到人类生活的方方面面,信息检索是互联网背景下的重要技术应用,是人们获取信息的必要手段。目前,人们搜集信息的主要方式是通过传统搜索引擎,这种搜索方式一般只需要用户输入关键字,搜索引擎便会采取关键词匹配的方法将所有符合匹配条件的搜索结果呈现给用户。然而该方式难以满足用户的需求:一方面,不能返回给用户最直接的答案,而是一些与问题相关的网页或者文档,用户需要重新从这些网页或者文档中寻找最终想要的答案;另一方面,答案质量参差不齐,用户在查找、获取、理解方面存在困难。智能问答系统不仅允许用户以自然语言的方式提问,还能返回给用户准确且简洁的答案,避免了繁琐的人工筛选环节。因此,开放领域智能问答系统的应用能够进一步提高人们获取信息的便捷性、准确性。
公开号为CN111090735A提供一种基于知识图谱的智能问答方法及其性能评价方法。本发明公开了一种基于知识图谱的智能问答方法,其生成答案时的运行工作量更低;具体包括以下步骤:构建知识图谱;接收用户问题并将用户问题和知识图谱内的问题集分别进行向量化;将向量化后的用户问题与问题集中的问题分别进行相似度匹配,并得到多个语义相似度;将多个语义相似度排序,选择问题集中语义相似度最高的问题为命中问题;在知识图谱内检索出命中问题对应的命中答案,然后将命中答案形成完整的答案后输出。
公开号为CN110737763A公开了一种融合知识图谱和深度学习的中文智能问答系统及方法,该系统将用户输入的当前问题传递给语义预处理模块,语义预处理模块处理后将分词结果传递给问题检索模块,问题检索模块找出与当前问题相似的已知问题,并计算当前问题和已知问题的相似度,如果相似度满足阈值,则将已知问题的已知答案作为推荐答案;如果相似度不满足阈值,则知识推理模块对当前问题进行知识推理,如果推理结果的置信度满足阈值,则将推理结果作为推荐答案;如果置信度不满足阈值,则深度学习模型使用深度神经网络模型对分词结果进行预测,将预测结果作为推荐答案;推荐答案返回给用户以实现智能问答,从而本发明能够回答未知问题。
现有技术缺点:
现有的基于知识图谱的问答技术,在单一问题上已取得非常好的效果。但在实际问答场景下,用户的问题往往较为复杂,一旦问题过长或者存在多种关系与实体,现有方法的效果则不尽人意。
发明内容
有鉴于此,本发明提供一种基于知识图谱子图检索的智能问答系统,包括:问句处理模块、知识图谱嵌入模块、知识图谱子图检索模块、知识图谱子图过滤模块和答案输出模块;
所述问句处理模块识别用户输入问句中的实体,根据所述实体构建输入问句的句法依存树,得到实体之间的关系谓词;
所述知识图谱嵌入模块将所述问句处理模块得到的实体、实体之间的关系谓词数据转化为低维稠密的向量;
所述知识图谱嵌入模块将知识图谱的实体、关系、属性或值表示为低维稠密的向量;
所述知识图谱子图检索模块将问句实体集合中的实体映射到知识图谱中,在知识图谱中检索与所述问句实体集合中的实体相匹配的知识图谱子图;
所述知识图谱子图过滤模块采用LDA主题模型对知识图谱子图的节点进行筛选,得到筛选后的知识图谱子图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110846067.7/2.html,转载请声明来源钻瓜专利网。