[发明专利]用于受人启发的简单问答(HISQA)的系统和方法有效
申请号: | 201610900531.5 | 申请日: | 2016-10-14 |
公开(公告)号: | CN106649514B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 李磊;徐伟;戴自航 | 申请(专利权)人: | 百度(美国)有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 启发 简单 问答 hisqa 系统 方法 | ||
本文描述的是用于确定如何自动回答像“哈利·波特在哪上学?”的问题的系统和方法。精心构建的知识图提供丰富事实来源。然而,这种精心构建的知识图在回答用自然语言提出的事实问题方面仍有挑战,因为问题能够以多种多样的方式提出。本文提出的是用于受人启发的简单问答(HISQA)的系统和方法的实施方式,即,基于深度神经网络使用知识图来进行自动问答的方法。受到在这个任务中人类自然动作的启发,实施方式首先经由事物链接查找正确事物,然后寻找恰当关系以回答所述问题,这两个步骤都通过深度门限循环网络和神经嵌入机制实现。
技术领域
本公开大体上涉及计算技术,更具体地涉及用于自动回答用自然语言提出的问题并改进人机交互的系统和方法。
背景技术
存在关于如何自动回答诸如“哈利·波特在哪上学?”的问题的技术问题。精心构建的知识图提供丰富事实来源。然而,这种精心构建的知识图在回答用自然语言提出的基于事实的问题方面仍有挑战,因为问题能够以多种多样的方式提出。
因此,需要的是提供更有效且更准确的方式来自动回答问题的系统和方法。
发明内容
本申请的目的在于提供一种用于为查询提供答案的计算机实施的方法以及用于识别问题中的话题的计算机实施的方法。
根据一个方面,提供了用于为查询提供答案的计算机实施的方法,该方法可包括:接收具有一个或多个词语的查询,所述一个或多个词语包括描述所述查询的话题的主题组块;查询数据库以查找至少一个候选主题,所述至少一个候选主题的名称或别名具有与所述主题组块相同的表面形式;查询数据库以查找一个或多个关系矢量,所述一个或多个关系矢量表达与所述至少一个候选主题关联的一个或多个关系;确定所述一个或多个关系的排名分数,所述排名分数中的每个表示所述查询与对应关系之间的语义相似性;在所述一个或多个关系中选择具有最高排名分数的关系作为预测关系,并且选择所述至少一个候选主题作为预测话题;以及利用所述预测关系和所述预测话题查询数据库以查找所述查询的答案。
根据另一个方面,提供了用于识别问题中的话题的计算机实施的方法,该方法可包括:接收具有一个或多个词语的查询,所述一个或多个词语包括所述查询问题的话题;将所述一个或多个词语转换成一个或多个嵌入,每个嵌入是表达对应词语的矢量;预测所述一个或多个嵌入中的每个是所述话题的一部分的概率;将所述一个或多个嵌入中的概率高于阈值的一些嵌入选择作为所述话题;以及将与所选择的嵌入对应的一个或多个词语组合为所述话题。
根据又一个方面,提供了用于为查询提供答案的计算机实施的方法,该方法可包括:接收具有一个或多个词语的输入查询;使用神经网络模型识别所述输入查询的主题组块,所述主题组块描述所述输入查询的话题;使用所述主题组块查询数据库以识别名称或别名具有与所述主题组块相同的表面形式的至少一个候选主题;在与所述至少一个候选主题关联的一个或多个关系中选择预测关系,并且选择所述至少一个候选主题作为预测话题;以及利用所述预测关系和所述预测话题查询数据库以查找所述查询的答案。
附图说明
将参考本发明的实施方式,这些实施方式的示例可在附图中示出。附图旨在是说明性的,而非进行限制。虽然本发明在这些实施方式的上下文中进行总体描述,但是应理解,这些描述不旨在将本发明的范围限制于这些具体实施方式。附图中的项目未按比例绘制。
图1概述根据本公开实施方式的系统的示例。在实施方式中,系统包括五个步骤:1)主题标记;2)候选主题查找;3)候选关系排名;4)事物消岐;以及5)查询的生成和执行。
图2示出根据本公开实施方式的主题标记的完整模型,其中使用基于词语嵌入(word embedding)和循环神经网络(包括基础RNN及其变型,诸如双向RNN、双向长短期存储器(LSTM)和堆叠双向门限循环单元(GRU))的顺序标记模型来识别主题字串。
图3示出根据本公开实施方式的用于主题标记的例示过程的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610900531.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:床架(Z002)
- 下一篇:一种基于多种检索模型的实时微博分类器