[发明专利]基于知识图嵌入的问题回答在审

专利信息
申请号: 201911148232.0 申请日: 2019-11-21
公开(公告)号: CN111506714A 公开(公告)日: 2020-08-07
发明(设计)人: 张婧媛;李定成;李平;黄啸 申请(专利权)人: 百度(美国)有限责任公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06F16/36
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 马晓亚;王艳春
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 知识 嵌入 问题 回答
【权利要求书】:

1.一种使用一个或多个处理器进行问题回答的由计算机实施的方法,所述处理器使得执行步骤,所述步骤包括:

使用谓词学习模型在知识图谓词嵌入空间中生成用于包括一个或多个令牌的问题的预测谓词表示;

使用头部实体学习模型,在知识图实体嵌入空间中生成用于所述问题的预测头部实体表示;

基于关系函数,从所述预测谓词表示和所述预测头部实体表示获取预测尾部实体表示,所述预测谓词表示、所述预测头部实体表示和所述预测尾部实体表示形成预测事实,所述关系函数针对知识图嵌入空间中的事实将头部实体表示和谓词表示与尾部实体表示关联;

使用头部实体检测模型识别用于所述问题的一个或多个预测头部实体名称,每个预测头部实体名称包括来自所述问题的一个或多个令牌;

在所述知识图中搜索与所述一个或多个预测头部实体名称相关的头部实体同义词;

构建包括一个或多个候选事实的候选事实集,每个候选事实包括所述头部实体同义词中的头部实体;以及

基于联合距离度量,选择所述候选事实集中与所述预测事实具有最小联合距离的一个候选事实作为所述问题的答案。

2.根据权利要求1所述的由计算机实施的方法,其中所述谓词学习模型具有包括双向递归神经网络层和注意层的神经网络结构,所述预测谓词表示的生成包括:

将所述问题中的所述一个或多个令牌映射到单词嵌入向量的序列中;

使用所述双向递归神经网络层生成前向隐藏状态序列和后向隐藏状态序列;

将所述前向隐藏状态序列和所述后向隐藏状态序列串联成串联隐藏状态向量;

由所述注意层对所述串联隐藏状态向量应用注意权重,以获得加权隐藏状态向量;

将所述加权隐藏状态向量与所述单词嵌入向量串联,以获得每个令牌的隐藏状态;

对所述隐藏状态应用完全连接层以获得每个令牌的目标向量;以及

使用所有目标向量的平均值作为所述预测谓词表示。

3.根据权利要求2所述的由计算机实施的方法,其中所述头部实体学习模型具有与所述谓词学习模型相同的神经网络结构。

4.根据权利要求3所述的由计算机实施的方法,其中分别通过谓词目标函数和头部实体目标函数,使用具有真实事实的训练数据集对所述谓词学习模型和所述头部实体学习模型进行预训练。

5.根据权利要求1所述的由计算机实施的方法,其中所述头部实体检测模型具有包括双向递归神经网络层和完全连接层的神经网络结构,所述问题的所述一个或多个预测头部实体名称的识别包括:

将所述问题中的所述一个或多个令牌映射到单词嵌入向量的序列中;

在所述双向递归神经网络层处生成前向隐藏状态序列和后向隐藏状态序列;

串联所述前向隐藏状态向量和后向隐藏状态向量以获得串联隐藏状态向量;

对所述串联隐藏状态向量应用所述完全连接层和Softmax函数,以获得每个令牌的目标向量,每个目标向量具有两个概率值,所述两个概率值对应于所述令牌属于实体令牌名称和非实体令牌名称的概率;以及

基于每个令牌属于实体令牌名称的概率值,选择一个或多个令牌作为所述头部实体名称。

6.根据权利要求1所述的由计算机实施的方法,其中所述联合距离度量包括表示所述候选事实中的向量和所述预测事实中的相应向量之间的距离的距离项,每个距离项是测量向量距离的l2范数。

7.根据权利要求6所述的由计算机实施的方法,其中所述联合距离度量还包括字符串相似性项,所述字符串相似性项表示所述候选事实中的实体名称和由所述头部实体检测模型分类为实体名称的令牌之间的字符串相似性,以及所述候选事实中的所述谓词的名称和由所述头部实体检测模型分类为非实体名称的令牌之间的字符串相似性。

8.根据权利要求7所述的由计算机实施的方法,其中所述联合距离度量是所述距离项和所述字符串相似性项的加权组合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911148232.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top