[发明专利]基于知识图嵌入的问题回答在审
申请号: | 201911148232.0 | 申请日: | 2019-11-21 |
公开(公告)号: | CN111506714A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 张婧媛;李定成;李平;黄啸 | 申请(专利权)人: | 百度(美国)有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 嵌入 问题 回答 | ||
1.一种使用一个或多个处理器进行问题回答的由计算机实施的方法,所述处理器使得执行步骤,所述步骤包括:
使用谓词学习模型在知识图谓词嵌入空间中生成用于包括一个或多个令牌的问题的预测谓词表示;
使用头部实体学习模型,在知识图实体嵌入空间中生成用于所述问题的预测头部实体表示;
基于关系函数,从所述预测谓词表示和所述预测头部实体表示获取预测尾部实体表示,所述预测谓词表示、所述预测头部实体表示和所述预测尾部实体表示形成预测事实,所述关系函数针对知识图嵌入空间中的事实将头部实体表示和谓词表示与尾部实体表示关联;
使用头部实体检测模型识别用于所述问题的一个或多个预测头部实体名称,每个预测头部实体名称包括来自所述问题的一个或多个令牌;
在所述知识图中搜索与所述一个或多个预测头部实体名称相关的头部实体同义词;
构建包括一个或多个候选事实的候选事实集,每个候选事实包括所述头部实体同义词中的头部实体;以及
基于联合距离度量,选择所述候选事实集中与所述预测事实具有最小联合距离的一个候选事实作为所述问题的答案。
2.根据权利要求1所述的由计算机实施的方法,其中所述谓词学习模型具有包括双向递归神经网络层和注意层的神经网络结构,所述预测谓词表示的生成包括:
将所述问题中的所述一个或多个令牌映射到单词嵌入向量的序列中;
使用所述双向递归神经网络层生成前向隐藏状态序列和后向隐藏状态序列;
将所述前向隐藏状态序列和所述后向隐藏状态序列串联成串联隐藏状态向量;
由所述注意层对所述串联隐藏状态向量应用注意权重,以获得加权隐藏状态向量;
将所述加权隐藏状态向量与所述单词嵌入向量串联,以获得每个令牌的隐藏状态;
对所述隐藏状态应用完全连接层以获得每个令牌的目标向量;以及
使用所有目标向量的平均值作为所述预测谓词表示。
3.根据权利要求2所述的由计算机实施的方法,其中所述头部实体学习模型具有与所述谓词学习模型相同的神经网络结构。
4.根据权利要求3所述的由计算机实施的方法,其中分别通过谓词目标函数和头部实体目标函数,使用具有真实事实的训练数据集对所述谓词学习模型和所述头部实体学习模型进行预训练。
5.根据权利要求1所述的由计算机实施的方法,其中所述头部实体检测模型具有包括双向递归神经网络层和完全连接层的神经网络结构,所述问题的所述一个或多个预测头部实体名称的识别包括:
将所述问题中的所述一个或多个令牌映射到单词嵌入向量的序列中;
在所述双向递归神经网络层处生成前向隐藏状态序列和后向隐藏状态序列;
串联所述前向隐藏状态向量和后向隐藏状态向量以获得串联隐藏状态向量;
对所述串联隐藏状态向量应用所述完全连接层和Softmax函数,以获得每个令牌的目标向量,每个目标向量具有两个概率值,所述两个概率值对应于所述令牌属于实体令牌名称和非实体令牌名称的概率;以及
基于每个令牌属于实体令牌名称的概率值,选择一个或多个令牌作为所述头部实体名称。
6.根据权利要求1所述的由计算机实施的方法,其中所述联合距离度量包括表示所述候选事实中的向量和所述预测事实中的相应向量之间的距离的距离项,每个距离项是测量向量距离的l2范数。
7.根据权利要求6所述的由计算机实施的方法,其中所述联合距离度量还包括字符串相似性项,所述字符串相似性项表示所述候选事实中的实体名称和由所述头部实体检测模型分类为实体名称的令牌之间的字符串相似性,以及所述候选事实中的所述谓词的名称和由所述头部实体检测模型分类为非实体名称的令牌之间的字符串相似性。
8.根据权利要求7所述的由计算机实施的方法,其中所述联合距离度量是所述距离项和所述字符串相似性项的加权组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911148232.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调整制冷剂流量的空调系统
- 下一篇:一种提高细胞脂质体转染效率的方法