[发明专利]用于挖掘实体上下位关系的方法和装置有效
申请号: | 201910926654.X | 申请日: | 2019-09-27 |
公开(公告)号: | CN110659351B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 丁宇辰;刘凯 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 挖掘 实体 下位 关系 方法 装置 | ||
1.一种用于挖掘实体上下位关系的方法,包括:
获取待挖掘问答文本对,所述待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,所述实体问题文本包括问题意图;
将所获取的问答文本对输入预先获取的实体问答模型,得到所述实体问题的答案,其中,所述实体问答模型用于从所述候选答案文本中确定出所述实体问题的答案;
将所述问题意图作为所述实体问题的答案的上位词。
2.根据权利要求1所述的方法,其中,所述待挖掘问答文本对中的实体问题文本通过如下方式得到:
获取初始问答文本对;
确定所述初始问答文本对中的实体问题文本的意图;
响应于确定所述初始问答文本对中的实体问题文本未包括用于指示所述意图的意图词,将用于指示所述意图的意图词添加至所述初始问答文本对中的实体问题文本中,得到所述待挖掘问答文本对中的实体问题文本。
3.根据权利要求1所述的方法,其中,所述实体问答模型基于所述待挖掘问答文本对的候选答案文本中,与所述问题意图的关联度确定所述实体问题的答案。
4.根据权利要求1或3所述的方法,其中,所述实体问答模型基于如下方式确定所述实体问题的答案:
生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量;
基于所生成的实体问题词向量和候选答案词向量,利用双向长短记忆算法,生成用于表征所述实体问题文本的上下文语义关系的实体问题表示矩阵和候选答案表示矩阵;
基于所述实体问题表示矩阵和候选答案表示矩阵,确定所述实体问题文本中各个词相对于所述候选答案文本中各实体词的第一注意力分布矩阵,以及所述候选答案文本中各实体词相对于所述实体问题文本中各个词的第二注意力分布矩阵;
对由所述第一注意力分布矩阵和所述第二注意力分布矩阵拼接得到拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵,其中,所述联合表示矩阵的各列向量用于表征所述候选答案文本中的其中一实体词相对于所述候选答案文本和实体问题文本的上下文信息;
基于联合表示矩阵,确定候选答案文本中每个词为所述实体问题的答案的概率。
5.根据权利要求4所述的方法,其中,所述方法还包括:
基于所述第一注意力分布矩阵,确定所述实体问题文本中的各个词与所述候选答案文本中各实体词之间的关联度;
响应于确定实体问题文本中的词与所述候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将所述实体问题文本中的词作为所述候选答案文本中的实体词的上位词。
6.一种用于挖掘实体上下位关系的装置,包括:
获取单元,被配置成获取待挖掘问答文本对,所述待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,所述实体问题文本包括问题意图;
答案生成单元,被配置成将所获取的问答文本对输入预先获取的实体问答模型,得到所述实体问题的答案,其中,所述实体问答模型用于从所述候选答案文本中确定出所述实体问题的答案;
确定单元,被配置成将所述问题意图作为所述实体问题的答案的上位词。
7.根据权利要求6所述的装置,其中,所述待挖掘问答文本对中的实体问题文本通过如下方式得到:
获取初始问答文本对;
确定所述初始问答文本对中的实体问题文本的意图;
响应于确定所述初始问答文本对中的实体问题文本未包括用于指示所述意图的意图词,将用于指示所述意图的意图词添加至所述初始问答文本对中的实体问题文本中,得到所述待挖掘问答文本对中的实体问题文本。
8.根据权利要求6所述的装置,其中,所述实体问答模型基于所述待挖掘问答文本对的候选答案文本中,与所述问题意图的关联度确定所述实体问题的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910926654.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于领域本体的语义搜索系统及搜索方法
- 下一篇:试题考点识别方法及其系统