[发明专利]一种基于时序知识图谱的复杂问答查询方法和装置在审
申请号: | 202210146333.X | 申请日: | 2022-02-17 |
公开(公告)号: | CN114637819A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 鄂海红;宋美娜;许友日 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/36;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 杜月 |
地址: | 100876 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时序 知识 图谱 复杂 问答 查询 方法 装置 | ||
1.一种基于时序知识图谱的复杂问答查询方法,其特征在于,包括以下步骤:
获取时序问题并将所述时序问题输入训练好的问答系统模型;其中,所述问答系统模型包括:时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型;
利用所述时序知识嵌入模型获取所述时序问题中的实体嵌入和时间嵌入,并利用所述嵌入提取模型获取所述时序问题的潜在嵌入;以及,利用所述时间变化模型将所述时间嵌入变换到所述时序问题的目标时间下;
使用所述答案评分模型对所述实体嵌入的实体和所述目标时间进行评分,并输出得分最高的实体或时间作为所述时序问题的答案。
2.根据权利要求1所述的方法,其特征在于,对所述时序知识嵌入模型进行训练,包括:
获取时序知识图谱并输入所述问答系统模型;
使用TComplEx模型在所述时序知识图谱上训练,获得所述实体嵌入和时间嵌入;
若所述TComplEx模型训练结果未达到第一预设指标,则调整所述时序知识嵌入模型超的参数,继续所述TComplEx模型在所述时序知识图谱上训练的步骤;
若达到所述第一预设指标,则获取用于所述问答系统模型训练的时序问题样本。
3.根据权利要求2所述的方法,其特征在于,对所述问答系统模型进行训练,包括:
将所述时序问题样本输入所述问答系统模型,并利用所述问答系统模型在所述时序问题样本上进行训练;
若所述问答系统模型的训练结果未达到第二预设指标,则调整所述问答系统模型的超参数,继续所述问答系统模型在所述时序问题样本上进行训练的步骤;
若达到所述第二预设指标,则结束对所述问答系统模型的训练。
4.根据权利要求3所述的方法,其特征在于,所述使用TComplEx模型在所述时序知识图谱上训练,获得所述实体嵌入和时间嵌入,包括:
利用ComplEx模型分别将实体、关系和时间戳表示为复数向量,以获得任一四元组真实性的得分函数为:
根据所述得分函数完成TComplEx模型的训练,以获得实体嵌入、关系嵌入和时间嵌入,以及根据所述实体嵌入、关系嵌入和时间嵌入查询单个事件的能力。
5.根据权利要求4所述的方法,其特征在于,所述利用所述嵌入提取模型获取所述时序问题的潜在嵌入,包括:
使用DistilBert模型编码时序问题q,利用DistilBert模型最后一个隐层状态和全连接层FFN表示提取时序问题q的表示为如下关系:
hq=FFN(DistilBert(q))
每个时序问题q至少标注一个实体s,使用知识图谱嵌入表示s的嵌入为es=us,使用所述全连接层FFN提取关系表示er=FFNr(hq),若时序问题q的目标时间和目标尾实体缺失,则使用2个全连接层FFN分别提取潜在时间和尾实体的嵌入:
etime=FFN(hq),eo=FFN(hq) 。
6.根据权利要求5所述的方法,其特征在于,所述利用所述时间变化模型将所述时间嵌入变换到所述时序问题的目标时间下,包括:
拼接四个实体、关系和时间的潜在嵌入,并送入全连接层FFN:
与时序问题q的隐层状态表示拼接后送入全连接层FFN:
将潜在的时序嵌入变换为目标时间嵌入:
其中,代表对应元素相乘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210146333.X/1.html,转载请声明来源钻瓜专利网。