[发明专利]一种融入注意力机制的预测方法在审
申请号: | 201911398805.5 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111177282A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 汪璟玢;周静平 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融入 注意力 机制 预测 方法 | ||
1.一种融入注意力机制的预测方法,其特征在于,包括以下步骤:
将包括头实体向量、关系向量、尾实体向量和时间向量的四元组作为输入层;
引入注意力机制层,为四元组的各项创建其上下文向量,将得到的上下文向量加上原来四元组对应各项的向量形成新的矩阵向量,并将新的矩阵向量转置馈送到卷积层;
在卷积层当中通过不同的卷积核捕获头尾实体、关系和事实发生时间相同维度之间的全局特征;
通过点积将特征向量和权重向量相乘得到其四元组分数。
2.根据权利要求1所述的一种融入注意力机制的预测方法,其特征在于,所述将包括头实体向量、关系向量、尾实体向量和时间向量的四元组作为输入层具体为:将一个带有时间注解的四元组看作一个句子作为输入,四元组文本由四个项组成:头实体s、关系p、尾实体o和事实发生时间tb,对应的项的向量为xi,那么对应的四元组矩阵A定义如下:
式中,序列矩阵d为向量维度,把矩阵A具体到四元组中的各项,定义如下:
式中,s为头实体向量,p为关系向量,o为尾实体向量,tb为事实发生时间向量。
3.根据权利要求1所述的一种融入注意力机制的预测方法,其特征在于,所述引入注意力机制层,为四元组的各项创建其上下文向量,将得到的上下文向量加上原来四元组对应各项的向量形成新的矩阵向量,并将新的矩阵向量转置馈送到卷积层具体为:
步骤S11:计算四元组中第j项相对于第i项的注意力权重αi,j:
其中,score(xi,xj)为xj对xi的影响力得分:
式中,Wa是注意力机制当中的参数,va是归一化之后的参数向量,tanh是非线性激活的正切双曲函数;
通过加权求和来对四元组中第i项计算其上下文向量:
步骤12:将最终四元组各项得出的上下文向量和原来四元组各项对应的向量进行相加来更新原来的向量,从而更新矩阵,其更新公式如下:
x’i=xi+gi。
步骤S13:将更新后的矩阵向量转置馈送到卷积层,转置后得到的序列矩阵为:
其中,表示序列矩阵A'的第i行。
4.根据权利要求1所述的一种融入注意力机制的预测方法,其特征在于,所述在卷积层当中通过不同的卷积核捕获头尾实体、关系和事实发生时间相同维度之间的全局特征具体为:
设置卷积层上不同的卷积核为使用卷积核来提取头实体、关系、尾实体和时间之间相同维度的局部特征及一个四元组的全局关系,每个不同的卷积核提取其特定模式的特征;卷积核ω在序列矩阵A'的每一行数据重复进行卷积,以最终生成特征图v={v1,v2,…vk},其中生成特征图公式如下:
vi=g(ω·A'i,:+b);
式中,g是ReLU函数,b是一个偏秩项,
5.根据权利要求1所述的一种融入注意力机制的预测方法,其特征在于,所述通过点积将特征向量和权重向量相乘得到其四元组分数采用下式计算:
f(s,p,o,t)=concat(g([s,p,o,tb]*Ω))·w;
式中,Ω为卷积核集合,w为权重向量,*表示卷积操作符,concat表示连接符号,g是ReLU函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911398805.5/1.html,转载请声明来源钻瓜专利网。