[发明专利]一种基于混合知识图的注意力引导增强的常识推理框架在审
申请号: | 202310044752.7 | 申请日: | 2023-01-30 |
公开(公告)号: | CN116050523A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 张鹏;郝楚战;谢明辉;王博;赵东明 | 申请(专利权)人: | 天津大学;中国移动通信集团天津有限公司 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N5/02;G06N3/042 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 韩帅 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 知识 注意力 引导 增强 常识 推理 框架 | ||
1.一种基于混合知识图的注意力引导增强的常识推理框架,其特征在于,所述框架包括:预训练文本编码器、检索常识知识图谱模块、知识交互引导模块、常识知识聚合与传播模块和回答与解释模块;其中:
所述预训练文本编码器对一组问题q-选项ci对进行编码表示:
所述检索常识知识图谱模块根据问题和选项中出现的实体词语进行推理子图筛选,并将问题-选项对的编码表示作为子图的全局节点;
所述知识交互引导模块是通过将各推理子图中的问题-选项节点给提取出来,让多个推理子图的全局节点进行信息的相互传递,并获得新的问题-选项节点的表示;
所述常识知识聚合与传播模块是对知识图谱进行边缘特征的加权聚合和利用通过图神经网络对节点间进行信息传递的过程;
所述知识交互引导模块和所述基于混合注意力机制的常识知识聚合与传播模块通过多层的全局知识交互引导和局部知识聚合和传播过程迭代,扩大了每个子图节点的信息接收域;
所述回答与解释模块是结合初始的问题-选项表示、最后一层的子图全局节点表示和子图的全局池化表示,并利用SoftMax分类器进行多个选项的置信分数预测。
2.根据权利要求1所述的一种基于混合知识图的注意力引导增强的常识推理框架,其特征在于:所述知识交互引导模块获得新的问题-选项节点的表示过程;
将各推理子图中的节点抽取出来堆叠组成嵌入矩阵C,
通过三个线性层将整体的问题-选项嵌入映C射成Q、K、V三个矩阵,即:
Q=ClWQ,K=ClWK,V=ClWV
其中:Cl表示第l层中堆叠的问题-选项嵌入整体表示;WQ,WK,WV,W是线性映射层;
通过多头注意力机制获得新的各推理子图全局节点的表示,同时根据其中的注意力矩阵获取到各选项间的注意力系数;即:
αij=MHA(QT,KT,VT)
其中:MHA是多头注意力机制;
通过如下公式对各推理子图全局节点进行信息流控制,门控系数η来控制原始信息流的比例,注意力权重则用于更新交互后的节点特征表示;
η=σ(ClW+b)
其中:⊙表示哈达玛(Hadamard)乘积;σ表示sigmoid激活函数。
3.根据权利要求1所述的一种基于混合知识图的注意力引导增强的常识推理框架,其特征在于:所述常识知识聚合和传播模块通过图神经网络对推理知识图谱进行关键边缘特征和节点特征加权聚合的过程;
利用推理子图中全局的问题-选项节点去计算所有边的注意力权重;
通过推理子图中边的类型和其两端节点的类型获得每条边的嵌入表示;
融合注意力权重加权的边特征和源节点的特征来更新源节点的特征表示;
rst=fr(est,us,ut)
其中,est,us,ut分别是表示边和节点类型的独热编码,rst表示节点s和t之间的边缘特征,f*是两层的感知机,l是图神经网络的层数,是节点i和j边缘特征与全局节点特征聚合的表示,是不同边之间的相关性系数,是节点t传入的邻居节点,是节点s初始的嵌入编码,是融合了加权边特征的新的节点表示;
利用多头注意力机制更新推理知识图谱内部的节点信息获得到新的节点嵌入表示:
其中:||表示拼接,表示归一化的注意力权重系数,其中加入了节点的度特征ds,这样最后返回的节点特征则是包含了重要的节点和边的特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;中国移动通信集团天津有限公司,未经天津大学;中国移动通信集团天津有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310044752.7/1.html,转载请声明来源钻瓜专利网。