[发明专利]一种基于层次化卷积神经网络和注意力机制的文本匹配方法有效

专利信息
申请号: 201910419010.1 申请日: 2019-05-20
公开(公告)号: CN110134964B 公开(公告)日: 2022-10-28
发明(设计)人: 李俊;杜洋;李宏广;李鹏;田文凤 申请(专利权)人: 中国科学技术大学
主分类号: G06F40/284 分类号: G06F40/284;G06F40/30;G06N3/04
代理公司: 北京凯特来知识产权代理有限公司 11260 代理人: 郑立明;郑哲
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 层次 卷积 神经网络 注意力 机制 文本 匹配 方法
【权利要求书】:

1.一种基于层次化卷积神经网络和注意力机制的文本匹配方法,其特征在于:词向量化(1)、交互矩阵(2)、层次化卷积神经网络(3)、注意力网络(4),其中所述的词向量化是对自动问答数据集中的问题和答案语句进行词汇定长输出后得到的T1=(ω12,…ωm)和T2=(v1,v2,…vn)用词向量做特征映射,得到问题和答案的定长词向量表示;交互矩阵是从问题和答案之间进行交互计算得到的问题-答案交互矩阵;层次化卷积神经网络对问题-答案交互矩阵,进行词粒度,短语粒度和语句粒度间的不同粒度下语义匹配信息的高维特征提取;使用注意力机制对高维抽象的语义信息和已排序的原始问题语义单元进行结合,得到最终的问题-答案匹配得分。

2.根据权利要求1所述的一种基于层次化卷积神经网络和注意力机制的文本匹配方法,其特征在于:词向量化(1)采用的词向量是预训练好的词向量,首先对自动问答数据集中的问题和答案语句进行词汇定长输出得到T1=(ω12,…ωm)和T2=(v1,v2,…vn),接着采用词向量做特征映射,得到问题和答案的定长词向量表示。

3.根据权利要求1所述的一种基于层次化卷积神经网络和注意力机制的文本匹配方法,其特征在于:交互矩阵(2)对问题和答案之间进行交互计算得到的问题-答案交互矩阵。

4.根据权利要求1所述的一种基于层次化卷积神经网络和注意力机制的文本匹配方法,其特征在于:层次化卷积神经网络(3)即不同层级下不同维度的卷积核操作和其相应的池化操作,对问题-答案交互矩阵,进行词粒度,短语粒度和语句粒度间的不同粒度下语义匹配信息的高维特征提取。

5.根据权利要求1所述的一种基于层次化卷积神经网络和注意力机制的文本匹配方法,其特征在于:注意力网络(4)使用注意力机制进行原始问题语义单元的重要性排序和选择学习,是注意力网络的核心;我们需要对高维抽象的语义信息和已排序的原始问题语义单元进行结合,得到最终的问题-答案匹配得分。

6.根据权利要求1所述的一种基于层次化卷积神经网络和注意力机制的文本匹配方法,其特征在于:匹配过程如下:

①首先对自动问答数据集中的问题和答案语句进行词汇定长输出后得到T1=(ω12,…ωm)和T2=(v1,v2,…vn)进行词向量化得到问题和答案的定长词向量表示,可得到问题的定长词向量表示和答案的定长词向量表示

②从问题和答案之间进行交互计算得到的问题-答案交互矩阵为:

③层次化卷积神经网络对问题-答案交互矩阵,进行词粒度,短语粒度和语句粒度间的不同粒度下语义匹配信息的高维特征提取即不同层级下不同维度的卷积核操作和其对应的池化操作;第一层卷积神经网络采用二维卷积核,第k个卷积核W(1,k)对于交互矩阵Z(0)=M进行运算:

采用二维正方形卷积核和ReLU作为σ激活函数;第二层网络的池化层采用动态最大值池化策略,通过公式得到动态池化后的高维语义特征向量:

第三层卷积神经网络采用三维卷积核计算得到更高维度和更抽象的语义特征信息,第四层池化层采用最大值池化策略:

注意力机制是对高维抽象的语义信息和已排序的原始问题语义单元进行结合,采用softmax进行原始问题语义单元重要性的归一化,同时采用点乘计算得到最终的得分:

其中,wi:文本T1第i个词汇;

vj:文本T2中第j个词汇;

Φ:表示将文本进行向量化函数;

rk:代表第k个卷积核的大小;

dk:表示动态池化单元的宽度大小,

d'k:表示动态池化单元长度大小,

c:表示第二层输出的高维语义特征向量的数量,也就是第一层二维卷积核的数量;

qj:表示原始问题的语义单元;

zjk:表示高维语义信息的语义单元;

σ:激活函数为sigmoid函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910419010.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top