[发明专利]一种基于注意力的语义文本相似度计算方法有效

申请号：	202011002489.8	申请日：	2020-09-22
公开（公告）号：	CN112101043B	公开（公告）日：	2021-08-24
发明（设计）人：	张华熊;张豪	申请（专利权）人：	浙江理工大学
主分类号：	G06F40/30	分类号：	G06F40/30;G06K9/62;G06N3/04;G06F40/194;G06F40/151
代理公司：	杭州天勤知识产权代理有限公司 33224	代理人：	王琛
地址：	310018 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于注意力语义文本相似计算方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于注意力的语义文本相似度计算方法，包括如下步骤：

(1)获取数据集并对数据集中每条文本进行预处理，从而得到大量数据样本，所述数据集中的文本均为成对组合且每一组均已人工标记是否语义相似；

(2)将所有数据样本分为训练集和测试集，搭建神经网络并利用训练集对其进行训练，得到语义文本相似度的计算模型；所述神经网络从输入至输出由文本编码层、局部相似性建模层、整体相似性建模层、池化层以及多层感知器依次连接组成；

所述文本编码层由两个并行的编码模块A1和A2组成，若一个数据样本包含的是文本a和文本b的词向量矩阵，则编码模块A1的输入为文本a的词向量矩阵，编码模块A2的输入为文本b的词向量矩阵；编码模块A1和A2结构相同均包含一个卷积层和一个双向门控循环单元，卷积层和双向门控循环单元的输入相同即为编码模块的输入，卷积层和双向门控循环单元的输出拼接后作为编码模块的输出，卷积层采用400个大小为1的卷积核以及Tanh函数对输入进行卷积操作，双向门控循环单元中的隐藏层大小设置为200；

所述局部相似性建模层由两个并行的建模单元B1和B2组成，建模单元B1和B2结构相同均包含一个软注意力层和一个局部增强层，建模单元B1的软注意力层输出为建模单元B1的软注意力层输出为建模单元B1的局部增强层输出为以及拼接后的结果，建模单元B2的局部增强层输出为以及拼接后的结果，由向量拼接组成，由向量拼接组成，其中：

其中：表示文本a的词向量矩阵经过编码模块A1后的输出结果中对应第i个单词的向量，表示文本b的词向量矩阵经过编码模块A2后的输出结果中对应第j个单词的向量，i、j和k均为自然数，^T表示转置；

所述整体相似性建模层从输入至输出由拼接层、整合层、多卷积层、通道注意力层依次连接组成；其中，所述拼接层用于将建模单元B1和B2中局部增强层的输出结果进行拼接后提供给整合层，所述整合层采用600个大小为1的卷积核以及Tanh函数对输入进行卷积操作后提供给多卷积层，所述多卷积层包含四个并行的卷积层C1～C4以及四个最大池化层M1～M4，卷积层C1采用300个大小为1的卷积核以及Tanh函数对输入进行卷积操作，卷积层C2采用300个大小为2的卷积核以及Tanh函数对输入进行卷积操作，卷积层C3采用300个大小为3的卷积核以及Tanh函数对输入进行卷积操作，卷积层C4采用300个大小为4的卷积核以及Tanh函数对输入进行卷积操作，最大池化层M1～M4分别对卷积层C1～C4的输出进行最大池化操作，最大池化层M1采用大小为4的卷积核，最大池化层M2采用大小为3的卷积核，最大池化层M3采用大小为2的卷积核，最大池化层M4采用大小为1的卷积核，四个最大池化层M1～M4的输出拼接后得到C×N大小的特征图且

所述通道注意力层首先对特征图进行压缩处理得到一个统计量z，z＝[z₁,z₂,…,z_C]^T，表示向量中的第p个元素值，c为自然数且1≤c≤C；然后利用门控机制函数对统计量z进行降维操作后得到指标量s且s＝[s₁,s₂,…,s_C]^T，所述门控机制函数连续采用了两个全连接层，每个全连接层均包含一次批标准化和ReLu激活函数操作；最后使指标量s与特征图相乘后输出特征图且

所述池化层包含并行的平均池化层和最大池化层，通道注意力层输出的特征图分别经过平均池化层和最大池化层使得特征图空间信息压缩到1个通道描述符，进而将平均池化层和最大池化层的输出拼接后提供给多层感知器；所述多层感知器连续采用了三个全连接层，每个全连接层均包含一次批标准化和ReLu激活函数操作，最后使用1个节点的输出维度作为整个神经网络的输出结果；

(3)将测试集样本输入计算模型中，即可得到一组成对文本的相似度结果。

2.根据权利要求1所述的语义文本相似度计算方法，其特征在于：所述步骤(1)的具体实现方式为：首先利用Jieba分词工具对数据集中的每一条文本进行分词操作并去除停用词，然后统一输入长度即只截取每条文本的前m个单词，最后基于预训练的n维词向量通过词嵌入方式将每条文本转换为m×n大小的词向量矩阵，m和n均为预设大于1的自然数；最终得到的每一数据样本即为成对组合的两个文本的词向量矩阵。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江理工大学，未经浙江理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011002489.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一株蓝状菌FL15及其介导纳米银生物合成的应用
下一篇：一种基于互联网教育的远程教学显示装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于注意力的语义文本相似度计算方法有效

专利文献下载