[发明专利]长文本匹配方法及装置、存储介质、电子设备有效
申请号: | 202010811453.8 | 申请日: | 2020-08-13 |
公开(公告)号: | CN111930894B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 陈灿宇;赵瑞辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/04 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 匹配 方法 装置 存储 介质 电子设备 | ||
1.一种长文本匹配方法,其特征在于,包括:
获取输入的第一长文本数据以及待匹配的第二长文本数据;
对所述第一长文本数据与所述第二长文本数据分别进行长文本内部表征处理,以构建所述第一长文本数据对应的第一共现矩阵,以及构建所述第二长文本数据对应的第二共现矩阵;
通过预训练的门控图神经网络分别对所述第一共现矩阵和所述第二共现矩阵进行转化处理;基于注意力机制网络对转化处理后的所述第一共现矩阵和所述第二共现矩阵中的词向量添加权重数据,得到所述第一长文本数据对应的第一表征向量以及所述第二长文本数据对应的第二表征向量,根据所述第一表征向量以及所述第二表征向量构建能够表征所述第一长文本数据与所述第二长文本数据之间交互关系的相似度交互矩阵;
对所述相似度交互矩阵进行转化处理,得到所述第一长文本数据与所述第二长文本数据对应的匹配结果,以根据所述匹配结果在所述第二长文本数据中选择与所述第一长文本数据匹配的目标长文本数据。
2.根据权利要求1所述的长文本匹配方法,其特征在于,在获取输入的第一长文本数据以及待匹配的第二长文本数据之后,所述方法还包括:
对所述第一长文本数据和所述第二长文本数据进行切词处理;
根据预训练的词向量模型将切词处理后的第一长文本数据和切词处理后的第二长文本数据进行转化处理,得到第一词向量序列以及第二词向量序列。
3.根据权利要求2所述的长文本匹配方法,其特征在于,所述构建所述第一长文本数据对应的第一共现矩阵,以及构建所述第二长文本数据对应的第二共现矩阵,包括:
基于所述第一词向量序列构建所述第一长文本数据对应的第一共现矩阵;以及
基于所述第二词向量序列构建所述第二长文本数据对应的第二共现矩阵。
4.根据权利要求3所述的长文本匹配方法,其特征在于,基于所述第一词向量序列构建所述第一长文本数据对应的第一共现矩阵,包括:
根据预设尺寸的滑动窗口对所述第一词向量序列进行处理,以对所述第一词向量序列中在所述滑动窗口内的词向量建立第一连接关系;
通过所述第一词向量序列以及所述第一连接关系构建所述第一长文本数据对应的第一共现矩阵。
5.根据权利要求3所述的长文本匹配方法,其特征在于,基于所述第二词向量序列构建所述第二长文本数据对应的第二共现矩阵,包括:
根据预设尺寸的滑动窗口对所述第二词向量序列进行处理,以对所述第二词向量序列中在所述滑动窗口内的词向量建立第二连接关系;
通过所述第二词向量序列以及所述第二连接关系构建所述第二长文本数据对应的第二共现矩阵。
6.根据权利要求1所述的长文本匹配方法,其特征在于,所述根据所述第一表征向量以及所述第二表征向量构建能够表征所述第一长文本数据与所述第二长文本数据之间交互关系的相似度交互矩阵,包括:
计算所述第一表征向量中的词向量与所述第二表征向量中的词向量的相似度数据;
根据所述第一表征向量、所述第二表征向量以及所述相似度数据构建能够表征所述第一长文本数据与所述第二长文本数据之间交互关系的相似度交互矩阵。
7.根据权利要求6所述的长文本匹配方法,其特征在于,所述根据所述第一表征向量、所述第二表征向量以及所述相似度数据构建能够表征所述第一长文本数据与所述第二长文本数据之间交互关系的相似度交互矩阵,包括:
将所述第一表征向量和所述第二表征向量分别作为所述相似度交互矩阵的横轴和纵轴,并将所述相似度数据作为所述相似度交互矩阵的值,以构建所述相似度交互矩阵。
8.根据权利要求1所述的长文本匹配方法,其特征在于,所述对所述相似度交互矩阵进行转化处理,得到所述第一长文本数据与所述第二长文本数据对应的匹配结果,包括:
根据预构建的二维卷积层网络和二维池化层网络对所述相似度交互矩阵进行聚合处理;
将聚合处理后的相似度交互矩阵输入到多层感知机层网络,得到所述第一长文本数据和所述第二长文本数据对应的匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010811453.8/1.html,转载请声明来源钻瓜专利网。