[发明专利]文本相似度模型训练方法、文本相似度检测方法及装置在审
申请号: | 202110958349.6 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113723070A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 杨洋;李锋;张琛;万化 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/126;G06F40/279;G06N3/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄丽霞 |
地址: | 200001 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 相似 模型 训练 方法 检测 装置 | ||
本申请涉及一种文本相似度模型训练方法、文本相似度检测方法及装置。其中方法通过分别对第一文本样本和第二文本样本进行编码处理,得到对应的第一特征编码和第二特征编码,通过第一特征编码和第二特征编码对孪生神经网络进行训练,并获取孪生神经网络训练后的损失,基于损失确定第一特征编码的第一扰动特征以及第二特征编码的第二扰动特征,进而对孪生神经网络进行迭代训练,从而得到用于文本相似度检测的文本相似度检测模型。由于本公开基于训练过程中的损失可以通过计算而产生新的训练数据,从而使得模型能够使用更多的数据进行训练,不仅可以提高模型的鲁棒性,还可以提升模型的泛化能力以及准确率。
技术领域
本申请涉及计算机应用技术,特别是涉及一种文本相似度模型训练方法、文本相似度检测方法及装置。
背景技术
在自然语言处理任务中,经常需要判断两篇文档是否相似,或者计算两篇文档的相似程度。比如,基于聚类算法发现微博热点话题时,需要度量各篇文本的内容相似度,然后让内容足够相似的微博聚成一个簇;而在问答系统中,则需要准备一些经典问题和对应的答案,当用户的问题和经典问题很相似时,系统直接返回准备好的答案;而监控稿件在互联网中的传播情况时,则可以把所有和原创稿件相似的文章,都看作转发,进而刻画原创稿件的传播范围;在对语料进行预处理时,则需要基于文本的相似度,把重复的文本给挑出来并删除。总之,文本相似度模型是一种非常有用的工具,可以帮助我们解决很多问题。
然而,在自然语言处理领域,通常采用传统的机器学习方法进行模型训练,但是,如果训练数据较少,则容易出现过拟合的现象,导致模型无法在验证集上得到较好的效果,从而无法在类似场景中直接应用。因此,传统的机器学习方法训练模型存在效果差、泛化能力不理想等弊端。
发明内容
基于此,有必要针对上述传统的机器学习方法训练模型存在效果差、泛化能力不理想的问题,提供一种文本相似度模型训练方法、文本相似度检测方法及装置。
一种文本相似度模型训练方法,所述方法包括:
分别对用于文本相似度训练的第一文本样本和第二文本样本进行编码处理,得到对应的第一特征编码和第二特征编码;
通过所述第一特征编码和所述第二特征编码对孪生神经网络进行训练;
获取所述孪生神经网络训练后的损失,基于所述损失确定所述第一特征编码的第一扰动特征以及所述第二特征编码的第二扰动特征;
根据所述第一特征编码和对应的第一扰动特征以及所述第二特征编码和对应的第二扰动特征对所述孪生神经网络进行迭代训练;
重复执行上述获取所述孪生神经网络训练后的损失的步骤,直到所述损失最小时,得到用于文本相似度检测的文本相似度检测模型。
在其中一个实施例中,所述基于所述损失确定所述第一特征编码的第一扰动特征以及所述第二特征编码的第二扰动特征,包括:获取所述损失关于所述第一特征编码的第一导数,将所述第一导数确定为所述第一特征编码的第一扰动特征;获取所述损失关于所述第二特征编码的第二导数,将所述第二导数确定为所述第二特征编码的第二扰动特征。
在其中一个实施例中,所述获取所述孪生神经网络训练后的损失,包括:获取所述孪生神经网络基于所述第一特征编码和所述第二特征编码,预测的所述第一文本样本和所述第二文本样本之间的相似度结果;根据所述第一文本样本和所述第二文本样本之间的相似度结果,确定所述孪生神经网络训练后的损失。
在其中一个实施例中,所述获取所述孪生神经网络基于所述第一特征编码和所述第二特征编码,预测的所述第一文本样本和所述第二文本样本之间的相似度结果,包括:将所述第一特征编码输入所述孪生神经网络的第一分支网络,得到所述第一分支网络输出的第一识别结果;将所述第二特征编码输入所述孪生神经网络的第二分支网络,得到所述第二分支网络输出的第二识别结果;获取所述第一识别结果与所述第二识别结果之间的距离,将所述距离确定为所述第一文本样本和所述第二文本样本之间的相似度结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110958349.6/2.html,转载请声明来源钻瓜专利网。