[发明专利]语义相似模型的训练方法、装置、电子设备和存储介质有效
申请号: | 201910927594.3 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110674260B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 龚建 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王艳斌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 相似 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请公开了语义相似模型的训练方法、装置、电子设备和存储介质,涉及NLP领域,具体实现方案为:获取第一样本句和第二样本句;根据预先训练的语义相似度模型对第一样本句进行识别生成第一语义相似度向量,并对第二样本句进行识别以生成第二语义相似度向量;根据预先训练的情感分析模型对第一样本句进行识别以生成第一情感向量,并对第二样本句进行识别以生成第二情感向量;将第一语义相似度向量和第一情感向量拼接为第一测试向量;将第二语义相似度向量和第二情感向量拼接为第二测试向量;根据第一测试向量和第二测试向量对语义相似模型进行训练。该方法得到兼容情感倾向相反的语义相似模型,提高了情感倾向相反的句子之间的相似度的计算准确度。
技术领域
本申请涉及计算机技术领域,具体涉及自然语言处理(Natural LanguageProcessing,NLP)技术领域,尤其涉及一种语义相似模型的训练方法、装置、电子设备和存储介质。
背景技术
计算语义相似度是一种十分通用的NLP任务。目前,常用的计算语义相似度的方法是采用有监督学习的神经网络模型。对于情感倾向相反的句子对,相似度应该比较低,但该模型计算出来的相似度却比较高。可见,对于情感倾向相反的句子对,现有的用于计算语义相似度的模型计算出的语义相似度,准确性较差。
发明内容
本申请提出一种语义相似模型的训练方法、装置、电子设备和存储介质,用于解决相关技术中,用于计算语义相似度的模型,对于情感倾向相反的句子,计算出的语义相似度准确性较差的问题。
本申请一方面实施例提出了一种语义相似模型的训练方法,包括:
获取第一样本句和第二样本句;
根据预先训练的语义相似度模型对所述第一样本句进行识别以生成第一语义相似度向量,并对所述第二样本句进行识别以生成第二语义相似度向量;
根据预先训练的情感分析模型对所述第一样本句进行识别以生成第一情感向量,并对所述第二样本句进行识别以生成第二情感向量;
将所述第一语义相似度向量和所述第一情感向量拼接为第一测试向量;
将所述第二语义相似度向量和所述第二情感向量拼接为第二测试向量;
根据所述第一测试向量和所述第二测试向量对所述语义相似模型进行训练。
本申请实施例的语义相似模型的训练方法,通过首先获取第一样本句和第二样本句,然后根据预先训练的语义相似度模型对第一样本句进行识别以生成第一语义相似度向量,并对第二样本句进行识别以生成第二语义相似度向量,根据预先训练的情感分析模型对第一样本句进行识别以生成第一情感向量,并对第二样本句进行识别以生成第二情感向量,再将第一语义相似度向量和第一情感向量拼接为第一测试向量,将第二语义相似度向量和第二情感向量拼接为第二测试向量,最后根据第一测试向量和第二测试向量对语义相似模型进行训练。由此,通过对预先训练的语义相似度训练模型和情感分析模型得到的语义相似向量和情感向量进行拼接,利用拼接后的向量对语义相似模型进行训练,得到兼容情感倾向相反的语义相似模型,从而可以提高对情感倾向相反的句子之间的相似度的计算准确度。
本申请另一方面实施例提出了一种语义相似模型的训练装置,包括:
获取模块,用于获取第一样本句和第二样本句;
第一生成模块,用于根据预先训练的语义相似度模型对所述第一样本句进行识别以生成第一语义相似度向量,并对所述第二样本句进行识别以生成第二语义相似度向量;
第二生成模块,用于根据预先训练的情感分析模型对所述第一样本句进行识别以生成第一情感向量,并对所述第二样本句进行识别以生成第二情感向量;
第一拼接模块,用于将所述第一语义相似度向量和所述第一情感向量拼接为第一测试向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910927594.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:意图理解方法和装置
- 下一篇:一种信息处理方法、装置以及计算机可读存储介质