[发明专利]语句翻译方法和装置、存储介质及电子装置有效
申请号: | 201910819098.6 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110795947B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 林炳怀;王丽园 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/51;G06N3/084;G06N3/096;G06N3/0985 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张学渊 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 翻译 方法 装置 存储 介质 电子 | ||
本发明公开了一种语句翻译方法和装置、存储介质及电子装置。其中,该方法包括:获取使用目标帐号的客户端反馈的翻译校正请求,其中,该翻译校正请求用于请求对第一翻译结果进行校正,该第一翻译结果是通过第一翻译模型对待翻译的对象数据进行翻译后得到的结果;响应该翻译校正请求,使用翻译约束参数对该第一翻译模型进行调整,得到第二翻译模型,其中,该翻译约束参数用于约束该第一翻译模型中的第一参数向量与该第二翻译模型中的第二参数向量之间的差异;获取通过该第二翻译模型对该对象数据进行翻译后得到的第二翻译结果;向使用该目标帐号的客户端推送该第二翻译结果。本发明解决了增量学习后的模型容易出现灾难性遗忘的技术问题。
技术领域
本发明涉及机器翻译领域,具体而言,涉及一种语句翻译方法和装置、存储介质及电子装置。
背景技术
相关技术中的神经机器翻译计算资源较大,时间消耗较多。随着语料的增多,基于原模型的增量学习往往导致神经网络灾难性遗忘,翻译性能下降,(双语互译质量评估辅助工具,Bilingual Evaluation Understudy,简称为BLEU)BLEU值降低。在这种情况下,如果能够避免从头开始训练模型的代价,同时能够基于新增的数据进行快速增量学习,并提高机器翻译模型的泛化能力与性能,将是一个具有重大意义的研究方向。
目前,当从旧有的任务切换到新的任务或从旧有数据分布切换到新的数据分布,深度神经网络训练往往会出现灾难性遗忘,使旧任务的模型性能降低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语句翻译方法和装置、存储介质及电子装置,以至少解决增量学习后的模型容易出现灾难性遗忘的技术问题。
根据本申请的另一个实施例,还提供了一种语句翻译方法,包括:获取使用目标帐号的客户端反馈的翻译校正请求,其中,所述翻译校正请求用于请求对第一翻译结果进行校正,所述第一翻译结果是通过第一翻译模型对待翻译的对象数据进行翻译后得到的结果;响应所述翻译校正请求,使用翻译约束参数对所述第一翻译模型进行调整,得到第二翻译模型,其中,所述翻译约束参数用于约束所述第一翻译模型中的第一参数向量与所述第二翻译模型中的第二参数向量之间的差异;获取通过所述第二翻译模型对所述对象数据进行翻译后得到的第二翻译结果;向使用所述目标帐号的客户端推送所述第二翻译结果。
根据本申请的另一个实施例,还提供了一种语句翻译装置,包括:第一获取模块,用于获取使用目标帐号的客户端反馈的翻译校正请求,其中,所述翻译校正请求用于请求对第一翻译结果进行校正,所述第一翻译结果是通过第一翻译模型对待翻译的对象数据进行翻译后得到的结果;调整模块,用于响应所述翻译校正请求,使用翻译约束参数对所述第一翻译模型进行调整,得到第二翻译模型,其中,所述翻译约束参数用于约束所述第一翻译模型中的第一参数向量与所述第二翻译模型中的第二参数向量之间的差异;第二获取模块,用于获取通过所述第二翻译模型对所述对象数据进行翻译后得到的第二翻译结果;推送模块,用于向使用所述目标帐号的客户端推送所述第二翻译结果。
可选地,所述调整模块还用于获取所述翻译约束参数;以及用于将所述翻译约束参数增量学习模型的超参数,利用所述增量学习模型对所述第一翻译模型中的第一参数向量进行调整,得到所述第二翻译模型中的所述第二参数向量,其中,所述翻译约束参数越大,允许所述增量学习模型输出的参数向量相对于所述第一参数向量的差异越大。
可选地,所述调整模块还用于将所述第一参数向量输入增量学习模型,其中,所述增量学习模型用于通过对所述第一参数向量进行增量学习得到所述第二参数向量;以及用于在所述增量学习模型的输出结果达到目标条件的情况下,确定所述增量学习模型当前输出的参数向量为所述第二参数向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910819098.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于卷积神经网络的多语种互译方法及系统
- 下一篇:法律文件翻译对照装置