[发明专利]翻译方法、装置、设备及存储介质在审
申请号: | 201911393150.2 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111144111A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 许国伟;傅玮萍;丁文彪;刘子韬 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 李丽 |
地址: | 100080 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 方法 装置 设备 存储 介质 | ||
本发明实施例提供了一种翻译方法、装置、设备及存储介质,方法包括:识别待翻译原始文本数据的各实体文本数据;对各实体文本数据进行实体翻译;当得到翻译成功的各实体文本数据的各第一译文数据时,确定与翻译成功的各实体文本数据分别对应的各实体替换文本数据,利用各实体替换文本数据替换待翻译原始文本数据中的与其对应的各实体文本数据,得到待翻译替换文本数据;对待翻译替换文本数据进行翻译,得到第二译文数据;利用各第一译文数据,分别替换第二译文数据中与其对应的各第三译文数据,得到翻译文本数据。本发明实施例所提供的翻译方法、装置、设备及存储介质,可以提高翻译结果的准确性。
技术领域
本发明实施例涉及计算机领域,尤其涉及一种翻译方法、装置、设备及存储介质。
背景技术
机器翻译是指利用计算机实现语言之间的转换的一种翻译方式。
为了实现机器翻译,基于规则的翻译模型需要专业人员总结大量的语言习惯,然后转化为代码进行实现,然而由于语言的复杂性,基于规则的翻译模型的通用性低、翻译效果较差。
为此,随着深度学习技术的发展,出现了基于神经网络的机器翻译模型,包括编码器和解码器,编码器实现源语言类型翻译文本的编码,然后利用解码器将编码后的特征向量解码成目标语言类型的文本。
然而,尽管基于神经网络的机器翻译模型具有较高的通用性和翻译效果,但翻译结果的准确性仍然需要提高。
因此,如何提高翻译结果的准确性,及成为亟需解决的技术问题。
发明内容
本发明实施例解决的技术问题是提供一种翻译方法、装置、设备及存储介质,以提高翻译结果的准确性。
为解决上述问题,本发明实施例提供一种翻译方法,包括:
识别待翻译原始文本数据的各实体文本数据;
对各所述实体文本数据进行实体翻译;
当得到翻译成功的各所述实体文本数据的各第一译文数据时,确定与翻译成功的各所述实体文本数据分别对应的各实体替换文本数据,利用各所述实体替换文本数据替换所述待翻译原始文本数据中的与其对应的各实体文本数据,得到待翻译替换文本数据;
对所述待翻译替换文本数据进行翻译,得到第二译文数据,所述第二译文数据包括与各所述实体替换文本数据分别对应的第三译文数据;
利用各所述第一译文数据,分别替换所述第二译文数据中与其对应的各第三译文数据,得到翻译文本数据。
为解决上述问题,本发明实施例还提供一种翻译装置,包括:
实体文本数据识别单元,适于识别待翻译原始文本数据的各实体文本数据;
实体翻译单元,适于对各所述实体文本数据进行实体翻译;
待翻译替换文本数据获取单元,适于当得到翻译成功的各所述实体文本数据的各第一译文数据时,确定与翻译成功的各所述实体文本数据分别对应的各实体替换文本数据,利用各所述实体替换文本数据替换所述待翻译原始文本数据中的与其对应的各实体文本数据,得到待翻译替换文本数据;
第二译文数据获取单元,适于对所述待翻译替换文本数据进行翻译,得到第二译文数据,所述第二译文数据包括与各所述实体替换文本数据分别对应的第三译文数据;
翻译文本数据获取单元,适于利用各所述第一译文数据,分别替换所述第二译文数据中与其对应的各第三译文数据,得到翻译文本数据。
为解决上述问题,本发明实施例还提供一种设备,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以执行如前述的翻译方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393150.2/2.html,转载请声明来源钻瓜专利网。