[发明专利]文档翻译方法、装置、电子设备及存储介质有效
申请号: | 202010356148.4 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111611813B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 张延冬;笃峻;曾自清;贾凤强 | 申请(专利权)人: | 南京南瑞继保电气有限公司;南京南瑞继保工程技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/284;G06F16/2458 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王军红;张颖玲 |
地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 翻译 方法 装置 电子设备 存储 介质 | ||
本发明实施例适用于计算机技术领域,提供了一种文档翻译方法、装置、电子设备及存储介质,其中,文档翻译方法包括:基于设定的颗粒度将待翻译文档中的文本进行拆分,得到至少两个第一待翻译单元;所述颗粒度表征所述第一待翻译单元的长度;将所述至少两个第一待翻译单元的每个第一待翻译单元在设定数据库中进行匹配;所述设定数据库中存储有至少一个第二待翻译单元和对应的译文;在第一待翻译单元在设定数据库中匹配到第二待翻译单元的情况下,将匹配到的第二待翻译单元对应的译文确定为第一待翻译单元的译文;基于确定出的第一待翻译单元的译文,确定所述待翻译文档对应的翻译文档。
技术领域
本发明属于计算机技术领域,尤其涉及一种文档翻译方法、装置、电子设备及存储介质。
背景技术
文档作为产品的技术说明文件,当产品进入其他国家时,产品的文档也需要翻译成其他语种。然而,目前文档的翻译工作一般由人工翻译完成,人工翻译虽然准确,但是不同的译员翻译出的文档不一致,如果不同产品的文档中有相同的内容,则可能导致相同内容的翻译结果不相同。
发明内容
有鉴于此,本发明实施例提供一种文档翻译方法、装置、电子设备及存储介质,以至少解决相关技术中针对不同文档的相同内容的翻译结果不相同的问题。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供了一种文档翻译方法,该方法包括:
基于设定的颗粒度将待翻译文档中的文本进行拆分,得到至少两个第一待翻译单元;所述颗粒度表征所述第一待翻译单元的长度;
将所述至少两个第一待翻译单元的每个第一待翻译单元在设定数据库中进行匹配;所述设定数据库中存储有至少一个第二待翻译单元和对应的译文;
在第一待翻译单元在设定数据库中匹配到第二待翻译单元的情况下,将匹配到的第二待翻译单元对应的译文确定为第一待翻译单元的译文;
基于确定出的第一待翻译单元的译文,确定所述待翻译文档对应的翻译文档。
上述方案中,所述将所述至少两个第一待翻译单元的每个第一待翻译单元在设定数据库中进行匹配,包括:
确定第一待翻译单元和所述第二待翻译单元的相似度;
在所述相似度大于设定值时,在所述相似度大于设定值时,确定第一待翻译单元在设定数据库中匹配到第二待翻译单元。
上述方案中,所述方法还包括:
基于所述设定的颗粒度确定所述设定值。
上述方案中,所述在第一待翻译单元在设定数据库中匹配到第二待翻译单元的情况下,将匹配到的第二待翻译单元对应的译文确定为第一待翻译单元的译文,包括:
确定所述待翻译文档的源语种和目标语种;
在第一待翻译单元在所述设定数据库中匹配到所述源语种的第二待翻译单元的情况下,确定匹配到的第二待翻译单元对应的译文的语种是否包括所述目标语种;
在匹配到的第二待翻译单元的译文的语种包括所述目标语种的情况下,将匹配到的第二待翻译单元对应所述目标语种的译文确定为第一待翻译单元的译文。
上述方案中,在确定出第一待翻译单元的译文后,所述方法还包括:
确定所述第一待翻译单元在所述待翻译文档中的第一文本格式;
基于所述第一文本格式,转换所述第一待翻译单元的译文的文本格式。
上述方案中,所述方法还包括:
在第一待翻译单元在所述设定数据库中未匹配到第二待翻译单元的情况下,获取用户输入的关于所述第一待翻译单元的译文;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京南瑞继保电气有限公司;南京南瑞继保工程技术有限公司,未经南京南瑞继保电气有限公司;南京南瑞继保工程技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010356148.4/2.html,转载请声明来源钻瓜专利网。