[发明专利]翻译方法、装置、设备及介质在审

专利信息
申请号: 202110681347.7 申请日: 2021-06-18
公开(公告)号: CN113361287A 公开(公告)日: 2021-09-07
发明(设计)人: 李响 申请(专利权)人: 北京小米移动软件有限公司;北京小米松果电子有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/55;G06F40/45;G06F40/30;G06F16/36;G06N3/06
代理公司: 北京名华博信知识产权代理有限公司 11453 代理人: 朱影
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 翻译 方法 装置 设备 介质
【说明书】:

本公开是关于一种翻译方法、装置、设备及介质,翻译方法应用于翻译设备,翻译方法包括:识别待翻译文本中的第一专有名词,第一专有名词为汉语拼音格式;根据第一专有名词,查询与第一专有名词对应的多个第二专有名词,以及每个第二专有名词关联的属性信息,第二专有名词为汉字格式;基于多个第二专有名词,创建与每个第二专有名词对应的信息组,每个信息组包括第一专有名词、第二专有名词和与第二专有名词关联的属性信息;基于待翻译文本和多个信息组进行语义匹配,选择多个信息组中语义匹配度最高的信息组所对应的第二专有名词作为第一专有名词的目标译文,有效提高了专有名词为汉语拼音格式的翻译准确性,译文质量更佳。

技术领域

本公开涉及翻译领域,尤其涉及一种翻译方法、装置、设备及介质。

背景技术

神经机器翻译(NMT,neural machine translation)是一种基于神经网络算法由机器将一种语言自动翻译为另一种语言的技术,已经成为目前最为主流的机器翻译方法,具有广阔的技术和产业价值。

相关技术中,人名等命名专有名词的准确翻译对于译文质量有着至关重要的作用,尽管NMT的翻译质量显著提高,但对专有名词的错翻率依然较高。主要原因有两方面,一方面,由于训练数据稀缺和不平衡,以及模型在解码时的词语选择偏差,导致目前的NMT无法根据上下文准确翻译源语言句子中的人名、地名等命名专有名词,严重影响译文准确性;另一方面,常规的NMT模型训练都是基于句子级双语数据进行,无法直接翻译较长的完整篇章文本,而只能将篇章文本按句子进行拆分再各自独立翻译。因此,各个句子间是割裂的,NMT无法利用当前待翻译源语言句子外的其他上下文文本对歧义专有名词准确翻译。

发明内容

为克服相关技术中存在的问题,本公开提供一种翻译方法、装置、设备及介质。

根据本公开实施例的第一方面,提供了一种翻译方法,应用于翻译设备,所述方法包括:

识别待翻译文本中的第一专有名词,所述第一专有名词为汉语拼音格式;

根据所述第一专有名词,查询与所述第一专有名词对应的多个第二专有名词,以及每个所述第二专有名词关联的属性信息,所述第二专有名词为汉字格式;

基于多个所述第二专有名词,创建与每个所述第二专有名词对应的信息组,每个所述信息组包括所述第一专有名词、所述第二专有名词和与所述第二专有名词关联的属性信息;

基于待翻译文本和多个所述信息组进行语义匹配,选择多个所述信息组中语义匹配度最高的所述信息组所对应的所述第二专有名词作为第一专有名词的目标译文。

可选地,所述识别待翻译文本中的第一专有名词,包括:

识别待翻译文本中的待翻译专有名词,所述待翻译专有名词为汉语拼音格式;

根据中文姓名命名规则,调整所述待翻译专有名词为姓氏在前、名在后的名称;

以调整后的名称,作为识别出的所述第一专有名词。

可选地,所述根据所述第一专有名词,查询与所述第一专有名词对应的多个第二专有名词,以及每个所述第二专有名词关联的属性信息,包括:

基于所述第一专有名词,获取与所述第一专有名词指代类别关联的知识图谱;

根据所述知识图谱,查询与所述第一专有名词对应的多个第二专有名词;

根据所述第二专有名词和所述知识图谱,查询每个所述第二专有名词关联的属性信息。

可选地,所述基于多个所述第二专有名词,创建与每个所述第二专有名词对应的信息组,每个所述信息组包括所述第一专有名词、所述第二专有名词和与所述第二专有名词关联的属性信息,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110681347.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top