[发明专利]一种基于意群的翻译方法、装置、设备及介质在审
申请号: | 202111660857.2 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114372481A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 廖富林;李明;张马成 | 申请(专利权)人: | 成都优译信息技术股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/253;G06F40/284;G06F40/289;G06F16/338 |
代理公司: | 成都行之智信知识产权代理有限公司 51256 | 代理人: | 何筱茂 |
地址: | 610000 四川省成都市中国(四川)自*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 翻译 方法 装置 设备 介质 | ||
本发明公开了一种基于意群的翻译方法、装置、设备及介质,涉及自然语言处理技术领域。该方法通过获取待翻译文本,将待翻译文本与翻译记忆库中的原文进行匹配,得到文本匹配率;当文本匹配率低于匹配率阈值,则根据意群本身的属性,即在意思上相对完整、在语法上密切联系、不能再分的一个词组,对待翻译文本进行意群切分,得到意群文本;基于意群文本与翻译记忆库中的原文进行匹配,当得到的意群匹配结果为匹配一致时,则基于匹配一致的原文从翻译记忆库中选择对应的译文作为意群文本的译文,提高翻译准确性和效率。
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于意群的翻译方法、 装置、设备及介质。
背景技术
随着全球化和信息化进程的不断推进,翻译行业也迎来了前所未有的挑战, 仅通过翻译人员翻译已无法正常满足人们的需求,随着AI语言的广泛应用,机 器翻译应运而生,但机器翻译时大多以词、句子为单位进行翻译,由于语言本 身的复杂性,一个词在不同词法、语法、句法以及语境中的更换,因此,对于 在一些较为复杂的翻译内容,机器翻译的准确率并不高。
发明内容
本发明所要解决的技术问题是目前仅通过翻译人员翻译效率不高,仅通过 机器翻译,翻译准确率不高。因此,本发明提供一种基于意群的翻译方法、装 置、设备及介质,在提高翻译准确率的同时提高翻译效率。
本发明通过下述技术方案实现:
获取待翻译文本,将待翻译文本与翻译记忆库中的原文进行匹配,得到文 本匹配率;
当文本匹配率低于匹配率阈值,则对待翻译文本进行意群切分,得到意群 文本;
基于所述意群文本与翻译记忆库中的原文进行意群匹配,当意群匹配一致 时,则基于匹配一致的原文从翻译记忆库中选择对应的译文作为意群文本的译 文。
进一步地,所述将待翻译文本与翻译记忆库中的原文进行匹配,得到文本 匹配率,包括:
调用文本匹配工具对待翻译文本与翻译记忆库中的原文进行匹配,得到文本 匹配率。
进一步地,所述对待翻译文本进行意群切分,得到意群文本,包括:
调用意群切分脚本,按照断句标记对待翻译文本进行句子划分,得到待翻 译句子;
对待翻译句子中的每个词进行词性分析,并按照预设意群切分规则对携带 有词性的待翻译句子进行意群切分,得到意群文本。
进一步地,所述基于所述意群文本与翻译记忆库中的原文进行意群匹配, 当意群匹配一致时,则基于匹配一致的原文从翻译记忆库中选择对应的译文作 为意群文本的译文,包括:
对翻译记忆库中的原文和译文分别进行意群切分,得到意群原文和意群译 文;
将意群文本和翻译记忆库中的所有意群原文进行匹配,当匹配一致时,则 基于意群原文从翻译记忆库中选择对应的意群译文作为意群文本的译文。
进一步地,所述一种基于意群的翻译方法还包括:
当意群匹配不一致时,则调用机器翻译工具对意群匹配不一致的意群文本 进行翻译,并将翻译后的译文作为意群文本的译文。
一种基于意群的翻译装置,包括:
待翻译文本获取模块,用于获取待翻译文本,将待翻译文本与翻译记忆库 中的原文进行匹配,得到文本匹配率;
意群切分模块,用于当文本匹配率低于匹配率阈值,则对待翻译文本进行 意群切分,得到意群文本;
意群翻译模块,用于基于所述意群文本与翻译记忆库中的原文进行意群匹 配,当意群匹配一致时,则基于匹配一致的原文从翻译记忆库中选择对应的译 文作为意群文本的译文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优译信息技术股份有限公司,未经成都优译信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111660857.2/2.html,转载请声明来源钻瓜专利网。