[发明专利]一种基于Transformer深度学习模型的多语种地名词根汉译方法有效
申请号: | 202010967634.X | 申请日: | 2020-09-15 |
公开(公告)号: | CN112084796B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 张雪英;赵文强;吴恪涵 | 申请(专利权)人: | 南京文图景信息科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/289;G06F16/903;G06N3/04;G06N3/08 |
代理公司: | 南京锐恒专利代理事务所(普通合伙) 32506 | 代理人: | 刘佳伟 |
地址: | 210046 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 transformer 深度 学习 模型 语种 地名 词根 方法 | ||
本发明公开了一种基于Transformer模型的多语种地名汉译方法,其语种范围涵盖英语、法语和德语:基于地名语种知识库结合待汉译地名的语种特征,分辨输入待汉译地名的语种,并根据语种选取地名词根抽取规则库中相应的地名词根抽取规则来提取待汉译地名的词根;将提取到的地名词根文本通过字符嵌入模型转为字符向量;基于英语、法语和德语地名词根与对应中文地名词根翻译语料训练和微调得到的Transformer模型,输入待汉译地名词根的字符向量,获取最终词根汉译结果。本发明提供的汉译的英语、法语和德语地名词根结果均具有较好可读性,符合汉语阅读习惯,一定程度上满足多语种地名词根汉译需求,具有良好的灵活性和普适性。
技术领域
本发明涉及机器翻译领域,具体涉及一种基于Transformer深度学习模型的英语、法语和德语地名词根汉译方法。
背景技术
地名作为不可或缺的基础地理信息和社会公共信息,是各类社会信息关联的重要桥梁,在国家和社会管理、经济发展、文化建设、国防外交等方面发挥着重要作用。 经济交往过程中大量外文地名的出现急需提出一种能合理地翻译外文地名的方法。
近年来,神经机器翻译方面的研究得到迅速发展,相对于统计机器翻译而言在翻译质量上取得显著的提升。神经机器翻译通常采用编码器-解码器框架实现自然语言之 间的端到端翻译,而Transformer模型是众多神经机器翻译模型中的佼佼者。Transformer 模型与其他神经机器翻译模型最为显著的不同之处在于模型完全依赖注意力机制,摒 弃了传统神经机器翻译模型采用的循环神经网络和卷积神经网络,这使得Transformer 模型很大程度上缓解了梯度消失和梯度爆炸问题,提高了模型并行计算的能力,缩短 了模型训练的时间。
目前,谷歌、微软和百度等在内的高科技公司都推出了相应的翻译产品,并且广受好评,但这些翻译产品在翻译外文地名时会出现错误使用意译和音译的问题,导致 外文地名被翻译为某个形容词或特殊名词,同时还会出现中文翻译结果语序混乱的问 题,翻译结果与中文使用习惯不相符。因此,如何实现能合理并高效翻译外文地名的 翻译方法是目前迫切需要解决的问题。
发明内容
本发明的目的在于针对现有翻译系统在外文地名汉译过程中出现的局限和不足,提供一种基于Transformer模型的多语种地名词根汉译方法,以获得高效合理的英语、 法语和德语地名的汉译结果。
本发明为解决上述问题是通过以下步骤来实现的:
步骤1:首先对原始外文地名语料和对应中文翻译语料进行预处理;
步骤2:然后基于由收集、整理的各语种地名、语言特征获取的规则所组成的地名语种规则知识库并结合外文地名的语种特征,识别输入外文地名的语种;
步骤3:根据识别出的外文地名的语种信息,从地名词根抽取库中选择与语种相对应的地名词根抽取规则,提取外文地名的词根部分,利用中文地名词根抽取规则抽取 对应中文翻译中的地名词根部分;
步骤4:将外文地名和对应中文翻译的词根文本转化为字符集合,并利用独热编码与由浅层前馈神经网络构建的字符嵌入模型获取每个外文字符和中文字符相应的字符 向量;
步骤5:训练和微调Transformer模型,以BLEU(Bilingual EvaluationUnderstudy, 双语评估替补)得分为依据来调整词嵌入层输出维度、编码器层数、自注意力机制数、 前馈神经网络输出维度、批处理数量、预训练次数和丢弃正则化概率七个超参数的取 值,使得Transformer模型对测试集的翻译结果能取得最高的BLEU得分;
步骤6:按照步骤1、2和3提取待汉译地名的词根部分,并将提取结果转化为字 符向量输入到训练、微调完毕的Transformer模型中,输出相应的词根汉译结果。
作为优选,上述预处理包括地名特殊字符剔除处理、外文地名缩写部分扩充处理和外文地名统一小写化处理和发音符号替代处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京文图景信息科技有限公司,未经南京文图景信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010967634.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自排水桥架
- 下一篇:一种基于改进的Mask RCNN的扶梯动作检测方法
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法