[发明专利]一种面向细分领域的国防军工领域机器翻译方法及系统在审

申请号：	201910948363.0	申请日：	2019-10-08
公开（公告）号：	CN110705320A	公开（公告）日：	2020-01-17
发明（设计）人：	雷贺功;李斌;姚晗;晏裕生;程洁丹;孙孟阳;董文轩;江洋	申请（专利权）人：	中国船舶工业综合技术经济研究院
主分类号：	G06F40/58	分类号：	G06F40/58;G06F16/35;G06K9/62
代理公司：	11569 北京高沃律师事务所	代理人：	刘凤玲
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	机器翻译翻译国防军工语料平行文本文本分类模型翻译结果文本翻译语料库调用通用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种面向细分领域的国防军工领域机器翻译方法及系统。所述方法在通用机器翻译模型的基础上，对语料库中的平行语料句对进行细分领域划分，训练细分领域机器翻译模型；在用户翻译时，采用训练好的SVM文本分类模型自动根据待翻译文本确定细分领域，并调用对应的细分领域机器翻译模型对所述待翻译文本进行翻译，生成细分领域翻译结果。本发明细分领域机器翻译模型由细分领域的平行语料句对进行训练，从而在面向国防军工领域的细分领域进行文本翻译时，能够显著提高细分领域机器翻译质量。

技术领域

本发明涉及机器翻译技术领域，特别是涉及一种面向细分领域的国防军工领域机器翻译方法及系统。

背景技术

机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。神经机器翻译(Neural Machine Translation,NMT)是当前常用的一种机器翻译方法，这种方法基于深度学习，通过带有注意力机制(attention-based)的编码器解码器(encoder-decoder)模型，将待翻译的语句(源语句)经过编码器(encoder)编码成为一个向量，然后通过解码器(decoder)对源语句的向量进行解码，形成对应的译文(目标语句)。由于国防军工领域存在着大量的细分领域翻译需求，采用目前通用的机器翻译模型难以针对国防军工领域的细分领域进行定向优化，难以达到预期的翻译效果，因此急需训练面向不同细分领域的机器翻译模型，提高对应细分领域的翻译质量。

发明内容

本发明的目的是提供一种面向细分领域的国防军工领域机器翻译方法及系统，以解决现有的通用机器翻译模型对国防军工领域的细分领域文献翻译质量差的问题。

为实现上述目的，本发明提供了如下方案：

一种面向细分领域的国防军工领域机器翻译方法，所述方法包括：

获取语料库中的平行语料句对；所述平行语料句对包括原文和对应译文；

获取训练好的SVM文本分类模型；

采用所述训练好的SVM文本分类模型将所述平行语料句对分类到国防军工领域知识体系的各个细分领域中；

采用各个所述细分领域的平行语料句对分别训练通用机器翻译模型，生成对应的细分领域机器翻译模型；

获取待翻译文本；

采用所述SVM文本分类模型确定所述待翻译文本的细分领域；

调用与所述待翻译文本的细分领域对应的细分领域机器翻译模型对所述待翻译文本进行翻译，生成细分领域翻译结果。

可选的，在所述获取语料库中的平行语料句对之前，还包括：