[发明专利]一种面向细分领域的国防军工领域机器翻译方法及系统在审

专利信息
申请号: 201910948363.0 申请日: 2019-10-08
公开(公告)号: CN110705320A 公开(公告)日: 2020-01-17
发明(设计)人: 雷贺功;李斌;姚晗;晏裕生;程洁丹;孙孟阳;董文轩;江洋 申请(专利权)人: 中国船舶工业综合技术经济研究院
主分类号: G06F40/58 分类号: G06F40/58;G06F16/35;G06K9/62
代理公司: 11569 北京高沃律师事务所 代理人: 刘凤玲
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 机器翻译 翻译 国防军工 语料 平行 文本 文本分类模型 翻译结果 文本翻译 语料库 调用 通用
【权利要求书】:

1.一种面向细分领域的国防军工领域机器翻译方法,其特征在于,所述方法包括:

获取语料库中的平行语料句对;所述平行语料句对包括原文和对应译文;

获取训练好的SVM文本分类模型;

采用所述训练好的SVM文本分类模型将所述平行语料句对分类到国防军工领域知识体系的各个细分领域中;

采用各个所述细分领域的平行语料句对分别训练通用机器翻译模型,生成对应的细分领域机器翻译模型;

获取待翻译文本;

采用所述SVM文本分类模型确定所述待翻译文本的细分领域;

调用与所述待翻译文本的细分领域对应的细分领域机器翻译模型对所述待翻译文本进行翻译,生成细分领域翻译结果。

2.根据权利要求1所述的国防军工领域机器翻译方法,其特征在于,在所述获取语料库中的平行语料句对之前,还包括:

获取已有的国防科技领域翻译成果;所述翻译成果为已经翻译成功的文本的原文和译文;

采用句对齐工具将篇章级的所述翻译成果划分为句子级翻译成果,并按照原文和译文对所述句子级翻译成果进行句对齐操作,生成多条平行语料句对存储在所述语料库中。

3.根据权利要求2所述的国防军工领域机器翻译方法,其特征在于,在所述获取训练好的SVM文本分类模型之前,还包括:

选取所述语料库中已经标注细分领域的多条所述平行语料句对作为训练集;

采用支持向量机SVM方法对所述训练集中的每条平行语料句对和对应的细分领域进行训练,生成训练好的SVM文本分类模型。

4.根据权利要求3所述的国防军工领域机器翻译方法,其特征在于,在所述生成细分领域翻译结果之后,还包括:

获取所述细分领域翻译结果的人工校对结果;

采用句对齐工具将所述人工校对结果划分为多条平行语料句对并存储在所述语料库中。

5.根据权利要求4所述的国防军工领域机器翻译方法,其特征在于,在所述采用所述SVM文本分类模型确定所述待翻译文本的细分领域之后,还包括:

判断用户是否对所述待翻译文本的细分领域进行手动调整,获得第一判断结果;

若所述第一判断结果为用户未对所述待翻译文本的细分领域进行手动调整,则将所述待翻译文本及其对应的细分领域存储至所述语料库中;

若所述第一判断结果为用户对所述待翻译文本的细分领域进行了手动调整,则判断细分领域标注人员是否认可所述SVM文本分类模型确定的所述待翻译文本的细分领域,获得第二判断结果;

若所述第二判断结果为所述细分领域标注人员认可所述SVM文本分类模型确定的所述待翻译文本的细分领域,则将所述待翻译文本及其对应的细分领域存储至所述语料库中;

若所述第二判断结果为所述细分领域标注人员不认可所述SVM文本分类模型确定的所述待翻译文本的细分领域,则不对所述待翻译文本及其对应的细分领域进行存储。

6.一种面向细分领域的国防军工领域机器翻译系统,其特征在于,所述系统包括:

平行语料句对获取模块,用于获取语料库中的平行语料句对;所述平行语料句对包括原文和对应译文;

SVM文本分类模型获取模块,用于获取训练好的SVM文本分类模型;

平行语料句对细分领域划分模块,用于采用所述训练好的SVM文本分类模型将所述平行语料句对分类到国防军工领域知识体系的各个细分领域中;

细分领域机器翻译模型训练模块,用于采用各个所述细分领域的平行语料句对分别训练通用机器翻译模型,生成对应的细分领域机器翻译模型;

待翻译文本获取模块,用于获取待翻译文本;

细分领域自动划分模块,用于采用所述SVM文本分类模型确定所述待翻译文本的细分领域;

细分领域机器翻译模块,用于调用与所述待翻译文本的细分领域对应的细分领域机器翻译模型对所述待翻译文本进行翻译,生成细分领域翻译结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶工业综合技术经济研究院,未经中国船舶工业综合技术经济研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910948363.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top