[发明专利]全篇专利文献翻译方法及翻译系统有效

专利信息
申请号: 201310400123.X 申请日: 2013-09-05
公开(公告)号: CN103488627B8 公开(公告)日: 2017-12-22
发明(设计)人: 任智军;李进;蒋宏飞;杨婧 申请(专利权)人: 中国专利信息中心
主分类号: G06F17/28 分类号: G06F17/28;G06F17/27
代理公司: 北京瑞恒信达知识产权代理事务所(普通合伙)11382 代理人: 苗青盛,王凤华
地址: 100088 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 全篇 专利 文献 翻译 方法 系统
【说明书】:

技术领域

本发明涉及机器翻译技术,尤其涉及全篇专利文献的机器翻译方法及翻译系统。

背景技术

机器翻译是使用计算机实现从一种自然语言文本到另一种自然语言文本的翻译。其研究方法分为规则和统计两种。由于规则系统开发周期长,资金和人力的需求大,所以规则系统进展缓慢。相对而言,统计方法开发周期短、便于处理大规模语料等优点而显出优势。在统计机器翻译方法中,基于短语的翻译方法得到充分的发展。但从目前看,对于专业的领域的翻译来说,比如在专利文档的翻译中,较长的短语常常被分词为几个短语进行翻译。例如,“所述超低温热封聚丙烯流延膜,...”,可能会被分词为“所述”、“超低温”、“热”、“封”、“聚丙烯”和“流延膜”。而在专利文献撰写中,“所述”后的词语通常是固定的,其本身就可以看为一个固定短语,所以能将“超低温热封聚丙烯流延膜”作为一个短语整体进行处理,则只需要一次分析和翻译,就可以在此专利文献中出现该短语时直接套用。另外,对于复杂短语,在句法分析的时候,会由于上下语境的不同而产生不同的短语分词结果,造成同一篇专利文档中译文前后不一致,但对于专利文献来说,很多复杂短语是固定的,在全文中会多次出现,因此只要在全文范围内识别出这样的短语,就可以在全文翻译中直接套用其译文,而不必再对同样的内容进行分析。

公开号为CN103116578A的中国专利申请,公开一种融合句法树和统计机器翻译技术的机器翻译方法与装置,该方法首先建立不同语种语言之间的词典库、语法规则库、短语翻译概率表以及目标语语言模型,然后对原文输入句子进行切分、词性消兼和语法分析,生成句法树,然后采用自顶向下的策略遍历该句法树,对单个节点和部分跨句法的连续节点,取其叶节点的原文与统计机器翻译所训练出的短语翻译概率表进行智能匹配,利用短语翻译表的译文和目标语言的语言模型来达到提高输出译文流利度和准确度的目的。此方法对短语的提取不是基于全文的,因此会存在同样的短语翻译不一致以及多次分析、翻译的情况。

因此,在现有技术的翻译过程中,复杂名词短语不能保持一致性,同时,同一短语被多次地分析、翻译,耗时费力。

发明内容

为了克服现有的缺陷,本发明提出一种全篇专利文献的机器翻译方法和系统。

根据本发明的一个方面,提出了一种全篇专利文献的机器翻译方法,该方法包括以下步骤:A步骤:针对文献全文,识别出各级标题信息并标注;B步骤:对全文进行词法分析,得到分词和词性标注信息;C步骤:根据B步骤的分词和词性标注信息进行短语识别,得到识别名词短语RNP并将该识别名词短语RNP翻译成目标语言;和D步骤:以句子为单位进行翻译,对于标注为RNP的短语直接使用步骤C所得的译文,翻译完毕后,按原文标题顺序输出。

根据本发明的另一个方面,提供了一种机器翻译系统,包括:

输入模块,用于接收并分析文献全文,首先识别各级标题,然后进行词法分析,标注分词、词性信息;

短语识别模块,所述短语识别模块用于得到识别名词短语RNP短语翻译模块,所述短语翻译模块翻译识别名词短语,并保存在短语存储器中;

全文翻译模块,所述全文翻译模块对全文逐句翻译,对于识别名词短语RNP不再进行句法展开,直接从短语存储器中取译文;和

输出模块,所述输出模块将翻译结果按原标题顺序输出。

本发明提供一种全篇专利全文机器翻译方法和翻译系统,解决了现有技术中常用复杂名词短语翻译不一致及翻译效率低的问题。

附图说明

本发明的上述及其它方面和特征将从以下结合附图对实施例的说明清楚呈现,在附图中:

图1是全篇专利文献机器翻译方法流程图;

图2是短语处理模块工作流程图;

图3是短语翻译器句法分析的一个例子;

图4是全篇专利文献机器翻译系统的结构图;

图5是短语识别模块的工作流程图;和

图6是短语翻译模块的工作流程图。

具体实施方式

下面结合附图和具体实施例对本发明提供的一种全篇专利文献机器翻译方法和系统进行详细描述。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国专利信息中心,未经中国专利信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310400123.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top