[发明专利]一种精确调序的统计机器翻译方法与装置在审
申请号: | 201510767105.4 | 申请日: | 2015-11-11 |
公开(公告)号: | CN105446961A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 宋金平;程国艮 | 申请(专利权)人: | 中译语通科技(北京)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京万贝专利代理事务所(特殊普通合伙) 11520 | 代理人: | 马红 |
地址: | 100040 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 精确 统计 机器翻译 方法 装置 | ||
技术领域
本发明涉及机器翻译技术领域,特别涉及一种精确调序的统计机器翻译方法及装置。
背景技术
现有的统计机器翻译一直存在译文长距离调序问题,基于短语统计机器翻译存在的调序能力不足。
发明内容
本发明要解决的是现有交互式机器翻译具有延迟,实用性低的技术问题。
为了解决上述问题,一种精确调序的统计机器翻译方法,包括:对源文进行浅层分析,分析出各句子组成的词性短语语块,判断出语块的边界及类型,生成句法树,读取整句句式翻译调序库信息,根据所述句法树,在翻译调序句式库中得到匹配度最高的翻译调序句式;根据所述匹配度最高的翻译调序句式,将所述句法树生分部分译文和部分原文。
更优地,所述整句句式翻译调序库是一个知识库,里面存储翻译调序的句式,每个句式还有相应的权值,该句式越具体,则权值越高,越抽象,则权值越低。
更优地,对源文进行浅层分析前,读取词典库信息,对所述源文句子进行分词,将该句子分解为源语言的单词或短语;其中,词典库存储不同语种语言相对应的单词、短语。
更优地,读取语法规则库信息,对分词后的源文句子进行浅层句法分析,生成浅层句法树;其中,语法规则库存储不同语种语言相对应的语法规则。
更优地,将所述部分原文送入统计机器翻译引擎,得到相应的译文;将所述句法树生成的部分译文和统计机器翻译引擎得到的相应译文组合成输入源文句子的完整译文。
本发明还包括一种精确调序的统计机器翻译装置,包括:浅层句法分析器模块对源文进行浅层分析,分析出各句子组成的词性短语语块,判断出语块的边界及类型,生成句法树,匹配器模块读取整句句式翻译调序库信息,根据所述句法树,在翻译调序句式库中得到匹配度最高的翻译调序句式;根据所述匹配度最高的翻译调序句式,将所述句法树生分部分译文和部分原文。
更优地,所述整句句式翻译调序库是一个知识库,里面存储翻译调序的句式,每个句式还有相应的权值,该句式越具体,则权值越高,越抽象,则权值越低。
更优地,浅层句法分析器模块对源文进行浅层分析前,分词模块读取词典库信息,对所述源文句子进行分词,将该句子分解为源语言的单词或短语;其中,词典库存储不同语种语言相对应的单词、短语。
更优地,浅层句法分析器模块读取语法规则库信息,对分词后的源文句子进行浅层句法分析,生成浅层句法树;其中,语法规则库存储不同语种语言相对应的语法规则。
更优地,将所述部分原文送入统计机器翻译引擎模块,得到相应的译文;组合模块将所述句法树生成的部分译文和统计机器翻译引擎得到的相应译文组合成输入源文句子的完整译文。
本发明的有益效果:本发明的技术方案对源文采用了匹配整句句式翻译调序库中匹配度最高的翻译调序句式方式获得了最佳调序,分析质量有保证。
采用整句句式翻译调序库,既可以对浅层分析所生成的句法树进行部分翻译,又可以调序。
整句句式翻译调序库中的每个句式具有不同的权值,句式中含有的具体词越多,其权值越高,优先级也就越高,这样当有多个句式都能匹配上浅层分析句法树时,就能自动选择最优的句式,避免了各句式之间的冲突。
附图说明
图1一种精确调序的统计机器翻译方法流程示意图;
图2一种精确调序的统计机器翻译装置示意图。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本发明实施例以及实施例中的各个特征可以相互结合,均在本发明的保护范围之内。
实施例一,一种精确调序的统计机器翻译方法,如图1所示,一种精确调序的统计机器翻译方法,包括:对源文进行浅层分析,分析出各句子组成的词性短语语块,判断出语块的边界及类型,生成句法树,读取整句句式翻译调序库信息,根据所述句法树,在翻译调序句式库中得到匹配度最高的翻译调序句式;根据所述匹配度最高的翻译调序句式,将所述句法树生分部分译文和部分原文。
具体的,词性短语包括基本名词短语、动词短语、形容词短语、副词短语等语块。
判断出语块的边界及类型解释:
比如例句:Heknowswhatneedstobedonetowelcomeforeignfunds,theSCMPquotedanofficialwiththePudonggovernmentassaying.
“foreignfunds”、“hePudonggovernment”、“welcomeforeignfunds”
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技(北京)有限公司,未经中译语通科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510767105.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抗疲劳圆柱螺旋弹簧
- 下一篇:一种报表自动生成方法及系统