[发明专利]一种融合句法树和统计机器翻译技术的翻译方法与装置无效
申请号: | 201310049739.7 | 申请日: | 2013-02-07 |
公开(公告)号: | CN103116578A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 罗文;黄子河;刘法旺;胡小鹏;宋金平;袁琦 | 申请(专利权)人: | 北京赛迪翻译技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100048 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种融合句法树和统计机器翻译技术的机器翻译方法与装置,该方法首先建立不同语种语言之间的词典库、语法规则库、短语翻译概率表以及目标语语言模型,然后对原文输入句子进行切分、词性消兼和语法分析,生成句法树,然后采用自顶向下的策略遍历该句法树,对单个节点和部分跨句法的连续节点,取其叶节点的原文与统计机器翻译所训练出的短语翻译概率表进行智能匹配,利用短语翻译表的译文和目标语言的语言模型来达到提高输出译文流利度和准确度的目的。本发明既利用了短语翻译表所提供的细粒度知识,又利用了句法树在解决句子的深层和长距离相关性问题方面的优势,能够显著提高机器翻译的译文质量。 | ||
搜索关键词: | 一种 融合 句法 统计 机器翻译 技术 翻译 方法 装置 | ||
【主权项】:
一种融合句法树和统计机器翻译技术的机器翻译方法,其步骤包括:1)建立不同语种语言之间的词典库、语法规则库、短语翻译概率表以及目标语语言模型;其中词典库存储不同语种语言相对应的单词和短语,语法规则库存储不同语种语言相对应的语法规则,短语翻译概率表中存储由统计机器翻译系统训练而得的不同语种语言的翻译片断,目标语语言模型存储由统计机器翻译系统训练而得的目标语言的语言模型;2)读取词典库信息,对输入的待翻译单句进行切分,将该单句分解为源语言的单词或短语;3)读取语法规则库信息,对切分后的单句进行词性消兼和语法分析,形成一棵句法树;4)读取短语翻译概率表信息,采用自顶向下的策略遍历所述句法树,对所述句法树中的单个节点和部分跨句法的连续节点,取其叶节点的原文搜索所述短语翻译概率表,并选取该短语翻译表中的译文作为所述句法树中节点的译文;对上述过程中未翻译的句法树节点,根据规则翻译方法生成译文;5)利用所述目标语语言模型对生成的译文进行平滑,生成目标语言。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛迪翻译技术有限公司,未经北京赛迪翻译技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310049739.7/,转载请声明来源钻瓜专利网。