[发明专利]一种固定搭配型短语优先的两段式机器翻译方法有效
申请号: | 201610522056.2 | 申请日: | 2016-06-30 |
公开(公告)号: | CN106156013B | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 秦科;刘贵松;罗光春;段贵多 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 李春芳 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种通过优先翻译由一个或多个短语嵌套组成的固定搭配型短语达到整句翻译目的的机器翻译方法。本发明的实施方式,包括以下步骤:标记固定搭配,将源语言句子中的固定搭配标记出来;翻译固定搭配,将固定搭配分为两部分分别翻译,再重组译文;短语划分,将原句子剩余部分划分为所有可能的短语,固定搭配部分作为已翻译部分;构造候选短语表,仅仅将存在于短语翻译概率表中的短语筛选出来,并加入候选短语表;句子翻译,对于由固定搭配译文及其他未翻译部分组成的局部翻译的源语言句子,利用现有启发式解码器和候选短语表为其生成最优译文。本发明的第一阶段为翻译固定搭配型短语,第二阶段为翻译句子剩余部分。 | ||
搜索关键词: | 一种 固定 搭配 短语 优先 段式 机器翻译 方法 | ||
【主权项】:
1.一种固定搭配型短语优先的两段式机器翻译方法,其特征在于,包括如下步骤,步骤1、在短语模板库中,根据其中的短语模板标记出待翻译源语言句子中存在的固定搭配;步骤2、在固定搭配中,获得与短语模板相匹配的词语译文,再将与短语模板相匹配的词语去除后的剩余部分作为新的待翻译句子,发送至步骤1后迭代得出新的待翻译句子的译文,将该译文、与短语模板相匹配的词语译文合并成固定搭配的译文;步骤3、获取双语短语翻译概率表,再将待翻译源语言句子中未被标记的其余部分进行短语划分,并根据所划分的短语在双语短语翻译概率表中进行检索及匹配;步骤4、如果所划分的短语与双语短语翻译概率表中短语完全匹配,则将双语短语翻译概率表中匹配到的相应短语作为解码过程的候选短语;步骤5、通过将固定搭配的译文对应替换待翻译源语言句子,得到部分翻译的待翻译句子,并根据候选短语利用启发式解码器对部分翻译的待翻译句子进行翻译,最后生成译文。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610522056.2/,转载请声明来源钻瓜专利网。