[发明专利]一种单词原形化的英汉统计机器翻译方法在审
申请号: | 201510130398.5 | 申请日: | 2015-03-24 |
公开(公告)号: | CN106156007A | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 吕海港 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 030001 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种单词原形化的英汉统计机器翻译方法,它包括:在双语训练语料中,把英语句子中单词进行原形化预处理为“单词原形_词性”,把原形化的英语语料和汉语语料进行词对齐后提取翻译短语表;翻译短语表与语言模型和调序模型共同组成翻译系统;欲翻译的英语句子同样原形化后使用上述翻译系统进行翻译得到中文翻译结果。经过单词原形化预处理,英汉统计机器翻译在翻译效率和效果上都有一定程度的改进。 | ||
搜索关键词: | 一种 单词 原形 英汉 统计 机器翻译 方法 | ||
【主权项】:
一种单词原形化的英汉统计机器翻译方法,其特征在于:在翻译训练阶段,把英语句子中单词进行原形化预处理,把单词原形化的英语语料和中文分词的汉语语料进行词对齐后提取翻译短语表;翻译短语表与语言模型和调序模型共同组成翻译系统;欲翻译的英语句子同样原形化预处理后使用上述翻译系统进行翻译得到中文翻译结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吕海港,未经吕海港许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510130398.5/,转载请声明来源钻瓜专利网。
- 上一篇:线缆剥层用切削装置
- 下一篇:一种运送齿轮的夹紧工装