[发明专利]一种多语言智能预处理实时统计机器翻译系统有效
申请号: | 201710203439.8 | 申请日: | 2017-03-30 |
公开(公告)号: | CN107066455B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 张昱琪;唐亮 | 申请(专利权)人: | 唐亮 |
主分类号: | G06F40/45 | 分类号: | G06F40/45;G06F40/55;G06F40/58 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 邝溯琼 |
地址: | 100010 北京市朝阳区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多语言智能预处理实时统计机器翻译系统,包括:接收模块、预处理模块、机器翻译模块和后处理模块。所述接收模块包括文本语言接收模块和语音识别结果接收模块;所述预处理模块包括文本预处理模块和语音识别结果预处理模块;机器翻译模块,所述机器翻译模块用于学习短语对短语的翻译,并对经过预处理模块处理的短语找出对应的翻译短语,以及把短语连接成完整的句子;后处理模块,所述后处理模块用于对翻译结果做单词标点规范化、大小写规范化和格式规范化处理,使其更加接近目标语言的表达习惯,并作为最终结果输出。本发明能够用于对文本语言和语音语言进行翻译,且提高了对小概率词语、短语的翻译准确度。 | ||
搜索关键词: | 一种 语言 智能 预处理 实时 统计 机器翻译 系统 | ||
【主权项】:
一种多语言智能预处理实时统计机器翻译系统,其特征在于,包括:接收模块,所述接收模块用于对系统输入的规范性进行检查,所述接收模块包括文本语言接收模块和语音识别结果接收模块;其中文本语言接收模块用于对文本语言进行句子分割和格式转换,语音识别结果接收模块用于对语音进行分割、噪音消除和格式转换;预处理模块,所述预处理模块包括文本预处理模块和语音识别结果预处理模块,所述文本预处理模块用于对文本输入的语言进行单词规范化操作、类别识别标注及语块语序调整;所述语音识别结果预处理模块用于对语音进行单词规范化操作和标点预测;机器翻译模块,所述机器翻译模块用于学习短语对短语的翻译,并对经过预处理模块处理的短语找出对应的翻译短语,以及把短语连接成完整的句子;后处理模块,所述后处理模块用于对翻译结果做单词标点规范化、大小写规范化和格式规范化处理,使其更加接近目标语言的表达习惯,并作为最终结果输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于唐亮,未经唐亮许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710203439.8/,转载请声明来源钻瓜专利网。