[发明专利]自动翻译系统及其自动翻译方法有效
申请号: | 201210107487.4 | 申请日: | 2012-04-12 |
公开(公告)号: | CN102662937A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 江潮 | 申请(专利权)人: | 传神联合(北京)信息技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27;G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 张良 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 翻译 系统 及其 方法 | ||
技术领域
本发明是一种涉及文字自动翻译的技术,具体说,涉及一种自动翻译系统及其自动翻译方法。
背景技术
目前主流的机器翻译系统可以分为两大类:基于规则的机器翻译系统和基于语料库的机器翻译系统。其中基于语料库的机器翻译系统又可以分为:基于统计的机器翻译系统和基于实例的机器翻译系统。无论上述那种类型的机器翻译系统在翻译过程中完全依赖计算机最终都会陷入到歧义裁决的泥潭中。
基于规则的机器翻译系统在规则不足的情况下翻译结果很难准确,但随着规则的不断增多又会导致规则所覆盖的语言实例产生交叉最终互相干扰影响翻译结果。基于统计的翻译系统,是通过对既存语料数据利用预设的统计模型进行分析统计,依靠统计结果来消除机器翻译过程中的词义和语义上的歧义。统计方法的引入在一定程度上解决了歧义问题,但是其效果却受限于语料数据本身的特征。例如:构成语料库文本的文体类型、文章所涉及的行业范畴、文章编写的时代等等,同样的词义、语义或语法现象在不同的文体或行业领域中有不同的出现概率,在A类里概率高的在B类中可能反而会很低,从而导致统计的结果相互抵消降低了歧义消除的效果。因此,基于统计的翻译系统需要有一个类别纯粹且数量足够大的语料库。基于实例的机器翻译系统,是参照已有的语料数据按照一定的策略通过类比和替换产生译文,同样这种方法也需要依赖一个庞大的语料库,而随着语料数据的增加也同样带来了歧义问题。
发明内容
本发明所解决的技术问题是提供一种自动翻译系统,能够形成规范文档并提高了翻译的准确率。
技术方案如下:
一种自动翻译系统,包括:规范文档辅助写作系统和规范文档自动翻译系统,所述规范文档辅助写作系统包括规范词汇库、规范语法规则库和辅助写作模块;所述规范文档自动翻译系统包括自动翻译模块、中外规范词汇映射库、双语规范语法规则映射库;其中,
规范词汇库,用于保存定义的词本身属性;
规范语法规则库,用于存放用于保存定义的语法规则;
辅助写作模块,接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户;将输入文字信息转换为规范语句,将规范语句生成规范化文章后发送给自动翻译模块;
中外规范词汇映射库,用于存放相同语义词汇之间的关联关系;
双语规范语法规则映射库,用于存放所述关联关系确定的外文译文;
自动翻译模块,用于将接收规范化文章,调取所述关联关系和外文译文,将所述规范化文章转化为相应语种的规范化译文。
进一步:所述词本身属性包括有对应关系的词汇身份标识号码ID、词汇、词性类别、概念属性类别、场景属性类别、关联词汇和备注,所述词汇ID用于定义词汇的唯一标识,词汇表示词语本身,所述词性类别、概念属性类别和场景属性类别用来描述词汇语义的特征字段,所述关联词汇用于定义经常一起出现的搭配词汇以及同义词汇,所述备注用于定义词汇语义的自然语言描述;所述中外规范词汇映射库的关联关系包括具有一一对应关系的中文词汇ID和外文词汇ID,所述中文词汇ID表示中文词汇的身份标识号码,所述外文词汇ID表示外文词汇的身份标识号码。
进一步:所述辅助写作模块用于调取所述规范词汇库中的词本身属性和所述规范语法规则库中的相同语义词汇的关联关系,按照所述词本身属性和关联关系对用户输入文字信息进行规范并做出标记。
本发明所解决的另一个技术问题是提供一种自动翻译方法,能够形成规范文档并提高了翻译的准确率。
技术方案如下:
一种自动翻译方法,包括:
规范词汇库保存定义的词本身属性;
规范语法规则库存放用于保存定义的语法规则;
辅助写作模块接收输入文字信息,调取所述词本身属性和语法规则,按照所述词本身属性和语法规则对所述输入文字信息进行规范并作出标记,将标记后的输入文字信息展示给用户;将输入文字信息转换为规范语句,将规范语句生成规范化文章后发送给自动翻译模块;
中外规范词汇映射库存放相同语义词汇之间的关联关系;
双语规范语法规则映射库存放所述关联关系确定的外文译文;
自动翻译模块将接收规范化文章,调取中外规范词汇映射库中关联关系和外文译文,将所述规范化文章转化为相应语种的规范化译文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神联合(北京)信息技术有限公司,未经传神联合(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210107487.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:与输入法集成的语义标注系统和方法
- 下一篇:一种实现软件自动测试的方法及装置