[发明专利]双语句对模式化记录方法以及翻译方法和翻译系统有效
申请号: | 200910162384.6 | 申请日: | 2009-08-14 |
公开(公告)号: | CN101996166A | 公开(公告)日: | 2011-03-30 |
发明(设计)人: | 张龙哺 | 申请(专利权)人: | 张龙哺 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双语 模式 记录 方法 以及 翻译 系统 | ||
发明领域
本发明涉及计算机翻译技术领域,更具体地,涉及双语句对模式化记录方法以及基于双语模式化句对的翻译方法和翻译系统。
发明背景
语言翻译是一门科学、一门艺术。由于语言的种类繁多、干变万化。要使一种语言转换成另一种语言,需要付出大量创造性的劳动。自从上个世纪30年代,人们就提出了机器翻译的设想。随着计算机技术的发展,先后出现了各种类型的计算机翻译系统和技术,比如ED(电子词典)、MT(机器翻译)、TM(翻译存储器)、IT(交互翻译)和CAT(计算机辅助翻译)等等。
这些系统分别用不同的方法针对自然语言的某些方面进行语言转换工作。其中,电子词典只能对单词进行翻译或查找。
传统的MT技术是基于语法规则对语言进行转换,其中语法规则是语言专家撰写的,并由程序员写在翻译程序中的,它只能由程序员添加和修改。由于语言的丰富性和灵活性,靠少量的语法规则是不可能覆盖所有的语言现象的。因此传统的MT技术不能获得好的翻译质量,尤其是针对长句子和句型复杂的句子。
随着计算机运算速度和记录介质的存储容量的迅速提高,人们于上世纪90年代提出了基于统计的翻译技术,即翻译存储器技术(TM)。其基本思路是海量存储双语句对,对于已经翻译过或已存储的原文句子,只要提取出相应的译文,就能得到准确的翻译结果。因此,TM技术为计算机翻译技术指出了一条高质量准确翻译的方向。
图1A示出传统的采用TM翻译技术的翻译方案。其中,TM翻译模式将输入的原文句子与语料库的双语句对的原文部分相比较(匹配)。如果完全匹配或满足规定的匹配率,则将双语句对的译文部分作为TM翻译结果输出。
图1B显示了传统的句对记录方法所记录的句对例子。即在左边部分记录原文,在右边部分记录译文,中间用分隔符分开。其中,原文和译文都是常规的文字内容,即单词(字)、标点符号等。其中,除了原文与译文之间的分隔符之外,不存在其它用于帮助翻译的信息。因此,这种句对的作用是非常有限的。也就是说,除了相同的句子能给出准确的翻译结果外,对于类似的句子也不能给出准确的翻译结果。
因此,使用传统的TM技术,就必须积累所有可能出现的句子和翻译句对。但由于语言的灵活性和丰富性,以及各个作者写作的随意性,要积累某种翻译语言对中所有句子几乎是不可能完成的事情。这是因为所说句子量是无限的或不可估量的。在实践中,我们在某个专业中积累了几十万个句对,花费了许多人力和财力,但在进行翻译测试时,只有千分之几的覆盖率。因此,TM计算机翻译技术又碰到了巨大的障碍。由此,人们反过来又想起传统MT技术的好处了,即用少量的语法规则或句型来覆盖更多的句子。或者将MT技术与TM技术结合起来,形成多策略的翻译技术。
本发明人于上世纪80年代开始研究计算机翻译技术,并于2003年开始研究智能化知识库理论以及相应的计算机智能翻译技术,尤其是其中的智能化翻译句对记录和存储技术,即采用人工智能方式来提高翻译句对的使用效率,也称为覆盖率,相关的信息可以参见爱译网:www.aitrans.net。
另外,近几年也出现了一些TM改进技术,比如将句型用于TM技术方案,其目的是用句型库中存储的句型来覆盖更多的句子。其原理是将翻译的例句抽象成为一个句型,在翻译时也先将要翻译的句子进行语法分析并抽象为一个语法树结构,然后再用上述句型与要翻译的句子进行译文的创建(翻译)。这种方法实际上又回到了传统MT技术的老路上,首先是因为将例句抽象成语法句型是一件很费时且费力的工作,而且不能自动进行。另外,虽然采用句型可提高翻译的覆盖率,即增强了普遍性,但同时它也损失了句子的独特性,反而会影响独特句子的翻译准确性。由于句型匹配算法的不完善并且缺乏有效的句型积累手段,目前还没有看到这种技术的实用化例子。
发明内容
本申请的发明目的是要提供一种基于实例的智能化句对记录方法,利用该智能化句对,计算机能执行高级的智能翻译和处理。所述智能化句对兼翻译实例和翻译模式于一身,因此它能保留具体翻译句对的独特性又具有翻译模式的普遍性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张龙哺,未经张龙哺许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910162384.6/2.html,转载请声明来源钻瓜专利网。