[发明专利]基于智能知识库的网络化人工智能翻译系统及其翻译方法有效
申请号: | 201010593281.8 | 申请日: | 2010-12-17 |
公开(公告)号: | CN102567310A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 张龙哺 | 申请(专利权)人: | 张龙哺 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 智能 知识库 网络化 人工智能 翻译 系统 及其 方法 | ||
发明领域
本发明涉及计算机翻译技术领域、人工智能计算机翻译技术和网络翻译技术(云翻译技术),更具体地,涉及基于智能知识库的网络化人工智能翻译系统。
发明背景
自从上个世纪30年代,人们就提出了机器翻译的设想。随着计算机技术的发展,先后出现了各种类型的计算机翻译系统和技术,比如ED(电子词典)、MT(机器翻译)、TM(翻译存储器)、IT(交互翻译)和CAT(计算机辅助翻译)等等。
这些系统分别用不同的方法针对自然语言的某些方面进行语言转换工作。其中,电子词典只能对单词进行翻译或查找。
传统的MT技术是基于语法规则对语言进行转换,其中语法规则是语言专家撰写的,并由程序员写在翻译程序中的,它只能由程序员添加和修改。由于语言的丰富性和灵活性,靠少量的语法规则是不可能覆盖所有的语言现象的。因此传统的MT技术不能获得好的翻译质量,尤其是针对长句子和句型复杂的句子。
随着计算机运算速度和记录介质的存储容量的迅速提高,人们于上世纪90年代提出了基于统计的翻译技术,即翻译存储器技术(TM)。其基本思路是海量存储双语句对,对于已经翻译过或已存储的原文句子,只要提取出相应的译文,就能得到准确的翻译结果。因此,TM技术为计算机翻译技术指出了一条高质量准确翻译的方向。
图1A示出传统的采用TM翻译技术的翻译方案。其中,TM翻译模式将输入的原文句子与语料库的双语句对的原文部分相比较(匹配)。如果完全匹配或满足规定的匹配率,则将双语句对的译文部分作为TM翻译结果输出。对于不完全匹配的句子,传统的TM翻译系统只能给出所记忆的最接近的参考例句,不能解决不匹配部分的准确翻译问题。
图1B显示了传统的句对记录方法所记录的句对例子。即在左边部分记录原文,在右边部分记录译文,中间用分隔符分开。其中,原文和译文都是常规的文字内容,即单词(字)、标点符号等。其中,除了原文与译文之间的分隔符之外,不存在其它用于帮助翻译的信息。因此,这种句对的作用是非常有限的。也就是说,除了相同的句子能给出准确的翻译结果外,对于类似的句子也不能给出准确的翻译结果。
比如,在语料库中记忆了图1B所示的句对:
he bought a gold_watch for his wife.^他为他的妻子买了一块金表。
如果当前要翻译的句子为:
I bought a gold-ring for my wife.
采用TM匹配翻译,系统给出的结果只能是上面所示句对中的译文结果,即“他为他的妻子买了一块金表”。因此,该结果只能作为参考,还必须人工修改才能得到正确的结果:“我为我的妻子买了一个金戒指。”。
因此,使用传统的TM技术,就必须积累所有可能出现的句子和翻译句对。但由于语言的灵活性和丰富性,以及各个作者写作的随意性,要积累某种翻译语言对中所有句子几乎是不可能完成的事情。这是因为所说句子量是无限的或不可估量的。在实践中,我们在某个专业中积累了几十万个句对,花费了许多人力和财力,但在进行翻译测试时,只有千分之几的覆盖率。因此,TM计算机翻译技术又碰到了巨大的障碍。由此,人们反过来又想起传统MT技术的好处了,即用少量的语法规则或句型来覆盖更多的句子。或者将MT技术与TM技术结合起来,形成多策略的翻译技术。
另外,近几年也出现了一些TM改进技术,比如将句型用于TM技术方案,其目的是用句型库中存储的句型来覆盖更多的句子。其原理是将翻译的例句抽象成为一个句型,在翻译时也先将要翻译的句子进行语法分析并抽象为一个语法树结构,然后再用上述句型与要翻译的句子进行译文的创建(翻译)。这种方法实际上又回到了传统MT技术的老路上,首先是因为将例句抽象成语法句型是一件很费时且费力的工作,而且不能自动进行。目前还没有看到实用化的句型积累方法和工具。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张龙哺,未经张龙哺许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010593281.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:硬盘支架
- 下一篇:实现桌面素材定时更新的方法