[发明专利]使用统计流数据进行不同语言之间的机器翻译有效

专利信息
申请号: 201580071517.2 申请日: 2015-12-02
公开(公告)号: CN107111614B 公开(公告)日: 2021-09-28
发明(设计)人: 哈桑·萨瓦夫 申请(专利权)人: 贝宝公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/51
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 陈蒙
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 统计 数据 进行 不同 语言 之间 机器翻译
【说明书】:

在计算机动作的流中,计算机系统(110)接收涉及机器翻译的请求。在执行翻译(160,238)中或在后续的计算机操作(242,1110)中使用翻译时,计算机系统考虑从先前累积的点击数据(180)获得的在流中执行的机器翻译、流在翻译之前的部分、以及与流在翻译之后的部分有关的成功指示符之间的已知统计关系(310)。统计关系是通过对点击数据进行数据挖掘得到的。此外,可以暂停正常动作以使用随机选项来累积点击数据和/或执行统计AB测试。还提供了其他特征。

相关申请的交叉引用

本申请是2014年12月29日提交的美国专利申请No.14/584,925的继续申请并且要求其优先权,该专利申请的全部内容通过引用并入本文。

本发明的背景技术

本发明涉及在需要不同语言之间的翻译时在计算机网络中使用统计数据进行机器翻译。

随着互联网和其他计算机网络跨越国际边界并提供对用不同语言编写的各种文件的访问,翻译正变得越来越重要。商业、科学、工程、政治、艺术和其他类型的人类交互通常需要翻译。人类翻译员无法跟上这一需求,并且机器翻译正变得普遍。机器翻译(MT)随着计算机执行计算机指令而由计算机产生。从某种意义上讲,MT系统应该模仿人类翻译员的工作,人类翻译员理解源语言并在目标语言中表达相同的理解。然而,人类的理解和人类的表达不能被计算机所捕获:人类和计算机都可以参考词典和语法规则,人类甚至可以在不了解语法的情况下进行翻译,并且人类在即使不说的情况下理解彼此的能力以计算机无与伦比的方式提高他们的翻译能力,计算机不了解任何东西而仅遵循指令。另一方面,计算机速度是人类无与伦比的,并且计算机存储大量数据的能力也是人类无与伦比的,这些大量的数据无需提示或线索即可系统地调用。因此,机器翻译已经开发为具有自己的词汇和统计技术的领域,旨在满足通常的工程问题,例如最小化计算机资源(存储器、处理能力、网络带宽等)的使用,同时提供足够的速度和低成本。

图1示出了具有服务器110的计算机网络,服务器110响应于通过网络130(例如,因特网)从计算机120接收到的请求来执行机器翻译。服务器110可以是单个计算机或是分布式系统,该分布式系统包括由可能包括网络130的各种网络互连的多个计算机。来自计算机120的请求可以是翻译文档的显式请求,或者可以是执行需要翻译的某些其他任务(例如以不同语言执行对文档的搜索)的请求。因此,计算机120的用户可以以一种语言提交搜索查询,但是该查询必须与用另一种语言编写的文档进行匹配,因此在搜索可以继续之前必须翻译搜索查询。

服务器110可以访问存储要搜索的文档的计算机数据库140。如果需要,机器翻译引擎160翻译查询。搜索引擎150接受经翻译的查询,搜索相关数据库140,并产生搜索结果,例如,具有针对每个文档的链接(URL)的数据库文档的列表,可能具有每个文档的简要描述或文档内容的示例。

MT引擎160使用其数据库170来执行翻译。数据库170包含语言模型信息170R(其包括计算机词典和语法的计算机表示),并且还包含从已知翻译得到的统计信息170S。

重要的是,服务器可以存储关于搜索请求的信息,以帮助改进未来的翻译。这些信息显示为点击日志180。例如,假设许多用户提交了我们将表示为“qEn”的英文查询,并且在获得搜索结果之后,用户经常从搜索结果中选择给定的URL(统一资源定位符),例如www.fedex.com,这其是美国公司的英文主页。假设许多其他用户(可能是讲中文的人)也提交中文查询qCn,获得搜索结果,并选择URL www.fedex.com/cn,其是同一公司的中文主页的网址。服务器110可以得出结论,英文查询qEn是中文查询qCn的英文翻译。针对点击数据用于改进机器翻译的其他用途,参见例如于2010年6月24日发布的美国授予专利前公布号2010/0161642(Chen等人)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝宝公司,未经贝宝公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201580071517.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top