[发明专利]使用统计流数据进行不同语言之间的机器翻译有效
申请号: | 201580071517.2 | 申请日: | 2015-12-02 |
公开(公告)号: | CN107111614B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 哈桑·萨瓦夫 | 申请(专利权)人: | 贝宝公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/51 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 陈蒙 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 统计 数据 进行 不同 语言 之间 机器翻译 | ||
在计算机动作的流中,计算机系统(110)接收涉及机器翻译的请求。在执行翻译(160,238)中或在后续的计算机操作(242,1110)中使用翻译时,计算机系统考虑从先前累积的点击数据(180)获得的在流中执行的机器翻译、流在翻译之前的部分、以及与流在翻译之后的部分有关的成功指示符之间的已知统计关系(310)。统计关系是通过对点击数据进行数据挖掘得到的。此外,可以暂停正常动作以使用随机选项来累积点击数据和/或执行统计AB测试。还提供了其他特征。
本申请是2014年12月29日提交的美国专利申请No.14/584,925的继续申请并且要求其优先权,该专利申请的全部内容通过引用并入本文。
本发明涉及在需要不同语言之间的翻译时在计算机网络中使用统计数据进行机器翻译。
随着互联网和其他计算机网络跨越国际边界并提供对用不同语言编写的各种文件的访问,翻译正变得越来越重要。商业、科学、工程、政治、艺术和其他类型的人类交互通常需要翻译。人类翻译员无法跟上这一需求,并且机器翻译正变得普遍。机器翻译(MT)随着计算机执行计算机指令而由计算机产生。从某种意义上讲,MT系统应该模仿人类翻译员的工作,人类翻译员理解源语言并在目标语言中表达相同的理解。然而,人类的理解和人类的表达不能被计算机所捕获:人类和计算机都可以参考词典和语法规则,人类甚至可以在不了解语法的情况下进行翻译,并且人类在即使不说的情况下理解彼此的能力以计算机无与伦比的方式提高他们的翻译能力,计算机不了解任何东西而仅遵循指令。另一方面,计算机速度是人类无与伦比的,并且计算机存储大量数据的能力也是人类无与伦比的,这些大量的数据无需提示或线索即可系统地调用。因此,机器翻译已经开发为具有自己的词汇和统计技术的领域,旨在满足通常的工程问题,例如最小化计算机资源(存储器、处理能力、网络带宽等)的使用,同时提供足够的速度和低成本。
图1示出了具有服务器110的计算机网络,服务器110响应于通过网络130(例如,因特网)从计算机120接收到的请求来执行机器翻译。服务器110可以是单个计算机或是分布式系统,该分布式系统包括由可能包括网络130的各种网络互连的多个计算机。来自计算机120的请求可以是翻译文档的显式请求,或者可以是执行需要翻译的某些其他任务(例如以不同语言执行对文档的搜索)的请求。因此,计算机120的用户可以以一种语言提交搜索查询,但是该查询必须与用另一种语言编写的文档进行匹配,因此在搜索可以继续之前必须翻译搜索查询。
服务器110可以访问存储要搜索的文档的计算机数据库140。如果需要,机器翻译引擎160翻译查询。搜索引擎150接受经翻译的查询,搜索相关数据库140,并产生搜索结果,例如,具有针对每个文档的链接(URL)的数据库文档的列表,可能具有每个文档的简要描述或文档内容的示例。
MT引擎160使用其数据库170来执行翻译。数据库170包含语言模型信息170R(其包括计算机词典和语法的计算机表示),并且还包含从已知翻译得到的统计信息170S。
重要的是,服务器可以存储关于搜索请求的信息,以帮助改进未来的翻译。这些信息显示为点击日志180。例如,假设许多用户提交了我们将表示为“qEn”的英文查询,并且在获得搜索结果之后,用户经常从搜索结果中选择给定的URL(统一资源定位符),例如www.fedex.com,这其是美国公司的英文主页。假设许多其他用户(可能是讲中文的人)也提交中文查询qCn,获得搜索结果,并选择URL www.fedex.com/cn,其是同一公司的中文主页的网址。服务器110可以得出结论,英文查询qEn是中文查询qCn的英文翻译。针对点击数据用于改进机器翻译的其他用途,参见例如于2010年6月24日发布的美国授予专利前公布号2010/0161642(Chen等人)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝宝公司,未经贝宝公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580071517.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置