[发明专利]确定组织在不同语言中的名称的方法和系统无效

专利信息
申请号: 200810212468.1 申请日: 2008-08-29
公开(公告)号: CN101661480A 公开(公告)日: 2010-03-03
发明(设计)人: 吴贤;张俐;郭宏蕾;苏中 申请(专利权)人: 国际商业机器公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 赵 科
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 确定 组织 不同 语言 中的 名称 方法 系统
【说明书】:

技术领域

发明一般涉及组织名称的确定,尤其涉及根据组织在源语言中 的名称来确定其在目标语言中的名称。

背景技术

为了增强国际影响力,很多组织具有多种语言的名称,其中一个 组织在不同语言中的名称相互之间具有某种相似性。例如,中文名称 “思科”和“谷歌”分别源自其英文名称“Cisco”和“Google”的发音,而英 文名称“Sino Ocean Land”和“China Mobile”分别是其中文名称“远洋 地产”和“中国移动”的字义翻译。

组织名称的确定对于信息提取和检索非常重要,尤其是对于商业 智能应用和搜索引擎而言。在知道某组织在一种语言中的名称的情况 下,为了从万维网上收集关于该组织的各种语言的信息,需要根据该 组织在这种语言中的名称确定该组织在其他语言中的名称,从而检索 搜索引擎和获得搜索结果。

但是,组织名称的确定非常难。首先,一个组织在不同语言中的 名称之间的相似性可以是多种多样的,诸如可以是意思,发音等等, 因此机器很难对一组织在不同语言中的名称之间所具有的相似性进 行预测,进而对组织名称进行准确的确定。其次,组织名称的确定要 求非常高的准确性,因为其将被发送用于进一步的处理。

在现有技术中,已经存在三种确定组织名称的方法:

1.直接映射方法,在该方法中,维持一个表格,该表格存储组 织在不同语言中的名称之间的映射关系。但是,组织的数量不断地增 加,并且语言映射的组合非常多,因此,维持这样的映射表格很困难 并且成本很高。

2.基于机器翻译的方法,其对名称进行切词,从而得到较小的 词单元,然后借助于字典分别翻译所得到的每个词单元,最后通过机 器学习技术将每个词单元的翻译结果组合在一起。但是,这种方法不 适用于根据发音或以其他非字义的形式所生成的名称。而且,即使对 于由意思相似性所生成的名称,这样的直接翻译也不可能得到准确的 名称。而且,以上两种方法要求大量的手动工作。

3.基于网络搜索的方法,其直接将组织在源语言中的名称输入 到搜索引擎进行查询,然后从搜索结果中所出现的英文短语中选择该 组织的英文名称。但是,有时候在搜索结果中只有很少的英文内容。 而且,并没有关于如何挑选准确英文名称的准则,且可能同时仅选择 了某种噪声。

因此,需要一种确定组织名称的方法和装置来更有效、更准确地 确定目标语言中的组织名称,从而克服现有技术中的缺陷。

发明内容

本发明利用组织的网址URL(统一资源定位符)信息来根据组 织在源语言(例如非英语语言)中的名称确定该组织在目标语言(例 如英语)的名称。可选地,通过本发明,还可以以目标语言中的名称 为媒介来进一步确定组织在另一目标语言中的名称。

在现有技术中,已知可以以多种方式获取组织的网址URL,例 如可以借助于搜索引擎、其他外部数据源等。特别地,在当前的搜索 引擎领域中,各种搜索引擎都通过各种方法尽量使自己的搜索结果更 准确。例如,Google用其所开发的基于网络链接构造的PageRank方 法来确定网络上页面的重要性,并在搜索结果列表中根据页面的重要 性对搜索结果进行排序。通常,对于组织名称作为查询项的搜索,搜 索引擎认为该组织的主页的重要性最高,并将该组织的主页列在搜索 结果列表中的第一个搜索结果或前几个搜索结果中。因此借助于搜索 引擎可以很容易地获得链接到该组织的主页的该组织的网址URL。

组织网址URL通常由该组织的名称的完整表达或缩写(例如英 文首字母缩写)构成,即其能够比较准确地反映组织名称的特征,因 此本发明所提供的基于组织网址URL的组织名称确定方法和装置能 够更有效、更准确地从一种语言中的组织名称确定另外一种语言中的 组织名称。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810212468.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top