[发明专利]用于建立对象层次结构的方法和系统有效
申请号: | 200810111482.2 | 申请日: | 2008-06-26 |
公开(公告)号: | CN101615178A | 公开(公告)日: | 2009-12-30 |
发明(设计)人: | 赵彧;李建强 | 申请(专利权)人: | 日电(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 柳春雷 |
地址: | 100007北京市东城区东四十*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 建立 对象 层次 结构 方法 系统 | ||
技术领域
本发明一般地涉及从Web获取领域知识(domain knowledge)的方法 和系统。更具体而言,本发明提供了允许自动建立对象层次结构(object hierarchy)的方法和系统。
背景技术
当前,计算机已经成为现代生活必不可少的工具,它可以帮助用户找 到感兴趣的信息,这在当今大量信息在Web上不断积累的因特网时代尤其 明显。虽然计算机在进行诸如计算、存储或搜索之类的信息处理时速度很 快,但其无法理解信息,这成为智能信息处理的主要障碍。为了解决这个 问题,最近用于智能信息处理的语义相关研究变得非常流行。例如,在T. Berners-Lee、J.Hendler和O.Lassila的题为“The Semantic Web” (Scientific American,2001年5月,第28-37页)、Nigel Shabolt、Tim Berners-Lee和Wendy Hall的题为“The Semantic Web Revisited”(IEEE Intelligent Systems 21(3),第96-101页,2006年5月、6月)以及E. Hyvonen(编者)的题为“Semantic Web Kick-Off in Finland-Vision, Technologies,Research,and Applications”(HIIT Publications,2002-001, Helsinki Institute for Information Technology(HIIT),Helsinki,Finland,第304 页)中所描述的技术,这些文档通过引用被整体上结合于此以用于所有目 的。它们的主要用途是帮助计算机理解信息的格式和技术。基于某些算术 逻辑,例如描述逻辑和框架逻辑,根据人工智能(AI)传统规律的知识表 示以及现在流行的Web信息处理技术,诸如万维网联盟(W3C)之类的 标准制订组织正在积极制订XML(可扩展标记语言)、RDF(资源描述 框架)和OWL(Web本体语言)等标准并且正在推广语义技术采用的规 则语言,例如Web规则语言和规则标记语言。而且,很多研发商、企业和 相关从业者也已经开始建立和采用相关工具集、产品,甚至实际应用来使 得基于语义的智能信息利用成为可能。
但是,为了使用计算机的强大计算能力和语义相关标准向Web用户提 供不同的智能信息利用服务,领域知识在其中扮演非常关键的角色。因 此,领域知识的建立成为一个急需解决的重要问题。
当前,主要存在两种领域信息,即本体(ontology)和层次结构。
本体是一种用于限定概念之间的关系的文档或文件。用于Web的最典 型的本体具有分类系统(taxonomy)和一组推理规则(inference rule)。 其中分类系统定义了对象类以及它们之间的关系。例如,地址可以被定义 为一种位置,城市代码可以被限定为仅应用于位置等等。本体可以表达如 下规则:“如果一个城市代码与一个州代码相关联并且一个地址使用该城 市代码,则该地址具有相关的州代码”。从而,容易例如推导出以下关 系:位于Ithaca的Comell大学的地址必定在纽约州,纽约州在美国,因此 该地址按美国标准格式化。
层次结构包含节点和连接节点的边,有时在节点处附接有实例 (instance)。与本体相比,层次结构是一种更简单的形式。本体中的很多 元素(例如类、属性、定义和关系)在层次机构中可被忽略。但是,这些 元素也可以通过某些方式从层次结构中推导出来。因此,层次结构可被视 为一种伪本体,其具有明确但不正式的规范。
在现有技术中的本体建立(Ontology Building,OB)方法主要分为两 类。即基于原始素材(raw material)的本体建立和基于某些已有本体的本 体建立。在基于原始素材的本体建立方法中,例如可以根据文本、字典、 知识库、半结构化数据、关系模式等来建立本体。在基于某些已有本体的 本体建立方法中,通过对比概念的文本、上下文等,将若干已有本体集成 在一起以得到一种最终本体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810111482.2/2.html,转载请声明来源钻瓜专利网。