[发明专利]结构化数据库的语义查询引擎有效
申请号: | 201110238260.9 | 申请日: | 2011-08-12 |
公开(公告)号: | CN102929898A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 徐鹏;陈正 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陆嘉 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构 数据库 语义 查询 引擎 | ||
技术领域
本发明涉及搜索技术,更具体地说,涉及一种能够在结构化的数据库中进行模糊搜索的技术。
背景技术
Web或者其他的数据种子(data feeds)是目前最大的数据来源。在Web上使用的数据通常是非结构化或者半结构化的。非结构化或者半结构化的数据有利于数据呈现,也有利于人的阅读和理解的,但是不利于数据的搜索和处理。非结构化或者半结构化的数据的组织方式更加接近人类的思考方式,通过“语义”进行关联,因此对于人类来说,阅读和理解都十分方便。但是对于计算机这样的机器来说,以“语义”关联的数据就变得难以处理。计算机处理数据的方式是按照严格的数据格式和数据结构,对于“语义”计算机不能理解。
结构化的数据更加适合进行数据搜索和数据处理。结构化的数据的一个例子是结构化数据库,例如SQL数据库或者Oracle数据库,这些数据库以严格的数据格式保存数据,这样,在计算机进行搜索时,只需要按照固定的数据格式进行搜索,就能够得到良好的搜索结果。
但是在网络上,即使是结构化的数据也会遇到很多的处理方面的困难。由于各个结构化数据库各自使用的数据格式不同,使得在整个网络上进行搜索时,依旧不能找到统一的数据格式,使得搜索效果大打折扣。如果要实现在整个网络上的高效搜索,必须对每一种结构化数据库的数据结构进行深入的研究,统一其中的数据格式,这显然是一件十分耗时、又难以实现的工作。
近年来,语义网络(Semantic Web)的出现提供一个一种解决上述问题的出路。语义网络利用了本体(Ontology)的概念,本体可以理解为是一个形式化定义语词关系的规范化文件。本体具备分类体系与推理原则, 借助于本体,能够在各种异构数据(包括各种按照不同数据结构的结构化数据、半结构化数据或者非结构化数据)的实体和类之间建立合理的关联和推理,使得这些异构数据被本体集合在一起并重新加以解释,从而提高数据的集成度和关联程度。
发明内容
本发明旨在提出一种利用本体(ontology)实现的对结构化数据进行语义查询的技术。
根据本发明的一实施例,提出一种结构化数据库的语义查询引擎。该语义查询引擎从数据来源获得未加工的数据,利用数据加工装置依据应用程序的要求对未加工的数据进行加工。加工后的数据被保存在数据存放库中,在数据存放库中,经加工的数据被以一种或多种模型保存以形成数据实体。基于本体(ontology)创建的共享全局数据模型提供本体实体。本体实体与数据实体之间进行映射。数据存放库中的经加工的数据的模型、共享全局数据模型、以及数据存放库中的数据实体与共享全局数据模型中的本体实体之间的映射关系都由元数据进行描述。
根据本发明的一实施例,提出一种结构化数据库的语义查询引擎。该语义查询引擎从信息系统获得未加工的数据。利用数据提取及包装装置从信息系统中提取未加工的数据并依据应用程序的要求对该未加工的数据进行包装。经包装的数据被保存在数据存放库中,在数据存放库中,经包装的数据一种或多种模型保存以形成数据实体。基于本体(ontology)创建的共享全局数据模型提供本体实体。数据模型映射装置将分布在数据存放库中的数据实体映射到共享全局数据模型中的本体实体。数据存放库中经包装的数据的模型、共享全局数据模型中的本体实体和数据实体与本体实体之间的映射由元数据描述。根据由元数据的描述,使用动态封装引擎将语义查询转换成数据存放库指定的查询并进行搜索,获得搜索结果。由本体聚合及分类装置依据本体实体实现搜索结果的聚合及分类。经聚合和分类后的搜索结果由数据交互及视图装置通过用户界面以特征的形式呈现。
根据一个实施例,提出一种结构化数据库的语义查询引擎,包括如下 的层次结构:信息系统层、数据处理层、数据模型及映射层、数据管理层、视图层和交互层。信息系统层保存未加工的数据。数据处理层提取未加工的数据并对该未加工的数据进行包装并对包装后的数据进行导入操作。数据模型及映射层导入包装后的数据,以一种或多种模型保存经包装的数据,形成数据实体,基于本体(ontology)创建本体实体并将数据实体映射到本体实体。数据管理层接收语义查询,根据经包装的数据的模型、共享全局数据模型以及映射,将语义查询转换成数据存放库指定的查询并进行搜索,获得搜索结果,依据本体实体实现搜索结果的聚合及分类。视图层提供不同的数据视图,交互层提供与用户的交互。
附图说明
本发明的上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变得更加明显,在附图中,相同的附图标记始终表示相同的特征,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110238260.9/2.html,转载请声明来源钻瓜专利网。