[发明专利]基于本体构建材料科学领域语义数据模型的方法有效
申请号: | 201210151430.4 | 申请日: | 2012-05-15 |
公开(公告)号: | CN102682122A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 胡长军;李扬;刘振宇;成欣 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 本体 构建 材料科学 领域 语义 数据模型 方法 | ||
技术领域
本发明涉及一种构建语义数据模型的方法,尤其涉及一种基于本体构建材料科学领域语义数据模型(Semantic Model for Materials science data,简称SMM)的方法,以实现为用户提供科学领域数据服务。
背景技术
本体(Ontology)的概念起源于哲学领域,定义为“对世界上客观存在物的系统描述”,但在计算机与信息科学领域,本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”。本体提供一个共享词汇表,描述特定领域之中那些对象类型、概念及其属性和它们之间的相互关系。本体实际上就是对特定领域之中某些概念及其相互之间关系的形式化表达(formal representation)。
本体是一种特殊类型的术语集,具有结构化的特点,非常适合于在计算机系统之中使用。本体的目标是获取相关的领域知识,确定目标领域内共同认可的词汇(术语),并从不同层次上明确的给出这些领域词汇之间相互关系的形式化定义。使用本体可以为特定领域提供形式化的描述,包括形式化的知识表示、明确的领域词汇和语义。本体形式化的好处就是可以提供机器可处理的语义描述,增加了人机之间和机器之间的可交流性,进而支持本体推理发现隐性领域知识,为用户提供增值的信息服务。
近年国内外,在科学数据共享、智能化信息检索、数字图书馆、知识工程和人工智能、信息系统集成、计算机辅助设计等诸多领域都得到了广泛应用,也掀起了本体应用的研究热潮。基于本体的数据语义集成方面的研究已取得大量的成果,利用本体技术解决数据源之间的语义异构问题也已成为异构集成普遍采用的方法。
但是,目前针对材料科学领域数据的本体语义集成尚有待研究扩展,因为基于本体的材料领域数据语义集成需要解决以下多个方面的问题:(1)具有大量的数据密集型应用,需要海量材料科学数据的支持;(2)材料科学数据异构、分布、结构杂乱、关联复杂;(3)材料数据源间的语义互操作复杂,异构数据模式结构复杂多变,存取效率有待提升;(4)科学家需要从多个自治系统中获得所需的材料科学数据,并人工将其所需服务提炼出来,耗时费力。
发明内容
本发明目的在于提供一种基于本体构建材料科学领域语义数据模型的方法,用于解决目前尚无针对材料科学领域数据的本体语义集成建模方法的问题。
为解决上述技术问题,本发明提供的基于本体构建材料科学领域语义数据模型的方法包括以下步骤:设计一种基于本体的材料科学领域语义数据模型,建立数据模式与本体之间的映射规则;基于所述语义数据模型,针对结构化数据、半结构化数据及非结构化数据进行基于本体的数据语义分析与标注,并构建领域数据的语义可视化模型,支持材料科学领域海量异构数据的语义集成与高效检索;基于OWL-S(Ontology Web Language for Services,web服务的本体语言)技术对相关数据服务进行描述、发布与获取,支持更高层次的材料科学领域服务语义协同。
本发明提供的首先基于数据建模定义将各类结构化、半结构化、非结构化数据进行语义包装,根据映射规则库构建语义模型,从而形成领域数据本体,构建材料科学领域知识库;而后基于查询构造器、查询处理器及推理引擎构建材料科学领域数据语义查询工具,形成基于本体的查询接口,支持可视化语义检索,为上层应用需求提供高效的数据语义查询、互操作等相关服务,并基于OWL-S与本体技术进行服务语义的描述、发布、获取,构建更为智能化的服务语义协同,提供更为深层、个性、灵活的材料领域知识服务。
其中,语义数据模型构建部分需满足并实现五方面的目标:(1)保术语的一致性,该语义模型可以在该领域内重用;(2)该语义模型必须是形式化的,可以被计算机理解和操纵的;(3)该语义模型能够在一定程度上支持语义推理,可以获取隐含的知识信息;(4)充分表示材料数据之间存在的关联关系;(5)在一定程度上表达数据的来源信息。
据此,可采用适当的语义模型构建方法来构建材料科学领域语义数据模型SMM,并通过增加适当的语义映射规则,构筑领域本体知识库,完成数据语义建模,为海量异构数据的语义集成、高效查询、服务组合等提供支持。
在本发明一个优选实施方式中,材料数据的语义集成部分主要包括如下四个方面的内容:结构化材料数据(关系数据库)的语义集成;半结构化材料数据(MatML)的语义集成;非结构化材料数据(Image等)的语义标注;面向多语境环境下的数据检索及语义可视化。
进一步地,结构化数据(关系数据库)的语义集成部分,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210151430.4/2.html,转载请声明来源钻瓜专利网。