[发明专利]基于数据起源依赖关系分析模型的数据依赖分析方法在审
申请号: | 201410082707.1 | 申请日: | 2014-03-07 |
公开(公告)号: | CN103823885A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 许国艳;王志坚;杨莉 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 起源 依赖 关系 分析 模型 方法 | ||
技术领域
本发明涉及数据管理技术领域,更具体的讲,涉及到数据起源、工作流、依赖关系、语义等技术领域,提出了一种基于数据起源依赖关系分析模型的数据依赖分析方法,具体完成数据起源依赖关系和数据起源依赖关系分析模型定义,利用细化操作和合成操作分析依赖关系。
背景技术
数据起源(Data Provenance,Data Lineage,Data Pedigree,Data Derivation)又称为数据血统、数据血缘、数据世系、数据谱系、数据来源等。数据起源是对数据处理的整个历史信息,包括数据的来源和处理这些数据的所有后继过程(数据产生、并随着时间推移而演变的整个过程)。
数据起源依赖关系实质上就是数据起源的语义信息。在抽象级别上,数据起源是一种依赖关系,描述数据产品是如何得到的,相关的数据和过程的作用是什么,角色是什么。依赖关系的研究需要很强的语义基础支撑,所以,数据起源信息需要清晰的形式化描述,定义追踪操作的语义,增强数据起源依赖分析和推理能力。
目前,数据起源依赖关系分析的主流模型之一为OPM(The Open Provenance Model),OPM是社区驱动的数据起源模型,支持起源技术的互操作。OPM基于有向无环图,表示数据产品和计算中关联的过程,以及他们之间的因果依赖关系。
本发明基于标注的数据起源语义信息,对OPM进行细化,提出一种基于数据起源依赖关系分析模型的数据依赖分析方法,主要建立数据起源依赖关系分析模型,利用交、并、细化以及合成操作,进一步分析依赖关系,并且设计了一套规则,给出了数据依赖图的构造、细化以及合成算法,满足不同用户对于不同抽象层次数据起源信息查询的需求。
发明内容
发明目的:为了解决数据起源依赖关系分析的问题,本发明的目的在于提出一种供数据依赖分析的方法,给出数据起源依赖关系以及数据起源依赖关系分析模型,基于该模型,设计了一种数据依赖分析的方法,具体包括一系列规则的设计,以及数据依赖图构造、细化及合成算法的构建,从而满足不同抽象级别、不同信息类别的数据起源信息需求。
技术方案:一种基于数据起源依赖关系分析模型的数据依赖分析方法,包括如下内容:
数据起源依赖关系概念:
数据起源依赖关系在本质上是数据起源的语义信息,可以分为数据依赖关系、过程依赖关系和控制依赖关系。本发明参照OPM,给出数据起源依赖关系定义及其性质。
定义1数据起源依赖关系定义为一个5元组DP_Dependency=(Data_Set,Process_Set,Data_Data_Dependency,Data_Process_Dependency,Process_Data_Dependency,Process_Process_Dependency),其中
■Data_Set是数据的集合;
■Process_Set是过程的集合;
■Data_Data_Dependency:Data_Set→Data_Set,是数据到数据的映射关系,称为数据依赖关系;
■Data_Process_Dependency:Data_Set→Process_Set,是数据到过程的映射关系,称为过程对数据依赖关系,即过程依赖于数据,数据是过程的输入;
■Process_Data_Dependency:Process_Set→Data_Set,是过程到数据的映射关系,称为数据对过程依赖关系,即数据依赖于过程,数据是过程的输出;
■Process_Process_Dependency:Process_Set→Process_Set,是过程到过程的映射关系,称为过程依赖关系;
■过程对数据依赖关系和数据对过程依赖关系统称为控制依赖关系。
定理1数据依赖关系具有传递性
如果D1,D2,D3∈Data_Set,满足D2:Data_Data_Dependency(D1),D3:Data_Data_Dependency(D2),则D3:Data_Data_Dependency(D1)成立,数据依赖关系满足传递性。
定理2控制依赖关系具有传递性
如果D1,D2∈Data_Set,P1,P2∈Process_Set,满足下列情况之一的,控制依赖关系满足传递性:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410082707.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置