[发明专利]基于数据起源依赖关系分析模型的数据依赖分析方法在审

专利信息
申请号: 201410082707.1 申请日: 2014-03-07
公开(公告)号: CN103823885A 公开(公告)日: 2014-05-28
发明(设计)人: 许国艳;王志坚;杨莉 申请(专利权)人: 河海大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 李玉平
地址: 211100 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 起源 依赖 关系 分析 模型 方法
【说明书】:

技术领域

发明涉及数据管理技术领域,更具体的讲,涉及到数据起源、工作流、依赖关系、语义等技术领域,提出了一种基于数据起源依赖关系分析模型的数据依赖分析方法,具体完成数据起源依赖关系和数据起源依赖关系分析模型定义,利用细化操作和合成操作分析依赖关系。

背景技术

数据起源(Data Provenance,Data Lineage,Data Pedigree,Data Derivation)又称为数据血统、数据血缘、数据世系、数据谱系、数据来源等。数据起源是对数据处理的整个历史信息,包括数据的来源和处理这些数据的所有后继过程(数据产生、并随着时间推移而演变的整个过程)。

数据起源依赖关系实质上就是数据起源的语义信息。在抽象级别上,数据起源是一种依赖关系,描述数据产品是如何得到的,相关的数据和过程的作用是什么,角色是什么。依赖关系的研究需要很强的语义基础支撑,所以,数据起源信息需要清晰的形式化描述,定义追踪操作的语义,增强数据起源依赖分析和推理能力。

目前,数据起源依赖关系分析的主流模型之一为OPM(The Open Provenance Model),OPM是社区驱动的数据起源模型,支持起源技术的互操作。OPM基于有向无环图,表示数据产品和计算中关联的过程,以及他们之间的因果依赖关系。

本发明基于标注的数据起源语义信息,对OPM进行细化,提出一种基于数据起源依赖关系分析模型的数据依赖分析方法,主要建立数据起源依赖关系分析模型,利用交、并、细化以及合成操作,进一步分析依赖关系,并且设计了一套规则,给出了数据依赖图的构造、细化以及合成算法,满足不同用户对于不同抽象层次数据起源信息查询的需求。

发明内容

发明目的:为了解决数据起源依赖关系分析的问题,本发明的目的在于提出一种供数据依赖分析的方法,给出数据起源依赖关系以及数据起源依赖关系分析模型,基于该模型,设计了一种数据依赖分析的方法,具体包括一系列规则的设计,以及数据依赖图构造、细化及合成算法的构建,从而满足不同抽象级别、不同信息类别的数据起源信息需求。

技术方案:一种基于数据起源依赖关系分析模型的数据依赖分析方法,包括如下内容:

数据起源依赖关系概念:

数据起源依赖关系在本质上是数据起源的语义信息,可以分为数据依赖关系、过程依赖关系和控制依赖关系。本发明参照OPM,给出数据起源依赖关系定义及其性质。

定义1数据起源依赖关系定义为一个5元组DP_Dependency=(Data_Set,Process_Set,Data_Data_Dependency,Data_Process_Dependency,Process_Data_Dependency,Process_Process_Dependency),其中

■Data_Set是数据的集合;

■Process_Set是过程的集合;

■Data_Data_Dependency:Data_Set→Data_Set,是数据到数据的映射关系,称为数据依赖关系;

■Data_Process_Dependency:Data_Set→Process_Set,是数据到过程的映射关系,称为过程对数据依赖关系,即过程依赖于数据,数据是过程的输入;

■Process_Data_Dependency:Process_Set→Data_Set,是过程到数据的映射关系,称为数据对过程依赖关系,即数据依赖于过程,数据是过程的输出;

■Process_Process_Dependency:Process_Set→Process_Set,是过程到过程的映射关系,称为过程依赖关系;

■过程对数据依赖关系和数据对过程依赖关系统称为控制依赖关系。

定理1数据依赖关系具有传递性

如果D1,D2,D3∈Data_Set,满足D2:Data_Data_Dependency(D1),D3:Data_Data_Dependency(D2),则D3:Data_Data_Dependency(D1)成立,数据依赖关系满足传递性。

定理2控制依赖关系具有传递性

如果D1,D2∈Data_Set,P1,P2∈Process_Set,满足下列情况之一的,控制依赖关系满足传递性:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410082707.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top