[发明专利]数据血统分析方法与装置有效

专利信息
申请号: 201310385157.6 申请日: 2013-08-30
公开(公告)号: CN104424269B 公开(公告)日: 2018-01-30
发明(设计)人: 陈翀;陈康;向勇;张青;吴旭;刘春;高智衡;陶彩霞;关迎辉 申请(专利权)人: 中国电信股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国国际贸易促进委员会专利商标事务所11038 代理人: 曹蓓
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 血统 分析 方法 装置
【权利要求书】:

1.一种数据血统分析方法,其特征在于,包括:

基于模式配置对查询语句进行分析,以识别其中的目标表、目标字段、源表与源字段;

获取各类数据库系统定义的或用户自定义的元数据,并利用所述元数据对所述查询语句的模糊字段进行精确匹配;

根据识别出的目标字段与源字段的字段追溯顺序生成查询语句的数据血统关系;

通过多层语句解析分析出多条查询语句之间的数据血统关系。

2.根据权利要求1所述的数据血统分析方法,其特征在于,所述模式配置中包括关键字语句模式、关键字集、运算符集和函数模式。

3.根据权利要求2所述的数据血统分析方法,其特征在于,基于模式配置对查询语句进行分析的步骤包括:

利用所述模式配置中的关键字语句模式识别与提取查询语句中的关键字语句,并识别提取出的关键字语句中包含的目标表、目标字段、源表与源字段;

利用所述模式配置中的函数模式识别所述查询语句中包含的函数结构,并根据所述函数模式提取函数结构中的目标字段;

根据所述模式配置中的关键字集过滤所述查询语句中与数据血统关系无关的关键字;

利用所述模式配置中的运算符集识别目标数据与常量集,并得出目标字段与常量集之间的关系。

4.根据权利要求1所述的数据血统分析方法,其特征在于,利用所述元数据对所述查询语句的模糊字段进行精确匹配的步骤包括:

从所述元数据中获取数据表包含的字段信息与字段顺序。

5.根据权利要求4所述的数据血统分析方法,其特征在于,根据识别出的目标字段与源字段的字段追溯顺序生成查询语句的数据血统关系的步骤包括:

按照所述字段顺序对所述查询语句的目标字段和源字段进行匹配;

对于所述查询语句中的嵌套语句,通过递归追溯原始字段以生成查询语句的数据血统关系。

6.根据权利要求1所述的数据血统分析方法,其特征在于,所述通过多层语句解析分析出多条查询语句之间的数据血统关系的步骤包括:

根据单一语句的源表、源字段与目标表、目标字段之间的关系在多条查询语句间进行比对和分析;

根据源表、源字段与目标表、目标字段的关系设置各查询语句的层级并形成各查询语句之间的数据血统关系。

7.一种数据血统分析装置,其特征在于,包括:

模式适配单元,用于基于模式配置对查询语句进行分析,以识别其中的目标表、目标字段、源表与源字段;

模糊字段匹配单元,用于获取各类数据库系统定义的或用户自定义的元数据,并利用所述元数据对所述查询语句的模糊字段进行精确匹配;

字段追溯单元,用于根据识别出的目标字段与源字段的字段追溯顺序生成查询语句的数据血统关系;

血统关系形成单元,用于通过多层语句解析分析出多条查询语句之间的数据血统关系。

8.根据权利要求7所述的数据血统分析装置,其特征在于,所述模式配置中包括关键字语句模式、关键字集、运算符集和函数模式。

9.根据权利要求8所述的数据血统分析装置,其特征在于,所述模式适配单元包括:

关键字模式识别子单元,用于利用所述模式配置中的关键字语句模式识别与提取查询语句中的关键字语句,并识别提取出的关键字语句中包含的目标表、目标字段、源表与源字段;

函数模式识别子单元,用于利用所述模式配置中的函数模式识别查询语句中包含的函数结构,并根据所述函数模式提取函数结构中的目标字段;

关键字滤除子单元,用于根据所述模式配置中的关键字集过滤所述查询语句中与数据血统关系无关的关键字;

常量识别子单元,用于利用所述模式配置中的运算符集识别目标数据与常量集,并得出目标字段与常量集之间的关系。

10.根据权利要求7所述的数据血统分析装置,其特征在于,所述模糊字段匹配单元从所述元数据中获取数据表包含的字段信息与字段顺序。

11.根据权利要求10所述的数据血统分析装置,其特征在于,所述字段追溯单元包括:

字段匹配子单元,用于按照所述字段顺序对所述查询语句的目标字段和源字段进行匹配;

递归追溯子单元,对于所述查询语句中的嵌套语句,用于通过递归追溯原始字段以生成查询语句的数据血统关系。

12.根据权利要求7所述的数据血统分析装置,其特征在于,所述血统关系形成单元包括:

根据单一语句的源表、源字段与目标表、目标字段之间的关系在多条查询语句间进行比对和分析;

根据源表、源字段与目标表、目标字段的关系设置各查询语句的层级并形成各查询语句之间的数据血统关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310385157.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top