[发明专利]一种数据血缘关系分析方法在审
申请号: | 202111087103.2 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113742368A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 吴江 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2458;G06F16/248 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 李滨 |
地址: | 100089*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 血缘关系 分析 方法 | ||
本申请公开了一种数据血缘关系分析方法,所述一种数据血缘关系分析方法包括如下步骤:(1)获取转换、从含有SQL代码的脚本文件中提取得到规则化的SQL语句,将所述SQL语句转换成抽象语法树;(2)句法解析、遍历抽象语法树对SQL语句进行句法解析;(3)解析策略、获取到所述抽象语法树解析策略,并根据句法分析和解析策略得出层级的节点;(4)迭代分析、以获得所述SQL语句对应的数据之间的血缘关系;(5)分析结果、根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果。通过该种方法能够以可视化的方式显示数据之间的依赖关系,方便后续业务的查询和开发管理,加强了对数据流动的监控,以可视化的方式理清了数据的源头与去向。
技术领域
本申请涉及数据处理技术领域,尤其是一种数据血缘关系分析方法。
背景技术
着数据爆炸时代的来临,数据对于个人和企业而言都成为了重要资产。在进行数据建设和管理时,数据从产生、加工和流转过程中会产生数据之间的血缘关系,当数据量不断增加后数据之间的血缘关系会更加复杂,当数据出现质量问题时,由于无法获取不同层级的数据之间的血缘关系。
现有对数据进行层层筛查,极大地增加了数据筛查的成本,有鉴于此,如何获取数据加工过程中数据之间的血缘关系,降低数据筛查的成本成为亟待解决的问题。因此,针对上述问题提出一种数据血缘关系分析方法。
发明内容
在本实施例中提供了一种数据血缘关系分析方法用于解决现有对数据进行层层筛查,极大地增加了数据筛查的成本,有鉴于此,如何获取数据加工过程中数据之间的血缘关系,降低数据筛查成本的问题。
根据本申请的一个方面,提供了一种数据血缘关系分析方法,所述数据血缘关系分析方法包括如下步骤;
(1)获取转换、从含有SQL代码的脚本文件中提取得到规则化的SQL语句,将所述SQL语句转换成抽象语法树;
(2)句法解析、遍历抽象语法树对SQL语句进行句法解析;
(3)解析策略、获取到所述抽象语法树解析策略,并根据句法分析和解析策略得出层级的节点;
(4)迭代分析、以获得所述SQL语句对应的数据之间的血缘关系;
(5)分析结果、根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果;
(6)制图显示、根据分析结果绘制SQL语句的数据血缘关系图。
进一步地,所述步骤(1)中将得到的SQL语句,并对SQL语句进行转换。
进一步地,所述步骤(1)中对规则化的SQL语句进行词法分析进而得到抽象语法树。
进一步地,所述步骤(2)中所述解析规则针对所述抽象语法树的不同层级的节点。
进一步地,所述步骤(2)中针对不同层级的节点将所述抽象语法树转换为逻辑指令。
进一步地,所述步骤(2)中对所得的逻辑指令进行迭代分析。
进一步地,所述步骤(3)中通过递归方法直到获取到层级最高的节点,并记录迭代过程中的数据之间的继承关系,进而将SQL语句对应的数据之间的血缘关系提取。
进一步地,所述步骤(3)中遍历所述抽象语法树的多个层级的节点。
进一步地,所述步骤(6)中根据所得到的SQL语句的数据血缘关系图进行可视化显示。
进一步地,所述步骤(6)中数据血缘是指数据产生的链路。
通过本申请上述实施例,通过该种数据血缘关系分析方法能够以可视化的方式显示数据之间的依赖关系,方便后续业务的查询和开发管理,加强了对数据流动的监控,以可视化的方式理清了数据的源头与去向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111087103.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置