[发明专利]数据处理方法、装置和电子设备在审

专利信息
申请号: 202210254422.6 申请日: 2022-03-15
公开(公告)号: CN114528313A 公开(公告)日: 2022-05-24
发明(设计)人: 孙成虎 申请(专利权)人: 北京金山云网络技术有限公司
主分类号: G06F16/242 分类号: G06F16/242;G06F16/2453;G06F16/248
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 舒淼
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理 方法 装置 电子设备
【说明书】:

发明提供了一种数据处理方法、装置和电子设备。其中,该方法应用于元数据搜索引擎,该方法包括:响应血缘关系查询操作,确定血缘关系查询操作对应的目标数据表;基于目标数据表的建表语句或者目标数据表对应的血缘表,确定目标数据表的血缘关系。该方式中,可以基于建表语句或血缘表查询目标数据表的血缘关系,相比于常见的自动解析方法和系统追踪方法,该方式无需解析SQL语句,解析血缘关系的方式较为简单,可以降低获取数据血缘关系的成本,可以获取所有数据的血缘关系,提高数据的覆盖率,还没有信息泄露的风险。

技术领域

本发明涉及数据处理的技术领域,尤其是涉及一种数据处理方法、装置和电子设备。

背景技术

数据从产生、加工融合、流转流通到最终消亡,在数据之间自然会形成一种关系。可以借鉴人类社会中类似的一种关系来表达数据之间的这种关系,称之为数据的血缘关系。数据的血缘关系是元数据的组成部分之一。通过数据的血缘关系可以分析表和字段从数据源到当前表的血缘路径,以及血缘字段之间存在的关系是否满足,可以评判数据的一致性以及表设计的合理性,可以用于分析上游数据发生变化给下游数据带来的影响,在下游数据发生变化时可以追踪上游问题的源头,帮助我们更好地去理解数据。

一般来说,可以通过自动解析或系统追踪的方式去获取数据的血缘关系。其中,自动解析方法是当前获取数据的血缘关系的主要方法,其具体做法就是解析数据的SQL(Structured Query Language,结构化查询语言)语句、存储过程、ETL(Extract-Transform-Load,抽取、转换、加载)过程等文件,以确定数据的血缘关系。系统跟踪方法是通过数据加工流动过程中,由数据处理程序负责发送数据血缘信息,例如:在数据的注解部分增加对血缘的描述等。

然而,对于自动解析方法,由于数据的复杂代码和应用环境等原因,根据国际厂商的经验,自动解析方法可以仅覆盖到企业数据的70-95%,目前无法做到100%,数据的覆盖不够全面。对于系统跟踪方法,由于调度引擎的种类比较多,导致分析成本交过。获取SQL执行日志比较困难,就算获取到SQL执行日志,也需要长时间追踪和分析,还可能带来数据安全的问题,并且也只能覆盖一部分数据。

发明内容

有鉴于此,本发明的目的在于提供一种数据处理方法、装置和电子设备,以降低获取数据血缘关系的成本,提高数据的覆盖率。

第一方面,本发明实施例提供了一种数据处理方法,应用于元数据搜索引擎,方法包括:响应血缘关系查询操作,确定血缘关系查询操作对应的目标数据表;基于目标数据表的建表语句或者目标数据表对应的血缘表,确定目标数据表的血缘关系。

在本发明较佳的实施例中,上述方法还包括:在创建目标数据表的过程中确定目标数据表的血缘关系;将目标数据表的血缘关系写入目标数据表的建表语句中;或者,将目标数据表的血缘关系写入目标数据表对应的血缘表中。

在本发明较佳的实施例中,上述将目标数据表的血缘关系写入目标数据表的建表语句中的步骤,包括:将目标数据表的血缘关系写入目标数据表中的指定字段内。

在本发明较佳的实施例中,上述基于目标数据表的建表语句或者目标数据表对应的血缘表,确定目标数据表的血缘关系的步骤,包括:解析目标数据表中的指定字段,确定目标数据表的血缘关系。

在本发明较佳的实施例中,上述目标数据表设置于数据库中,数据库包括多个数据表和一个血缘表;上述将目标数据表的血缘关系写入目标数据表对应的血缘表中的步骤,包括:将目标数据表的血缘关系写入数据库的血缘表中,以使血缘表记录数据库中的各个数据表的血缘关系。

在本发明较佳的实施例中,上述基于目标数据表的建表语句或者目标数据表对应的血缘表,确定目标数据表的血缘关系的步骤,包括:从数据库的血缘表中查找目标数据表的血缘关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210254422.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top