[发明专利]元数据处理方法及装置、设备、可读存储介质有效
申请号: | 201910023646.4 | 申请日: | 2019-01-10 |
公开(公告)号: | CN109766345B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 兰冲;邱毅;汪亚男;陈文浩;周可;司东华 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 可读 存储 介质 | ||
本发明提供一种元数据处理方法,包括以下步骤:获取目标数据表与不同关联数据表相互间的关联字段;根据关联字段,获取目标数据表与不同关联数据表相互间的关联信息,并构建目标数据表的关联信息集合;获取目标数据表的加工任务信息;根据加工任务信息,确定目标数据表与不同数据表相互间的上下游关系,并基于上下游关系确定目标数据表的上游数据表与下游数据表;其中,目标数据表继承上游数据表的关联信息,下游数据表继承目标数据表的关联信息集合。本发明还提供了一种元数据处理装置、设备、可读存储介质。本发明解决了现有数据库方案中元数据业务含义有限,导致难以有效地参与到数据库的具体应用的技术问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种元数据处理方法及装置、设备、可读存储介质。
背景技术
在数据库技术领域中,元数据是用于描述数据的相关数据。现有的数据库方案中,一般只抓取少量元数据,如仅获取数据库中系统表的表结构信息。这些信息只是开发人员在设计表结构时填入的,业务含义非常有限;现有方案也支持手工维护元数据的业务含义,但手工维护的元数据的业务含义往往是滞后的、不完整、不准确的。
此外,在进行检索时,现有数据库只是将检索结果呈现出来,并不会告知检索者,可以对这些结果采取何种进一步的应用;检索者必须借助其它系统,或者询问相关数据开发人员,来进一步达到使用数据的目的。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种元数据处理方法及装置、设备、可读存储介质,旨在解决现有数据库方案中元数据业务含义有限,导致难以有效地参与到数据库的具体应用的技术问题。
为实现上述目的,本发明提供一种元数据处理方法,所述方法包括以下步骤:
获取目标数据表与不同关联数据表相互间的关联字段;
根据所述关联字段,获取目标数据表与不同关联数据表相互间的关联信息,并构建目标数据表的关联信息集合;
获取目标数据表的加工任务信息;
根据所述加工任务信息,确定目标数据表与不同数据表相互间的上下游关系,并基于所述上下游关系确定目标数据表的上游数据表与下游数据表;其中,目标数据表继承所述上游数据表的关联信息,所述下游数据表继承目标数据表的所述关联信息集合。
优选地,所述获取目标数据表与不同关联数据表相互间的关联字段的步骤之前,还包括:预先判断不同数据表之间是否存在关联关系的步骤;
所述预先判断不同数据表之间是否存在关联关系的步骤,具体包括:
a1,从第一数据表的第一字段列表、第二数据表的第二字段列表分别选取第一字段、第二字段;
a2,分别从第一数据表、第二数据表中获取第一字段的值集合、第二字段的值集合;其中,第一字段的值集合与第二字段的值集合包含的值数量均等于预设数量值;
a3,判断第一字段的值集合与第二字段的值集合的相似度是否大于预设相似度阈值;
若是,则确定第一字段与第二字段存在关联关系,并确定第一数据表与第二数据表存在关联关系;重新执行步骤a1~a3,直至遍历第一字段列表的所有字段;
若否,则重新执行步骤a1~a3,直至遍历第一字段列表的所有字段。
优选地,所述根据所述关联字段,获取目标数据表与不同关联数据表相互间的关联信息,并构建目标数据表的关联信息集合的步骤,具体包括:
基于目标数据表与任一关联数据表相互间的关联字段,将目标数据表中记录关联字段的值与对应关联数据表的业务信息进行匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910023646.4/2.html,转载请声明来源钻瓜专利网。