[发明专利]表间关系获得方法及装置有效
申请号: | 201811585302.4 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109656928B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 曾文龙;张艳;徐祥 | 申请(专利权)人: | 成都四方伟业软件股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 范彦扬 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关系 获得 方法 装置 | ||
本发明提供的表间关系获得方法及装置,方法包括:获得数据库的类型并基于该类型获得该数据库对应的系统表,根据系统表中的表外键得到存在表间关系的普通表,并基于该存在表间关系的普通表得到数据库的物理主外键拓扑。获得数据库中各普通表的字段信息,并基于各字段信息得到各普通表之间的字段相关系数拓扑,获得数据库中各普通表的列数据,并基于各列数据得到各普通表之间的表间数据相关系数拓扑,根据物理主外键拓扑、字段相关系数拓扑以及表间数据相关系数拓扑得到数据库的全库表间关系关联拓扑。通过上述方法,以便于针对不同类型的数据库建立数据库中的普通表之间的关联,无需依赖用户的行为且无需消耗过多的资源。
技术领域
本发明涉及表间关联技术领域,具体而言,涉及一种表间关系获得方法及装置。
背景技术
随着大数据时代的发展,数据库的类型越来越多,数据关系灵活程度也越来越高,数据表之间的关联已经不局限于物理上的主外键关联,还有逻辑意义上的关系。因此,对于分析表间关系的工作提出了更高的要求。传统的表关联分析技术主要分为两大类,第一类是采用关系型数据库主外键关系获取技术,通过分析数据系统表可以获得表间主外键关联数据。第二类是采用数据库日志分析技术,通过分析数据的存取过程日志,可以分析客户常用表的关联关系。
发明人经研究发现,第一类采用关系型数据库进行表关联时不具备普适性,只适用于具有主外键关系的关系型数据库;第二类采用数据库日志分析技术需要长期开启数据库详细记录对于数据库有极大资源,且只分析日志过于依赖客户行为,因此,提供一种普适性强且对数据库资源较小的表关联方式是亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种表间关系获得方法及装置,以有效解决上述技术问题。
为实现上述目的,本发明实施例采用如下技术方案:
本发明提供一种表间关系获得方法,所述方法包括:
获得数据库的类型并基于所述数据库的类型获得该数据库对应的系统表,其中,所述数据库中存储有多张普通表,所述系统表中包括各普通表的表外键;
根据所述表外键得到存在表间关系的普通表,并基于该存在表间关系的普通表得到所述数据库的物理主外键拓扑;
获得所述数据库中各普通表的字段信息,并基于各所述字段信息得到各所述普通表之间的字段相关系数拓扑;
获得所述数据库中各普通表的列数据,并基于各所述列数据得到各所述普通表之间的表间数据相关系数拓扑;
根据所述物理主外键拓扑、字段相关系数拓扑以及表间数据相关系数拓扑得到所述数据库的全库表间关系关联拓扑。
可选的,在上述表间关系获得方法中,获得数据库的类型并基于所述数据库的类型获得该数据库对应的系统表的步骤包括:
获取数据库中存储的普通表的地址信息,并基于该地址信息得到所述数据库的类型;
根据所述数据库的类型获得所述数据库的系统表。
可选的,在上述表间关系获得方法中,获得所述数据库中各普通表的字段信息,并基于各所述字段信息得到各所述普通表之间的字段相关系数拓扑的步骤包括:
获得所述数据库中各普通表的字段信息,并对各所述字段信息采用相似度算法进行计算得到各所述普通表之间的字段相关系数;
根据所述字段相关系数得到各所述普通表之间的字段相关系数拓扑。
可选的,在上述表间关系获得方法中,获得所述数据库中各普通表的列数据,并基于各所述列数据得到各所述普通表之间的表间数据相关系数拓扑的步骤包括:
获得所述数据库中各普通表的列数据,并从该列数据中获得样本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811585302.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据表预警方法及装置
- 下一篇:一种雕复关系型数据库文件的方法及装置