[发明专利]数据表主键关联方法、装置、计算机设备及可读存储介质有效
申请号: | 202111023802.0 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113468186B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 姚佳;蒋静文;刘忠禹;张伟 | 申请(专利权)人: | 四川大学华西医院 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 610044 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据表 主键 关联 方法 装置 计算机 设备 可读 存储 介质 | ||
本发明实施例公开了数据表主键关联方法、装置、计算机设备及可读存储介质,通过根据各数据表内的基础节点的节点数据,确定各基础节点与其它数据表的全部节点之间的关联网络,所述基础节点包括数据表内的字段,所述节点数据包括字段名和所属的数据表名,根据所述关联网络及预设规则,将每个基础节点的关联节点的节点数据存储在对应的基础节点的数据字典中,遍历所有基础节点,将多个基础节点的数据字典中共同存储的关联节点作为主键节点,查找各主键节点的距离最近的关联节点,根据全部主键节点及距离最近的关联节点,得到全部数据表对应的主键关联关系。从而能够通过计算机自动扫描数据表中字段的方式,快速、准确建立数据表主键之间的关联关系。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据表主键关联方法、装置、计算机设备及可读存储介质。
背景技术
在大量医疗体系系统中,常常出现系统交接人无法联系、系统文档缺失等问题,这是由于数据表之间的关联字段,也即数据表主键存在不清晰的情况。具体体现在,字段名混用,相同字段名滥用以及数据杂糅复杂,同一系统存在链式的关联字段等问题,而往往数据表的主键梳理工作,需要耗费大量的人工操作,耗时耗力。
因此,亟需一种能够快速、精确挖掘出数据表的主键,并关联数据表主键之间关系的方法。
发明内容
为了解决上述技术问题,本公开实施例提供了一种数据表主键关联方法、装置、计算机设备及可读存储介质,具体方案如下:
第一方面,本公开实施例提供了一种数据表主键关联方法,所述方法包括:
根据各数据表内的基础节点的节点数据,确定各基础节点与其它数据表的全部节点之间的关联网络,其中,所述基础节点包括数据表内的字段,所述节点数据包括字段名和所属的数据表名;
根据所述关联网络及预设规则,将每个基础节点的关联节点的节点数据存储在对应的基础节点的数据字典中;
遍历所有基础节点,将多个基础节点的数据字典中共同存储的关联节点作为主键节点;
查找各主键节点的距离最近的关联节点,根据全部主键节点及距离最近的关联节点,得到全部数据表对应的主键关联关系。
根据本公开实施例的一种具体实施方式,所述确定各基础节点与其它数据表的全部节点之间的关联网络步骤,包括:
计算各基础节点与其它数据表的全部节点的关联分数;
根据所述关联分数生成不同数据表基础节点之间的关联网络;
所述根据所述关联网络及预设规则,将每个基础节点的关联节点的节点数据存储在对应的基础节点的数据字典中的步骤,包括:
根据所述关联网络、所述基础节点与多个关联节点之间的关联分数及预设规则,将每个基础节点的目标关联节点的节点数据存储在对应的基础节点的数据字典中。
根据本公开实施例的一种具体实施方式,所述根据所述关联分数生成不同数据表基础节点之间的关联网络的步骤,包括:
比较两两基础节点的关联分数是否大于或等于关联分数阈值;
若所述两两基础节点的关联分数大于或等于所述关联分数阈值,则保留所述两两基础节点之间的关联关系;
若所述两两基础节点的关联分数小于所述关联分数阈值,则删除所述两两基础节点之间的关联关系;
根据全部保留的两两节点之间的关联关系,生成不同数据表基础节点之间的关联网络。
根据本公开实施例的一种具体实施方式,所述计算各基础节点与其它数据表的全部节点的关联分数的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学华西医院,未经四川大学华西医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111023802.0/2.html,转载请声明来源钻瓜专利网。