[发明专利]一种数据库元数据关系知识图谱生成方法在审
申请号: | 202210508938.9 | 申请日: | 2022-05-10 |
公开(公告)号: | CN115203337A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 林劼;李赛鹏;姜铼;王元芳;肖新宇;白毅 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/907;G06N5/02;G06N5/04 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 郭肖凌 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 数据 关系 知识 图谱 生成 方法 | ||
1.一种数据库元数据关系知识图谱生成方法,其特征在于,包括以下步骤:
步骤1:基于数据库的历史SQL查询语句形成历史查询元数据知识图谱;
步骤2:基于数据列之间的值完全匹配形成数据关联元数据知识图谱;
步骤3:基于数据库的模式信息形成数据库模式元数据知识图谱;
步骤4:基于步骤1、2和3获得的三个知识图谱,将各个知识图谱中相同实体组成的三元组关系进行对齐,汇总成完整的数据库元数据关系知识图谱;
步骤5:使用基于表示的知识推理模型对步骤4获得的完整知识图谱进行推理,对图谱中的关系进行补全,进一步完善数据库元数据关系知识图谱。
2.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述数据库的模式信息为表和列的定义信息。
3. 根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤1具体为:基于数据库的历史SQL查询语句,对形式为select … from Ta join Tb onTa.Cx= Tb.Cy以及select … from Ta, Tb where Ta. Cx =Tb. Cy的查询语句,构建表间历史查询关系三元组(Ta,history_table_match,Tb)以及列间历史查询关系三元组(Ta. Cx,history_column_match,Tb. Cy),形成历史查询元数据知识图谱。
4. 根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤2具体为:
基于数据列之间的值完全匹配,对于每一个数据列Ta. Cx,将其与数据库中其他表的所有列Tb. Cy填充入如下的SQL模板中进行查询,select count(*) from Ta,Tb where Ta. Cx=Tb. Cy
当查询结果超过阈值时,则构建形式为(Ta. Cx,column_value_match,Tb. Cy)的三元组,形成数据关联元数据知识图谱。
5.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤3具体为:于数据库的模式信息,定义表和列之间的关系,形成数据库模式元数据知识图谱。
6.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述所述步骤4包含以下子步骤:
步骤401:对于历史查询元数据知识图谱的三元组,若两个列实体之间存在历史匹配关系Rh,则以Rh替换数据关联图谱、数据库模式图谱中这两个列实体的三元组的关系;
步骤402:对于历史查询元数据知识图谱的三元组,若两个表实体存在历史查询关系Re,则以Re替换数据库模式图谱中这两个表实体的三元组的关系;
步骤403:对于数据关联性图谱中的三元组,若两个列实体间存在数据关联关系Rv,同时在历史查询图谱中这两个列实体间没有关系,则以Rv替换数据库模式图谱中这两个列实体之间的关系;
步骤404:将按照步骤401、402和403对齐后的三个知识图谱,汇总形成完整的数据库元数据关系知识图谱。
7.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤5包括以下子步骤:
步骤501:对完整的数据库元数据关系知识图谱中的三元组按照9:1的比例分为训练集和测试集,用训练集数据训练一个基于表示的知识推理模型TransE,并用测试集验证训练效果以决定何时停止训练;
步骤502:使用训练好的TransE对完整的数据库元数据关系知识图谱进行知识推理,对图谱中的关系进行补全,形成更为完善的数据库元数据关系知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210508938.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置