[发明专利]一种数据库元数据关系知识图谱生成方法在审

专利信息
申请号: 202210508938.9 申请日: 2022-05-10
公开(公告)号: CN115203337A 公开(公告)日: 2022-10-18
发明(设计)人: 林劼;李赛鹏;姜铼;王元芳;肖新宇;白毅 申请(专利权)人: 电子科技大学
主分类号: G06F16/28 分类号: G06F16/28;G06F16/907;G06N5/02;G06N5/04
代理公司: 成都金英专利代理事务所(普通合伙) 51218 代理人: 郭肖凌
地址: 610041 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据库 数据 关系 知识 图谱 生成 方法
【权利要求书】:

1.一种数据库元数据关系知识图谱生成方法,其特征在于,包括以下步骤:

步骤1:基于数据库的历史SQL查询语句形成历史查询元数据知识图谱;

步骤2:基于数据列之间的值完全匹配形成数据关联元数据知识图谱;

步骤3:基于数据库的模式信息形成数据库模式元数据知识图谱;

步骤4:基于步骤1、2和3获得的三个知识图谱,将各个知识图谱中相同实体组成的三元组关系进行对齐,汇总成完整的数据库元数据关系知识图谱;

步骤5:使用基于表示的知识推理模型对步骤4获得的完整知识图谱进行推理,对图谱中的关系进行补全,进一步完善数据库元数据关系知识图谱。

2.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述数据库的模式信息为表和列的定义信息。

3. 根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤1具体为:基于数据库的历史SQL查询语句,对形式为select … from Ta join Tb onTa.Cx= Tb.Cy以及select … from Ta, Tb where Ta. Cx =Tb. Cy的查询语句,构建表间历史查询关系三元组(Ta,history_table_match,Tb)以及列间历史查询关系三元组(Ta. Cx,history_column_match,Tb. Cy),形成历史查询元数据知识图谱。

4. 根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤2具体为:

基于数据列之间的值完全匹配,对于每一个数据列Ta. Cx,将其与数据库中其他表的所有列Tb. Cy填充入如下的SQL模板中进行查询,select count(*) from Ta,Tb where Ta. Cx=Tb. Cy

当查询结果超过阈值时,则构建形式为(Ta. Cx,column_value_match,Tb. Cy)的三元组,形成数据关联元数据知识图谱。

5.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤3具体为:于数据库的模式信息,定义表和列之间的关系,形成数据库模式元数据知识图谱。

6.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述所述步骤4包含以下子步骤:

步骤401:对于历史查询元数据知识图谱的三元组,若两个列实体之间存在历史匹配关系Rh,则以Rh替换数据关联图谱、数据库模式图谱中这两个列实体的三元组的关系;

步骤402:对于历史查询元数据知识图谱的三元组,若两个表实体存在历史查询关系Re,则以Re替换数据库模式图谱中这两个表实体的三元组的关系;

步骤403:对于数据关联性图谱中的三元组,若两个列实体间存在数据关联关系Rv,同时在历史查询图谱中这两个列实体间没有关系,则以Rv替换数据库模式图谱中这两个列实体之间的关系;

步骤404:将按照步骤401、402和403对齐后的三个知识图谱,汇总形成完整的数据库元数据关系知识图谱。

7.根据权利要求1所述的一种数据库元数据关系知识图谱生成方法,其特征在于,所述步骤5包括以下子步骤:

步骤501:对完整的数据库元数据关系知识图谱中的三元组按照9:1的比例分为训练集和测试集,用训练集数据训练一个基于表示的知识推理模型TransE,并用测试集验证训练效果以决定何时停止训练;

步骤502:使用训练好的TransE对完整的数据库元数据关系知识图谱进行知识推理,对图谱中的关系进行补全,形成更为完善的数据库元数据关系知识图谱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210508938.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top