[发明专利]多数据源的关系追踪方法、装置、电子设备及存储介质在审
申请号: | 202210248962.3 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114676158A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 王昱立 | 申请(专利权)人: | 深圳市翼海云峰科技有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 张璐 |
地址: | 518000 广东省深圳市福田区福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多数 关系 追踪 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种多数据源的关系追踪方法、装置、电子设备及存储介质,多数据源包括第一数据源和至少一个第二数据源,其方法包括:获取所述第一数据源中的待追踪数据,并对所述待追踪数据进行关键词提取,获得至少一个关键词;基于所述至少一个关键词从所述至少一个第二数据源中获取与所述待追踪数据对应的至少一个匹配数据;基于所述待追踪数据和所述至少一个匹配数据构建所述至少一个关键词的追踪矩阵;基于所述追踪矩阵和所述至少一个关键词确定所述第一数据源和所述至少一个第二数据源之间的追踪关系。本发明通过获得追踪关系,可提高数据查询效率和准确度。
技术领域
本发明涉及多数据源追踪技术领域,具体涉及一种多数据源的关系追踪方法、装置、电子设备及存储介质。
背景技术
数据源简单说就是数据的来源,是指数据库应用程序所使用的数据库或者数据库服务器,是提供某种所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。就像通过指定文件名称可以在文件系统中找到文件一样,通过提供正确的数据源名称,就可以找到相应的数据库连接。
在日常工作中,用户经常需要查询业务相关的数据信息,而查询的数据结果往往需要通过查询来自不同数据源的数据才能获知。例如:用户要查询某超市华东地区的产品总销售额,那么就要首先查询不同分区、不同产品的销售量数据和价格数据,而销售量数据和价格数据分别来自不同的数据源,用户需要分别查询两个数据源的数据信息。
现有的查询方式存在以下技术问题:当需要查询的数据量特别大的时候,查询效率特别低,而且容易出错。
发明内容
有鉴于此,有必要提供一种多数据源的关系追踪方法、装置、电子设备及存储介质,用以解决现有技术中存在的查询多数据源时查询效率低、且易出错的技术问题。
一方面,本发明提供了一种多数据源的关系追踪方法,多数据源包括第一数据源和至少一个第二数据源,所述多数据源的关系追踪方法包括:
获取所述第一数据源中的待追踪数据,并对所述待追踪数据进行关键词提取,获得至少一个关键词;
基于所述至少一个关键词从所述至少一个第二数据源中获取与所述待追踪数据对应的至少一个匹配数据;
基于所述待追踪数据和所述至少一个匹配数据构建所述至少一个关键词的追踪矩阵;
基于所述追踪矩阵和所述至少一个关键词确定所述第一数据源和所述至少一个第二数据源之间的追踪关系。
在一些可能的实现方式中,所述基于所述待追踪数据和所述至少一个匹配数据构建所述至少一个关键词的追踪矩阵,包括:
确定所述待追踪数据和所述至少一个匹配数据的相关系数、关联强度以及时间关联度;
根据所述相关系数、所述关联强度以及所述时间关联度构建所述至少一个关键词的追踪矩阵。
在一些可能的实现方式中,所述确定所述待追踪数据和所述至少一个匹配数据的相关系数,包括:
确定所述待追踪数据的第一数据类型和所述至少一个匹配数据的第二数据类型;
根据所述第一数据类型和所述第二数据类型确定相关系数计算模型;
基于所述相关系数计算模型确定所述待追踪数据和所述至少一个匹配数据的相关系数。
在一些可能的实现方式中,所述根据所述第一数据类型和所述第二数据类型确定相关系数计算模型,包括:
判断所述第一数据类型和所述第二数据类型是否相同;
当所述第一数据类型和所述第二数据类型相同时,根据所述第一数据类型或所述第二数据类型确定相关系数计算模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市翼海云峰科技有限公司,未经深圳市翼海云峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210248962.3/2.html,转载请声明来源钻瓜专利网。