[发明专利]数据表处理方法、装置、介质及电子设备有效
申请号: | 201911087888.6 | 申请日: | 2019-11-08 |
公开(公告)号: | CN111125158B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 韩佩利;施小江;王方博;何旺 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/28 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;郑特强 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据表 处理 方法 装置 介质 电子设备 | ||
本发明实施例提供了一种数据表处理方法、数据表处理装置、计算机可读介质及电子设备,该方法包括:获取与源数据表相关的多个历史查询语句,并确定各个历史查询语句中的查询字段以及每个查询字段的查询次数信息;根据查询字段以及各个查询字段的查询次数信息确定多个字段关系矩阵;根据字段关系矩阵中相邻查询字段的查询次数信息确定字段关系矩阵的字段关联系数,并根据字段关联系数从多个字段关系矩阵中选取目标字段关系矩阵;根据目标字段关系矩阵中相邻查询字段的查询次数信息确定多个字段拆分序列,并根据字段拆分序列确定与源数据表相对应的多个子数据表。该方法可以精简字段,提高数据查询效率。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种数据表处理方法、数据表处理装置、计算机可读介质及电子设备。
背景技术
对于传统的关系型数据库而言,在数据表设计之初,往往会根据经验,或者根据当前情况下对业务的理解,尽可能地将较多的字段放到同一张表中,以此来增加数据库查询的存储和读取的效率。随着业务的发展,可能数据表中还需要不断追加更多的用于表示新增业务场景的字段。然而,随着同一张数据表中的字段过多,就会变成一张宽表,当随着数据量增大时,宽表的查询效率就会降低。因此,如何能够提高数据表的查询效率是目前亟待解决的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种数据表处理方法、数据表处理装置、计算机可读介质及电子设备,进而至少在一定程度上克服数据表字段冗余、查询效率低等技术问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种数据表处理方法,该方法包括:
获取与源数据表相关的多个历史查询语句,并确定各个所述历史查询语句中的查询字段以及每个所述查询字段的查询次数信息;
根据所述查询字段以及各个所述查询字段的查询次数信息确定多个字段关系矩阵;
根据所述字段关系矩阵中相邻查询字段的查询次数信息确定所述字段关系矩阵的字段关联系数,并根据所述字段关联系数从多个字段关系矩阵中选取目标字段关系矩阵;
根据所述目标字段关系矩阵中相邻查询字段的查询次数信息确定多个字段拆分序列,并根据所述字段拆分序列确定与所述源数据表相对应的多个子数据表。
在本发明的一些实施例中,基于以上技术方案,所述获取与源数据表相关的多个历史查询语句,包括:
确定源数据表所在的数据库,并获取所述数据库的数据交互日志;
从所述数据交互日志中提取与所述源数据表相关的多个历史查询语句。
在本发明的一些实施例中,基于以上技术方案,所述查询字段的查询次数信息包括一个查询字段的累积查询总次数以及两个不同查询字段的共同查询总次数。
在本发明的一些实施例中,基于以上技术方案,所述根据所述查询字段以及各个所述查询字段的查询次数信息确定多个字段关系矩阵,包括:
对所述查询字段进行排序以得到多个对应于不同字段排列顺序的字段序列;
获取每个查询字段的累积查询总次数以及每个查询字段与另一查询字段的共同查询总次数;
根据每个查询字段的累积查询总次数以及每个查询字段的共同查询总次数确定分别与各个所述字段序列相对应的多个字段关系矩阵。
在本发明的一些实施例中,基于以上技术方案,所述根据所述字段关系矩阵中相邻查询字段的查询次数信息确定所述字段关系矩阵的字段关联系数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911087888.6/2.html,转载请声明来源钻瓜专利网。