[发明专利]一种数据表海量数据校验方法及终端设备在审
申请号: | 201810923299.6 | 申请日: | 2018-08-14 |
公开(公告)号: | CN109271380A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 巩凯丽 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校验 字段数据 海量数据 终端设备 数据处理技术 数据更新频率 更新频率 校验结果 分出 预设 保证 | ||
本发明提供了一种数据表海量数据校验方法及终端设备,适用于数据处理技术领域,该方法包括:获取包含海量数据的数据表中待校验字段数据分别对应的数据更新频率h和数据重要等级d;根据预设的更新频率阈值H以及重要等级阈值D,从数据表中拆分出仅包含h≤H且d>D的待校验字段数据的第一类数据表、仅包含h>H且d<D的待校验字段数据的第二类数据表,以及同时包含h≤H且d<D和h>H且d>D的待校验字段数据的第三类数据表;按照第一类数据表、第三类数据表以及第二类数据表的顺序,依次对待校验字段数据进行校验。此本发明实施例能够极大地提升对数据表字段数据校验的效率,并保证校验结果的准确有效。
技术领域
本发明属于数据处理技术领域,尤其涉及数据表海量数据校验方法及终端设备。
背景技术
随着用户数据量的日益递增,数据管理系统中数据表的体积也日益增大,在对其中包含大数据量的数据表进行数据校验时,现有技术都是按照其中数据表的原始字段数据顺序逐条对数据进行校验,由于数据表数据量很大,从而使得现有技术的校验方法往往需要耗费大量的时间,同时由于数据表中可能包含一些需要数据更新频率高的字段数据,如用户的最后一次登录时间,而此时校验过程较为漫长,在这个校验过程中这些数据更新频率高的字段数据往往都发生了变化,从而使得对这些字段数据的校验结果并不准确。因此,现有技术对大数据量的数据表数据校验的效率低下,且校验结果不准确。
发明内容
有鉴于此,本发明实施例提供了一种数据表海量数据校验方法及终端设备,以解决现有技术中对大数据量的数据表数据校验的效率低下,且校验结果不准确的问题。
本发明实施例的第一方面提供了一种数据表海量数据校验方法,包括:
获取数据表中待校验字段数据分别对应的数据更新频率h和数据重要等级d;
根据预设的更新频率阈值H以及重要等级阈值D,从所述数据表中拆分出仅包含h≤H且d>D的所述待校验字段数据的第一类数据表、仅包含h>H且d<D的所述待校验字段数据的第二类数据表,以及同时包含h≤H且d<D和h>H且d>D的所述待校验字段数据的第三类数据表;
按照第一类数据表、第三类数据表以及第二类数据表的顺序,依次对所述待校验字段数据进行校验。
本发明实施例的第二方面提供了一种终端设备,所述终端设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤。
获取数据表中待校验字段数据分别对应的数据更新频率h和数据重要等级d;
根据预设的更新频率阈值H以及重要等级阈值D,从所述数据表中拆分出仅包含h≤H且d>D的所述待校验字段数据的第一类数据表、仅包含h>H且d<D的所述待校验字段数据的第二类数据表,以及同时包含h≤H且d<D和h>H且d>D的所述待校验字段数据的第三类数据表;
按照第一类数据表、第三类数据表以及第二类数据表的顺序,依次对所述待校验字段数据进行校验。
本发明实施例的第三方面提供了一种计算机可读存储介质,包括:存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的数据表海量数据校验方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810923299.6/2.html,转载请声明来源钻瓜专利网。