[发明专利]基于大数据的一种手册数据校验方法在审
申请号: | 201910482758.6 | 申请日: | 2019-06-04 |
公开(公告)号: | CN110362722A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 周琨;周在亮;金瑞雪 | 申请(专利权)人: | 苏州神州数码捷通科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06Q40/00;G06Q50/26 |
代理公司: | 北京快易权知识产权代理有限公司 11660 | 代理人: | 赵秀英 |
地址: | 215000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子集 第一数据 校验 查询 录入 手册数据 数据子集 大数据 标准数据 目标数据 数据丢失 数据反馈 数据校验 搜索命令 相等 反馈 检测 发现 | ||
本发明公开了数据校验领域的基于大数据的一种手册数据校验方法,能够将手册录入后的标准数据以及录入的数据分别拆分成若干个第一数据子集与第二数据子集,并在第一数据子集、第二数据子集中分别进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询,本发明采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询,能够快速发现数据丢失的现象及定位到具体的区域,校验效率高,检测速度快。
技术领域
本发明涉及数据校验领域,具体涉及基于大数据的一种手册数据校验方法。
背景技术
在海关检验过程中,企业需要将自身的电子账册提供给海关部门,在电子账册数据上传的过程中,会有各种各样的影响,有的影响会导致数据出现差错。因此,需要对上传的数据进行校验和比对,然而传统的数据比对方法虽然比对逻辑比较简单,但是比对、运行速度比较慢,比对效率不高,具体地措施在于,在对比数据中提取一条比对数据,然后将对比数据分别逐一的与被对比数据比对并逐一反馈比对结果,可想而知的是,这种比对方法的运算量极为庞大,比对运算效率低。
发明内容
解决的技术问题
针对现有技术中的问题,本发明提出基于大数据的一种手册数据校验方法。
技术方案
本发明通过以下技术方案予以实现:
基于大数据的一种手册数据校验方法,包括步骤:S1:获取手册数据并定义为第一数据集,获取手册的录入数据,定义录入数据为第二数据集,第一数据集与第二数据集中数据的顺序位置一一对应相同;
S2:第一数据集中的数据按照固定的长度拆分为多个第一数据子集,第二数据集中的数据按照固定的长度拆分为多个第二数据子集;
S3:在第一数据子集与第二数据子集中分别进行查询,得到响应搜索命令获得的第一数据反馈子集以及第二数据反馈子集;
S4:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则顺序对下一第一数据反馈子集、第二数据反馈子集进行查询;
S5:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量不相等,则通过数据提取模块提取该第一数据子集与第二数据子集,再通过数据对比模块对该第一数据子集与第二数据子集中的数据进行比对。
进一步地,多个第一数据子集的数据顺序拼接排列后与第一数据集中的数据排列顺序相同。
进一步地,多个第二数据子集的数据顺序拼接排列后与第二数据集中的数据排列顺序相同。
进一步地,在S5中,第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则通过数据对比模块顺序对第一数据子集与第二数据子集中的数据进行比对。
进一步地,在S5中,数据对比模块将第一数据子集与第二数据子集中对应不一致的数据进行标记。
进一步地,多个第一数据子集与第二数据子集中对应不一致的数据采用数据提取模块统一提取并汇成列表显示。
有益效果
采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州神州数码捷通科技有限公司,未经苏州神州数码捷通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910482758.6/2.html,转载请声明来源钻瓜专利网。