[发明专利]数据比对方法、系统、电子设备和存储介质在审

专利信息
申请号: 202110387928.X 申请日: 2021-04-12
公开(公告)号: CN112988817A 公开(公告)日: 2021-06-18
发明(设计)人: 张昌达;刘力;刘泽昕;黄书珽 申请(专利权)人: 携程旅游网络技术(上海)有限公司
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/25
代理公司: 上海隆天律师事务所 31282 代理人: 徐莉;钟宗
地址: 200335 上海市长*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 方法 系统 电子设备 存储 介质
【说明书】:

发明涉及数据处理技术领域,提供一种数据比对方法、系统、电子设备和存储介质。所述数据比对方法包括:任务获取步骤:获取比对任务的比对信息,包括基准数据源和比对数据源、待比对数据的查询条件和分页抽取模式;数据抽取步骤:根据所述分页抽取模式,分别自所述基准数据源和所述比对数据源中抽取满足所述查询条件的基准数据和比对数据,并建立所述基准数据和所述比对数据的映射关系;数据比对步骤:对相映射的每组基准数据和比对数据进行比对,生成包含所述比对数据与对应的基准数据的差异标记的比对结果。本发明能够实现海量数据的差异化比对,根据需要灵活取数,提高数据比对验证的效率和系统的稳定性。

技术领域

本发明涉及数据处理技术领域,具体地说,涉及一种数据比对方法、系统、电子设备和存储介质。

背景技术

数据迁移、不同系统数据同步在信息化系统中非常常见,在数据迁移、数据同步等操作前,需要对数据进行比对验证,确保迁移、同步等操作的可靠性。

传统的数据比对验证,通过采取抽样、人工检测、数据总量验证等方式进行数据一致性的验证,覆盖范围非常有限,常会导致大量重复工作,无法灵活地进行数据比对验证,且缺少系统化的结果报告。

需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

有鉴于此,本发明提供一种数据比对方法、系统、电子设备和存储介质,能够实现海量数据的差异化比对,根据需要灵活取数,提高数据比对验证的效率和系统的稳定性。

本发明的一个方面提供一种数据比对方法,包括:任务获取步骤:获取比对任务的比对信息,包括基准数据源和比对数据源、待比对数据的查询条件和分页抽取模式;数据抽取步骤:根据所述分页抽取模式,分别自所述基准数据源和所述比对数据源中抽取满足所述查询条件的基准数据和比对数据,并建立所述基准数据和所述比对数据的映射关系;数据比对步骤:对相映射的每组基准数据和比对数据进行比对,生成包含所述比对数据与对应的基准数据的差异标记的比对结果。

在一些实施例中,所述任务获取步骤之前,还包括任务生成步骤,所述任务生成步骤包括:接收主任务配置的比对信息,生成消息队列,所述主任务配置的比对信息包括基准数据源、进行数据抽取的取数条件和分页抽取模式;接收基于所述主任务的多个子任务配置的比对信息,生成所述消息队列的多个消费者,每个所述子任务配置的比对信息包括比对数据源、基于所述取数条件的查询条件、及数据比对模式;所述任务获取步骤、所述数据抽取步骤和所述数据比对步骤分别由每个所述消费者执行,多个所述消费者并行消费所述消息队列的多条消息,每条消息包括所述主任务的比对信息和对应的子任务的比对信息。

在一些实施例中,所述取数条件和所述查询条件均以键值方式存储;所述取数条件中,以所述待比对数据的数据特征为键,以所述待比对数据的数据范围为值;所述查询条件中,以满足所述数据特征的变量名为键,以满足所述数据范围的变量值为值。

在一些实施例中,所述数据比对步骤包括:根据所述数据比对模式,过滤相映射的每组基准数据和比对数据中的忽略字段,所述数据比对模式包括严格模式和非严格模式;对每组所述基准数据和比对数据中保留的目标字段进行比对,并当所述比对数据的目标字段与对应的基准数据的目标字段存在差异时根据差异类型进行差异标记;生成包含所述基准数据、所述比对数据、及所述比对数据与对应的基准数据的差异标记的比对结果。

在一些实施例中,所述分页抽取模式的结束条件为时间截止条件或数量截止条件。

在一些实施例中,所述数据比对步骤之后,还包括可视化展示步骤,所述可视化展示步骤包括:根据所述比对结果,生成可视化报告,展示至对应页面。

在一些实施例中,所述比对结果存储于Elasticsearch中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游网络技术(上海)有限公司,未经携程旅游网络技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110387928.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top