[发明专利]分布式批量数据清理方法及系统有效
申请号: | 202010325609.1 | 申请日: | 2020-04-23 |
公开(公告)号: | CN111522805B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 肖慧闵;孙中军;周宝琛;林楷坤 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/2457;G06F16/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王天尧;汤在彦 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 批量 数据 清理 方法 系统 | ||
本发明公开了一种分布式批量数据清理方法及系统,该方法包括:主节点将各个待清理表的清理指令,发送到第一消息队列;主节点对应的各个远程子节点从第一消息队列中读取待清理表的清理指令,根据待清理表的分库分表情况,生成待清理表的一个或多个单表清理指令,发送到第二消息队列;各个远程子节点对应一个或多个清理节点从第二消息队列中读取一个单表清理指令,对单表进行数据清理,并将单表的清理结果返回到第三消息队列;远程子节点从第三消息队列中读取单表的清理结果,汇总各个待清理表的清理结果,返回到第四消息队列;主节点从第四消息队列中读取各个待清理表的清理结果。本发明由多个节点同时对数据进行清理,大大提高了数据清理效率。
技术领域
本发明涉及数据清理领域,尤其涉及一种分布式批量数据清理方法及系统。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
对于业务系统来说,业务量的不断增加,导致数据库中存储的数据表也越来越多。大量的历史数据表,占用过多的存储空间,会影响业务系统的性能,因而,需要定期清理历史数据表。对于一些复杂场景的业务系统,有些数据量比较大的表,经常存在分库分表存储的情况。
现有的数据清理方法,将应用程序部署于单台机器,采用串行方式清理每张数据表,且未考虑数据表分表分库的情况,这种数据清理方式存在效率低下、无法实现跨数据库的关联数据清理的技术问题,无法应对复杂场景下的业务数据清理。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例中提供了一种分布式批量数据清理方法,用以解决现有技术采用的数据清理方法是单机部署、串行方式清理,存在效率低下、无法实现跨数据库的关联数据清理的技术问题,该方法包括:主节点将各个待清理表的清理指令,发送到第一消息队列,其中,主节点对应多个远程子节点;远程子节点从第一消息队列中读取一个待清理表的清理指令,根据待清理表的分库分表情况,生成待清理表的一个或多个单表清理指令,发送到第二消息队列,其中,每个远程子节点对应一个或多个清理节点;清理节点从第二消息队列中读取待清理表的一个单表清理指令,对待清理表的一个单表进行数据清理,并将待清理表一个单表的清理结果返回到第三消息队列;远程子节点从第三消息队列中读取各个单表的清理结果,汇总各个待清理表的清理结果,并将各个待清理表的清理结果返回到第四消息队列;主节点从第四消息队列中读取各个待清理表的清理结果。
本发明实施例中还提供了一种分布式批量数据清理系统,用以解决现有技术采用的数据清理方法是单机部署、串行方式清理,存在效率低下、无法实现跨数据库的关联数据清理的技术问题,该系统包括:主节点模块、远程子节点模块和清理节点模块;主节点模块对应多个远程子节点模块;每个远程子节点模块对应一个或多个清理节点模块,每个远程子节点模块包括:主表清理模块;每个清理节点模块包括:数据清理模块;其中,主节点模块,用于将各个待清理表的清理指令,发送到第一消息队列;远程子节点模块,用于从第一消息队列中读取一个待清理表的清理指令,根据待清理表的分库分表情况,生成待清理表的一个或多个单表清理指令,发送到第二消息队列;清理节点模块,用于从第二消息队列中读取待清理表的一个单表清理指令,对待清理表的一个单表进行数据清理,并将待清理表一个单表的清理结果返回到第三消息队列;其中,远程子节点模块还用于从第三消息队列中读取各个单表的清理结果,汇总各个待清理表的清理结果,并将各个待清理表的清理结果返回到第四消息队列;主节点模块还用于从第四消息队列中读取各个待清理表的清理结果。
本发明实施例中还提供了一种计算机设备,用以解决现有技术采用的数据清理方法是单机部署、串行方式清理,存在效率低下、无法实现跨数据库的关联数据清理的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述分布式批量数据清理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010325609.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置