[发明专利]一种千万级数据分片处理方法和装置在审

专利信息
申请号: 202111019977.4 申请日: 2021-09-01
公开(公告)号: CN113722099A 公开(公告)日: 2021-11-30
发明(设计)人: 门国强;吴亚松;杨雄辉;张天浩;李吉发 申请(专利权)人: 烽火通信科技股份有限公司
主分类号: G06F9/50 分类号: G06F9/50
代理公司: 深圳市六加知识产权代理有限公司 44372 代理人: 宋建平
地址: 430000 湖北省武*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 千万 级数 分片 处理 方法 装置
【说明书】:

发明涉及一种千万级数据分片处理方法和装置。其方法部分主要包括:将分片机计算功能和业务处理功能解耦,并由分片机主动进行分片数据抢占任务;分片机根据自身性能实时申请分片数据;将每一台分片机申请所得的数据分为多个线程并行处理;最后一台处理完的分片机进行后置处理工作。本发明可以在不影响业务Service节点的情况下通过扩容分片机集群来大幅提高处理效率,且分片方法与业务解耦,在某些业务节点宕机时仍可保证数据正常处理。

【技术领域】

本发明涉及大数据处理时的分片算法技术领域,特别是涉及一种千万级数据分片处理方法和装置。

【背景技术】

早期的软件系统大部分是服务于公司内部业务需求,系统使用者也大多是公司内部人员在操作,传统的软件架构也基本能满足日常需求。但随着公司规模的不断扩大,软件的开发逐渐由统一集成开始往微服务方向发展,部署方式也由单一节点转变为多节点集群模式,这样除了带来系统的复杂度,同时随时间的推进也会产生越来越多的数据量。

随着近几年互联网的快速发展,实现信息互通后,对于软件系统的功能要求以及处理能力要求越来越高。尤其在很多互联网公司,从传统的企业服务逐步转向为个人服务,这样客户的数量基本成几何倍数增长,同时带来对客户数据的维护也会逐日递增。由于是面向客户服务,一旦系统问题导致数据错误或服务体验感差,影响的用户群体范围大,进而可能引发大量的客户投诉,甚至会流失大量的客户群体,给企业带来的名誉以及经济损失不可估量。

由于客户流量的不断增大,对应的服务系统表数据量很容易就达到千万级甚至上亿级。在处理海量数据时(如给1000万用户推送服务信息),业界目前处理方式通常采用分片调度模式,调度作业由Job机制触发,请求分别下发到所有业务Service(服务)节点的服务器,下发请求时针对不同服务器分配不同的分片参数,每个业务Service节点的服务器在拿到分片参数时,去查询自己所需要处理的分片域数据,进而在本节点服务器处理。此方式下的分片处理与业务强耦合,处理效率只能依靠扩充业务Service节点数来提高,一旦某个业务Service节点宕机后,该节点处理的数据也将全部丢失。

综上所述,现有技术主要存在以下三个弊端:

1)针对海量数据处理,业界目前都是通过Job服务进行调度处理,业务Service节点用分布式集群部署,所有的业务Service节点在收到Job发送的请求后(带分片参数),即已经确定每个业务Service节点处理的数据范围,然后每个业务Service节点独立处理自己的数据,一旦中途处理过程中某个业务Service节点出现宕机,该业务Service节点所处理的数据将全部丢失。

2)每个业务Service节点在接收到Job发送的请求后,拿到的分片域数据基本是平均的,但每个业务Service节点的服务器之间可能存在着性能的差异,性能高的业务Service节点的服务会提前处理完自己节点的数据,性能低的会消耗较长的时间才能处理完自己节点的数据,这样也会导致资源处理分配不均的问题。

3)由于分片逻辑是在每个业务Service节点代码中,如果要提高处理效率,只能依靠横向扩容业务Service节点来提高整体处理能力,这样可能会因部分低频但又很重要的业务(高负载)和日常业务(一般负载)使用的资源负载出现无法均衡的问题。

鉴于此,如何克服现有技术所存在的缺陷,解决上述技术问题,是本技术领域待解决的难题。

【发明内容】

针对现有技术的以上缺陷或改进需求,本发明提供一种千万级数据分片处理方法和装置,在不影响业务Service节点的情况下通过扩容分片机集群来大幅提高处理效率,分片方法与业务解耦,在某些业务Service节点宕机时仍可保证数据正常处理。

本发明实施例采用如下技术方案:

第一方面,本发明提供了一种千万级数据分片处理方法,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烽火通信科技股份有限公司,未经烽火通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111019977.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top