[发明专利]基于flink的实时聚合报表方法、电子设备及可读存储介质在审

专利信息
申请号: 202010707366.8 申请日: 2020-07-20
公开(公告)号: CN111930812A 公开(公告)日: 2020-11-13
发明(设计)人: 余丽玲;刘跃红;管正爽;曹浩 申请(专利权)人: 银盛支付服务股份有限公司
主分类号: G06F16/248 分类号: G06F16/248
代理公司: 深圳市深可信专利代理有限公司 44599 代理人: 刘昌刚
地址: 518000 广东省深圳市龙华*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 flink 实时 聚合 报表 方法 电子设备 可读 存储 介质
【说明书】:

发明公开了一种基于flink的实时聚合报表方法、电子设备及可读存储介质,涉及大数据技术领域,该方法包括以下的步骤:S1、初始化报表数据;S2、实时同步数据库的明细数据;S3、日报表数据的实时处理;S4、月报表数据的实时处理;S5、年报表的实时处理;本发明的有益效果是:能够实时响应运营日、月、年报表数据请求,满足高并发场景使用。

技术领域

本发明涉及大数据技术领域,更具体的说,本发明涉及一种基于flink的实时聚合报表方法、电子设备及可读存储介质。

背景技术

现有技术中,对于实时数据的需求越来越多,多个独立的实时任务会造成很大的集群资源的浪费,付出较高的开发运维成本,因此需要一个统一的实时数据仓库来提高任务扩展性,节约集群资源。

对于企业运营需要使用的业务日、月、年报,目前可使用的技术有:(1)采用日常的跑批处理机制,利用Shell脚本与传统型数据库交互即可实现;(2)使用以Hadoop为代表的大数据离线处理机制实现。

上述两种方式均存在缺陷:第一种方式,实现简单,对大数据量的跑批处理会短时间内增加传统型型数据库的I/O压力,甚至耗尽数据库资源,出现宕机;第二种方式,使用了大数据的Hadoop技术,可分解短时间的跑批处理压力,但报表的生成时效性较低,且若报表生成后数据有变动,则不支持即时处理,需要重新生成数据方可解决;同时,对已生成的报表若需要调整,则需重新开发。

发明内容

为了克服现有技术的不足,本发明提供一种基于flink的实时聚合报表方法、电子设备及可读存储介质,能够实时响应运营日、月、年报表数据请求。

第一方面,本发明提供了一种基于flink的实时聚合报表方法,其改进之处在于,该方法包括以下的步骤:

S1、初始化报表数据,初始化日报表、月报表以及年报表的数据,并保存在MongoDB数据库对应的明细表中;

S2、实时同步数据库的明细数据,定时拉取明细表中的数据,将需要的字段数据发送到Kafka;

S3、日报表数据的实时处理,通过flink实时聚合Kafka上的数据,调整聚合的时间窗口,将聚合处理后的数据存储到MongoDB数据库的日报表中;

在flink中将新增、删除以及更新的数据分成不同的stream流进行处理,再将处理的结果sink到相应的日报表中;

S4、月报表数据的实时处理,在将数据落地到日报表之前会将所有的更新、删除的数据转换成增加的数据,在月报表数据处理时在flink消费Kafka数据只有增加数据,将时间窗口内具体的数据直接累加到已有的值中,最后落地到MongoDB数据库相应的月报表中;

S5、年报表的实时处理,在将数据落地到月报表之前将所有的月报表数据发送到kafka,在年报表数据处理时flink消费kafka数据时只有增加数据,将时间窗口内聚合的数据直接累加到已有的值中,最后落地到mongodb数据库相应的年报表中。

进一步的,所述的步骤S2中,通过定时程序定时拉取明细表的数据。

进一步的,所述的步骤S2中,根据业务需求将需要的字段数据发送到Kafka。

进一步的,所述的步骤S3中,经过聚合处理后的数据占明细表数据的5%以下。

进一步的,所述的步骤S3中,在flink中通过OutputTag结合SpitStream,将新增、删除以及更新的数据分成不同的stream流进行处理。

进一步的,所述的步骤S3中,在flink中将新增、删除以及更新的数据分成不同的stream流进行处理之前,还包括以下的步骤:

将删除的累计聚合操作转换成新增数据进行处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银盛支付服务股份有限公司,未经银盛支付服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010707366.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top