[发明专利]一种对海量实时数据流进行处理的方法及系统在审
申请号: | 201910848405.3 | 申请日: | 2019-09-09 |
公开(公告)号: | CN110704484A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 王必红 | 申请(专利权)人: | 华迪计算机集团有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458;G06F16/27 |
代理公司: | 11266 北京工信联合知识产权代理有限公司 | 代理人: | 姜丽楼 |
地址: | 100192 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式数据库 处理信息 实时分析 统计结果 完整记录 缓存 服务器资源 实时数据流 消息中间件 比对处理 比对结果 并发性能 复杂业务 高效利用 接收消息 实时处理 实时统计 数据服务 消息队列 业务状态 原始数据 转码处理 实时流 中间件 扩容 维度 解析 数据库 存储 更新 管理 | ||
本发明公开了一种对海量实时数据流进行处理的方法及系统,包括:接收消息中间件RocketMQ中的多条业务状态原始数据,并进行解析转码处理,以获取每个业务的业务完整记录;将获取的每个业务的业务完整记录与分布式数据库HBase中存储的业务汇总信息进行比对处理,根据比对结果生成实时分析统计结果处理信息并消息中间件RocektMQ中;根据所述实时分析统计结果处理信息进行各维度实时统计结果的更新。本发明采用实时流计算框架Flink,消息队列缓存RocketMQ,分布式的、面向列的数据库Hbase和非关系型分布式数据库实现对复杂业务的实时处理;能够有针对性的对数据服务管理进行分布式扩容,实现了高并发性能需求,高效利用了服务器资源,避免了资源浪费,提升了系统的稳定性。
技术领域
本发明海量数据处理技术领域,并且更具体地,涉及一种对海量实时数据流进行处理的方法及系统。
背景技术
随着全国快递物流行业的快速发展,尤其是双11期间,快递物流量的爆发式增长。在进行数据处理时,需要对数据库进行反复大数据量IO操作。基于传统IOE技术的架构面对如此大量数据的实时处理时,在性能和功能方面,已经难以满足国家邮政局对全国快递数据处理分析的及时性、准确性需求。
现有的基于IOE架构的数据处理方法,前端采用负载均衡(Nginx)做分发,后端采用多个Tomcat,原始数据经过一系列操作落入ORACLE,ORACLE已无法满足海量数据实时统计,实时统计性能越来越差,已经难以满足实时数据统计的展示需要。而且上述统计方式仅仅是对当天数据进行统计,统计结果并不与复杂的业务定义完全一致,实时统计结果仅有参考价值,无法完全作为实际监管的数据统计依据,具体的复杂的业务定义统计逻辑还要进行长时间的批量计算得出。现有的实时统计无论在处理性能上还是业务逻辑支撑上都存在严重不足。
因此,需要一种海量实时数据流处理方法,以满足实时处理性能需要以及复杂业务逻辑处理需求。
发明内容
本发明提出一种对海量实时数据流进行处理的方法及系统,以解决如何对海量数据实时进行处理,以满足实时处理性能需要以及复杂业务逻辑处理需求的问题。
为了解决上述问题,根据本发明的一个方面,提供了一种对海量实时数据流进行处理的方法,所述方法包括:
接收消息中间件RocketMQ中的多条业务状态原始数据,并对获取的多条业务状态原始数据进行解析转码处理,以获取每个业务的业务完整记录;
将获取的每个业务的业务完整记录与分布式数据库HBase中存储的业务汇总信息进行比对处理,根据比对结果生成实时分析统计结果处理信息,并将所述实时分析统计结果处理信息写入所述消息中间件RocektMQ中;
根据所述消息中间件RocketMQ中的实时分析统计结果处理信息对各维度实时统计结果进行更新。
优选地,其中所述对获取的多条业务状态原始数据进行解析转码处理,以获取每个业务的业务完整记录,包括:
根据获取的多条业务状态原始数据中的每条业务状态原始数据的标识信息,确定相互关联的业务状态原始数据集合;
将相互关联度的业务状态原始数据集合中的每条业务状态原始数据进行解析转码和合并,并将合并后的数据并与预设的维度码表进行清洗操作,以获取每个业务的业务完整记录。
优选地,其中每条业务状态原始数据包括:收件、发件、到件、派件和签收信息;
所述预设的维度码表包括:产品类型、扫描状态和扫描网点,所述产品类型包括:次日达、次晨达、次早达、隔日达和次日达信息,所述扫描状态包括:揽收、发件、到件、派件和签收信息。
优选地,其中所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华迪计算机集团有限公司,未经华迪计算机集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910848405.3/2.html,转载请声明来源钻瓜专利网。