[发明专利]一种基于MySQL的流式实时数据同步系统在审

专利信息
申请号: 201910559607.6 申请日: 2019-06-26
公开(公告)号: CN110275927A 公开(公告)日: 2019-09-24
发明(设计)人: 王传德;杨胜华;姚民伟 申请(专利权)人: 浪潮卓数大数据产业发展有限公司
主分类号: G06F16/27 分类号: G06F16/27;G06F16/25
代理公司: 济南信达专利事务所有限公司 37100 代理人: 孙晶伟
地址: 214029 江苏省无锡市滨*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实时数据 数据分析 同步系统 流式 数据通信技术 系统扩展性 实时记录 实时同步 数据变化 数据更新 告警 监控 解耦 解析 并发 数据库 侵入 引入
【说明书】:

发明公开一种基于MySQL的流式实时数据同步系统,涉及数据通信技术领域;Mysql利用binlog实时记录数据更新,Maxwell工具解析MySQL binlog的实时数据,同步实时数据到Kafka中,Kafka利用KafkaConntor将实时数据同步到ElasticSearch中,Elasticsearch对实时数据进行数据分析和监控;本发明系统通过MySQL的Binlog实时同步数据变化,避免对数据库的侵入操作,通过引入Kafka,解耦并提高了系统扩展性,使大并发成为可能,通过elasticsearch,可以实时的实现数据分析,监控,告警等功能。

技术领域

本发明公开一种基于MySQL的流式实时数据同步系统,涉及数据通信技术领域。

背景技术

数据分析特别是实时数据分析,已经越来越多的成为各行各业的分析要求与标准。例如零售行业可能希望通过线下POS数据与实时门店客流流量的进行实时结合与分析,实现商品销售,销量,总类等等的实时预测;在线广告平台期望通过广告(Impression)总类,数据量以及基于时间的点击(Click)量,计算实时的广告转化率(Conversion Rate);物联网的用户想通过实时分析线下的状态设备与设备采集的数据,进行后台的计算与预判等等。

纵观这些业务系统,从数据流的角度看,数据架构可以分为前后端两个部分。前端为业务数据与日志收集系统,其中业务数据系统一般都是利用关系型数据库实现,例如MySQL,PostgreSQL,后端为数据分析与处理系统,例如ElasticSearch搜索引擎,Redshift数据仓库,基于S3的Hadoop系统等等,或者基于Spark Stream的实时分析后端。

实时数据分析的首要条件是实现实时数据同步,即从上述前端系统到后端系统的数据同步。具体来讲主要包含两个要求1)实时,2)异构数据源的增量同步。实时的要求是前后端系统的实时数据ETL的过程,需要根据业务需求,越快越好。异构数据源的增量同步是指,前端产生的增量数据可以无缝的同步到后端的数据系统。针对MySQL,MySQL的表结构的存储不能简单的通过复制操作实现数据同步,现有做法是通过应用程序双写的架构,利用应用逻辑实现,但是要保证数据一致性相对复杂,而且架构扩展相对比较困难。而本发明提供一种基于MySQL的流式实时数据同步系统,通过MySQL的Binlog实时同步数据变化,避免了对数据库的侵入操作,通过引入Kafka,解耦并提高了系统扩展性,使大并发成为可能,利用elasticsearch可以实时的实现数据分析,监控,告警等功能。

发明内容

本发明针对现有技术的问题,提供一种基于MySQL的流式实时数据同步系统,具有通用性强、实施简便等特点,具有广阔的应用前景。

本发明提出的具体方案是:

一种基于MySQL的流式实时数据同步系统,包括Mysql、Maxwell工具、Kafka及Elasticsearch,

Mysql利用binlog实时记录数据更新,

Maxwell工具解析MySQL binlog的实时数据,同步实时数据到Kafka中,Kafka利用KafkaConntor将实时数据同步到ElasticSearch中,Elasticsearch对实时数据进行数据分析和监控。

所述的系统中binlog使用Row格式进行数据更新,实时的反映行级别的数据变化。

所述的系统中利用Maxwell工具佯装为MySQL Slave,抽取出Binlog的日志文件,并把实时数据变化注入到实时流式数据管道中,在实时流式数据管道后端对变化的Binlog的日志文件,进行消费与数据处理,同步到Kafka中。

所述的系统中KafkaConntor利用standalone模式或distributed模式实现Kafka内的数据实时同步到ElasticSearch中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910559607.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top