[发明专利]跨数据中心的数据传输处理方法及系统有效

专利信息
申请号: 201410662799.0 申请日: 2014-11-19
公开(公告)号: CN104378234B 公开(公告)日: 2018-09-07
发明(设计)人: 秦刚;唐玉芳;柳杨;江舟;孔祥鹏;张红意 申请(专利权)人: 北京数介科技有限公司
主分类号: H04L12/24 分类号: H04L12/24;H04L29/08;G06F17/30
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 王天尧
地址: 101111 北京市西*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 日志数据 数据中转层 字典库 数据处理层 传输 数据传输处理 唯一对应关系 标识替换 数据中心 存储日志数据 传输带宽 分配标识 数据产生 传输量 耗时 替换 存储 查找 保留 补充 更新
【说明书】:

发明公开一种跨数据中心的数据传输处理方法及系统,其中方法包括:数据产生层产生日志数据并传输至数据中转层;数据中转层在从数据处理层获得的字典库中查找日志数据的标识,用查找到的标识对日志数据进行替换,字典库中存储日志数据与标识的唯一对应关系;数据中转层将标识替换后的日志数据传输至数据处理层。进一步的,若数据中转层在字典库中未查找到日志数据的标识,则保留原日志数据并传输至数据处理层;数据处理层将未进行标识替换的日志数据补充至字典库中,并为该日志数据分配标识,存储该日志数据与标识的唯一对应关系,将更新后的字典库同步至数据中转层。本发明可以减少日志数据的传输量,节省传输带宽和传输耗时。

技术领域

本发明涉及计算机及通信技术领域,尤其涉及跨数据中心的数据传输处理方法及系统。

背景技术

Web2.0是一个架构在知识上的环境,人与人之间交互而产生出的内容,经由在服务导向架构中的程序,在这个环境被发布、管理和使用。相比Web1.0,它更注重用户之间的交互和体验。用户是内容的创建者,同时也是使用者。目前Web2.0具有代表性的服务包括:电商网络、资讯类、社区化网络(SNS,如人人网)、微博、微信、来往、健康、滴滴打车等等。Web2.0注重用户交互,一条微博发表后,通过不断转发、评论后,有可能产生GB级别的日志数据,这无疑给日志预传输带来新的挑战。

图1为现有技术中日志传输架构图。如图1所示,数据从产生端传输到数据处理层的处理方式如下:

数据产生层产生用户访问日志,对原始日志进行GZ压缩后,以某种传输协议(比如FTP、HTTP等)传输给数据中转层;数据产生层可以由WEB服务器构成,数据中转层可以由数据中转服务器构成;

如:1386562882.666 14XXX.XXX.XXX.XXX TCP_MEM_HIT/200 440 GET http://www.XXXXX.com/images/xxxxx.gif-NONE/-image/gifhttp://www.XXXXX.com/aaaa/440_176147XXX.htmMozilla/5.0(Windows NT 6.1;WOW64)AppleWebKit/537.1(KHTML,likeGecko)Chrome/21.0.1180.89Safari/537.1–

这是一条WEB端产生的完整的访问日志,WEB端产生后每5分钟的数据会生成一个.gz包(devicename_20140822.tar.gz),然后通过某种传输协议(比如FTP、HTTP等)上传到数据中转服务器。

数据中转服务器接收到每5分钟产生的GZ包文件后,对这些文件做汇总后(比如把相同设备上的多个文件做合并后上传:devicename(设备名)相同的多个日志文件合并为一个gz文件)上传到数据处理层(由某种分布式存储或计算集群节点构成)中做统计分析使用。

然而,现有技术中,由于数据产生层的WEB服务器产生的日志量非常庞大,给传输带来了很高的带宽成本。并且,日志量大则需要的耗时就会很长,日志收集的时效性就会很低。

发明内容

本发明实施例提供一种跨数据中心的数据传输处理方法,用以减少日志数据的传输量,节省传输带宽和传输耗时,该方法包括:

数据产生层产生日志数据,将日志数据传输至数据中转层;

数据中转层接收到日志数据后,在从数据处理层获得的字典库中查找日志数据的标识,用查找到的标识对日志数据进行替换,所述字典库中存储日志数据与标识的唯一对应关系;

数据中转层将标识替换后的日志数据传输至数据处理层。

一个实施例中,若数据中转层在所述字典库中未查找到日志数据的标识,则保留原日志数据并传输至数据处理层;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数介科技有限公司,未经北京数介科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410662799.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top