[发明专利]一种日志数据的处理方法及装置有效

专利信息
申请号: 201610440258.2 申请日: 2016-06-17
公开(公告)号: CN106897198B 公开(公告)日: 2020-06-02
发明(设计)人: 王凯;毛仁歆 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F11/34 分类号: G06F11/34
代理公司: 北京鼎佳达知识产权代理事务所(普通合伙) 11348 代理人: 王伟锋;刘铁生
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 日志 数据 处理 方法 装置
【说明书】:

发明公开了一种日志数据的处理方法及装置,涉及计算机技术领域,主要目的在于通过统一行为数据的数据结构将异构日志数据表中的行为数据转化为同构行为数据表。本发明主要的技术方案为:根据异构日志数据表中包含的行为构成要素设置同构行为数据表的数据结构,所述异构日志数据表是具有不同数据结构的多张日志数据表;根据所述同构行为数据表的数据结构生成行为数据转换代码框架;解析所述异构日志数据表内的行为数据信息;将所述行为数据信息添加到所述行为数据转换代码框架内的对应位置中,得到数据转换的可执行代码;执行所述可执行代码得到一张以相同数据结构存储行为数据信息的同构行为数据表。

技术领域

本发明涉及计算机技术领域,尤其涉及一种日志数据的处理方法及装置。

背景技术

用户在各种网站、计算机应用、手持设备应用及其他介质中进行操作时产生的日志数据包含了用户的行为信息,这些日志数据在理解用户、支持业务等方面具有非常重要的价值。数据工程师从不同的角度对这些日志数据做清洗后可用于很多方面的分析。从关注用户行为的角度整理得到的数据,被称为行为数据。对于同一个用户,由于其使用的设备、系统或应用的不同会导致该用户的行为数据具有多种不同的数据结构,对于这种异构数据表,在进行数据处理时将变得十分麻烦,对此,需要将异构数据表尽可能地转化为具有相同或仅存在极少量差异的同构数据表进行数据处理。

目前在业界并没有表示用户行为数据的统一标准,因此当前的现状是:即便是在同一家公司,不同业务线的数据工程师开发的用户行为数据表结构、命名风格等也会千差万别,也就是说,这些包含了用户行为信息的数据表是异构的;更糟糕的是,这些数据往往只能满足所在业务的人员的需求,对其他业务的人员而言,可能因缺少某些感兴趣的字段而无法拿来即用,仍然需要经过一层数据加工来获取特定的字段。这些现状折射出了如下问题:

(1)对于数据工程师而言,若没有一套统一的行为数据的处理方法,不同业务的数据使用方提出的需求不尽相同,需要针对不同业务开发数据结构不同的行为数据表,开发流程不通用,行为数据表的开发效率难以提高;

(2)对于行为数据的使用者而言,检索自己想要的数据表并不容易(可能因为表命名不规范,也可能因为没有一个目录结构可以进行查找,导致或许想要的数据表是有的,但却不容易检索到),使用门槛也很高(可能需要自己再加工得到其他字段才能使用,而不能拿来即用);

(3)对于企业而言,由于表结构不规范、表字段不够丰富,会导致同一张表会有很多有细小差异性的副本(例如不同业务的不同的角色关注的字段不一样,数据使用者会对来源表进行个性化加工,导致产生很多副本),大大增加了不必要的数据存储开销。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种日志数据的处理方法及装置,通过统一行为数据的数据结构将异构日志数据表中的行为数据转化为同构行为数据表,达到提高数据工程师的开发效率,降低数据消费者的使用门槛,以及为企业节约数据存储成本的目的。

为达到上述目的,本发明主要提供如下技术方案:

一方面,本发明提供一种日志数据的处理方法,该方法包括:

根据异构日志数据表中包含的行为构成要素设置同构行为数据表的数据结构,所述异构日志数据表是具有不同数据结构的多张日志数据表;

根据所述同构行为数据表的数据结构生成行为数据转换代码框架;

解析所述异构日志数据表内的行为数据信息;

将所述行为数据信息添加到所述行为数据转换代码框架内的对应位置中,得到数据转换的可执行代码;

执行所述可执行代码得到一张以相同数据结构存储行为数据信息的同构行为数据表。

另一方面,本发明提供一种日志数据的处理装置,该装置包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610440258.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top