[发明专利]在线分析点击流数据的方法和相关装置及系统有效
申请号: | 201310672117.X | 申请日: | 2013-12-10 |
公开(公告)号: | CN104091276A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 王洋;张书彬;薛伟;李勇;肖磊;刘大鹏;言艳花;姜磊;郭伟昭;胡少锋;柳金晶;黄丕培;徐妙;蔡斌 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30;H04L29/06 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 胡丽萍 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 分析 点击 数据 方法 相关 装置 系统 | ||
技术领域
本发明涉及互联网技术领域,具体主要涉及一种在线分析点击流数据的方法和相关装置及系统。
背景技术
广告推送是一项重要的互联网业务。
广点通是运营商常用的一款广告推送工具。广点通等广告推送工具进行广告预测时需要使用用户每天的点击流数据来训练广告投放预测模型。现有的广点通等广告推送工具通常都是使用离线分析得到的训练数据来训练广告投放预测模型。
本发明的发明人在研究和实践过程当中发现,现有技术至少存在以下的技术问题:通过离线分析得到训练数据将受处理资源的限制,且难以满足广告投放预测模型训练对较高实时性的要求,且基于离线分析得到的训练数据所训练的广告投放预测模型有时难以与线上实时数据较好的吻合。
发明内容
本发明实施例提供在线分析点击流数据的方法和相关装置及系统,以期降低处理资源对得到训练数据的限制、提高广告投放预测模型的实时性、提高广告投放预测模型与线上实时数据的吻合度。
本发明实施例一方面提供一种在线分析点击流数据的方法,应用于分布式系统,所述方法包括:
从广告业务服务器获取点击流数据;
提取所述点击流数据中包含的关键信息;
确定所述关键信息所对应的点击流类型;
确定第一时间窗口;
根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;
若确定所述关键信息无需被过滤,则利用所述关键信息生成广告投放预测模型的训练数据。
本发明实施例另一方面提供一种在线分析点击流数据的装置,应用于分布式系统,所述装置可包括:
获取单元,用于从广告业务服务器获取点击流数据;
提取单元,用于提取所述点击流数据中包含的关键信息;
类型确定单元,用于确定所述关键信息所对应的点击流类型;
时间窗口确定单元,用于确定第一时间窗口;
过滤控制单元,用于根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;
生成单元,用于若所述过滤控制单元确定所述关键信息无需被过滤,则利用所述提取单元提取的所述关键信息生成广告投放预测模型的训练数据。
本发明实施例又一方面提供一种通信系统,可包括:
广告业务服务器和分析预测平台;
其中,所述分析预测平台用于从所述广告业务服务器获取点击流数据;提取所述点击流数据中包含的关键信息;确定所述关键信息所对应的点击流类型;确定第一时间窗口;根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;若确定所述关键信息无需被过滤,则利用所述关键信息生成广告投放预测模型的训练数据。
可以看出,本发明的一些实施方式中,从广告业务服务器获取点击流数据之后;提取上述点击流数据中包含的关键信息;确定第一时间窗口和所述关键信息所对应的点击流类型;根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;若确定所述关键信息无需被过滤之后,利用上述关键信息生成广告投放预测模型的训练数据。上述方案由于是从广告业务服务器获取实时的点击流数据,实时在线的进行点击流数据的分析以得到广告投放预测模型的训 练数据,相对于现有的离线分析机制而言,本发明的技术方案有利于降低处理资源对得到训练数据的限制(无需将点击流数据累积到一定数量之后在进行分析以得到训练数据)、有利于提高广告投放预测模型的实时性、有利于提高广告投放预测模型与线上实时数据的吻合度。并且,上述方案进一步根据关键信息对应的点击流类型,以及关键信息对应的日志时间与确定的第一时间窗口的对应关系对关键信息过滤处理,因此有利于提高所使用关键信息的有效性,进而有利于提高生成的广告投放预测模型的训练数据的有效性,进而有利于训练出更加贴合实际发生场景的广告投放预测模型。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310672117.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户身份标识的关联方法和装置、广告投放方法和装置
- 下一篇:一种产品跟踪方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置