[发明专利]在线分析点击流数据的方法和相关装置及系统有效
申请号: | 201310672117.X | 申请日: | 2013-12-10 |
公开(公告)号: | CN104091276A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 王洋;张书彬;薛伟;李勇;肖磊;刘大鹏;言艳花;姜磊;郭伟昭;胡少锋;柳金晶;黄丕培;徐妙;蔡斌 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30;H04L29/06 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 胡丽萍 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 分析 点击 数据 方法 相关 装置 系统 | ||
1.一种在线分析点击流数据的方法,其特征在于,应用于分布式系统,所述方法包括:
从广告业务服务器获取点击流数据;
提取所述点击流数据中包含的关键信息;
确定所述关键信息所对应的点击流类型;
确定第一时间窗口;
根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;
若确定所述关键信息无需被过滤,则利用所述关键信息生成广告投放预测模型的训练数据。
2.根据权利要求1所述的方法,其特征在于,
所述方法还包括:
确定所述关键信息对应的广告位分类;
将所述关键信息添加到与所述广告位分类对应的队列之中;
所述利用所述关键信息生成广告投放预测模型的训练数据包括:从与所述广告位分类对应的所述队列中读取到所述关键信息之后,利用所述关键信息生成广告投放预测模型的训练数据。
3.根据权利要求1或2所述的方法,其特征在于,
所述利用所述关键信息生成广告投放预测模型的训练数据,包括:
调用流式计算拓扑,以所述关键信息为索引,在在线存储服务器中查找出与所述关键信息匹配的属性信息和特征信息;利用所述关键信息、所述属性信息和所述特征信息,生成广告投放预测模型的训练数据。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,包括:
若确定出所述关键信息所对应的点击流类型为点击,则确定所述关键信息无需被过滤;
若确定出所述关键信息所对应的点击流类型为曝光,且所述关键信息所对应的日志时间处于第一时间窗口之外,则确定所述关键信息需被过滤;
或者,
若确定出所述关键信息所对应的点击流类型为曝光,且所述关键信息所对应的日志时间处于第一时间窗口之内,且在所述第一时间窗口之内还获取到了包含所述关键信息且点击流类型为点击的另一点击流数据,则确定所述关键信息需要被过滤;
或者,
若确定出所述关键信息所对应的点击流类型为曝光,且所述关键信息所对应的日志时间处于第一时间窗口之内,且在所述第一时间窗口之内未获取到了包含所述关键信息且点击流类型为点击和/或曝光的另一点击流数据,则确定所述关键信息无需被过滤。
5.根据权利要求4所述的方法,其特征在于,
所述第一时间窗口的时长范围为3~10分钟。
6.根据权利要求1或2所述的方法,其特征在于,
所述关键信息包括广告标识、广告位标识和用户标识。
7.根据权利要求1或2所述的方法,其特征在于,
所述属性信息和所述特征信息包括如下信息的至少一种:用户年龄、用户活跃度,用户性别、广告主标识、广告类目信息、广告图像信息。
8.一种在线分析点击流数据的装置,其特征在于,应用于分布式系统,所述装置包括:
获取单元,用于从广告业务服务器获取点击流数据;
提取单元,用于提取所述点击流数据中包含的关键信息;
类型确定单元,用于确定所述关键信息所对应的点击流类型;
时间窗口确定单元,用于确定第一时间窗口;
过滤控制单元,用于根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;
生成单元,用于若所述过滤控制单元确定所述关键信息无需被过滤,则利用所述提取单元提取的所述关键信息生成广告投放预测模型的训练数据。
9.根据权利要求8所述的装置,其特征在于,
所述装置还包括:
分类单元,用于确定所述关键信息对应的广告位分类,将所述关键信息添加到与所述广告位分类对应的队列之中;
所述生成单元具体用于,从与所述广告位分类对应的所述队列中读取到所述关键信息之后,利用所述关键信息生成广告投放预测模型的训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310672117.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用户身份标识的关联方法和装置、广告投放方法和装置
- 下一篇:一种产品跟踪方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置