[发明专利]一种基于分布式计算的网络用户行为数据实时处理方法在审
申请号: | 201410562441.0 | 申请日: | 2014-10-21 |
公开(公告)号: | CN104317877A | 公开(公告)日: | 2015-01-28 |
发明(设计)人: | 王加俊;徐礼爽;周文峰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于分布式计算的网络用户行为数据实时处理方法,包括依次执行的启动过程和实时计算过程,其中,所述启动过程具体为:从网络用户行为数据库中提取数据进行分布式批处理计算获取统计结果初始值,保存到统计结果缓存区和结果数据库;所述实时计算过程具体为:数据源端继续接收用户访问交互行为数据生成的事件数据流,并保存至网络用户行为数掘库,将当前数据源端所有的事件数据流分发到分布式的多个节点,基于统计结果初始值进行增量计算并规约,最终结果保存至统计结果缓存区。与现有技术相比,本发明具行支持分布式多节点并行计算、可以根据需求设计事件流的增量计算算法、与网络平台其他功能耦合度低、能较好保证实时计算等优点。 | ||
搜索关键词: | 一种 基于 分布式 计算 网络 用户 行为 数据 实时处理 方法 | ||
【主权项】:
一种基于分布式计算的网络用户行为数据实时处理方法,其特征在于,包括依次执行的启动过程和实时计算过程,其中,所述启动过程具体为:从网络用户行为数据库中提取数据进行分布式批处理计算获取统计结果初始值,保存到统计结果缓存区和结果数据库;在启动过程中,数据源端实时侦听用户访问交互行为数据,生成相应的事件数据流并保存,同时将事件数据流保存至网络用户行为数据库;所述网络用户行为数据库中保存有所有时候用户访问交互行为所产生的事件数据流;所述实时计算过程具体为:数据源端继续接收用户访问交互行为数据生成的事件数据流,并保存至网络用户行为数据库,将当前数据源端所有的事件数据流分发到分布式的多个节点,基于统计结果初始值进行增量计算并规约,最终结果保存至统计结果缓存区;所述实时计算过程按设定间隔循环执行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410562441.0/,转载请声明来源钻瓜专利网。
- 上一篇:背面金属化共晶工艺方法
- 下一篇:乘客输送带的安全装置