[发明专利]一种网页热点的实时获取方法和系统在审
申请号: | 201810160614.4 | 申请日: | 2018-02-26 |
公开(公告)号: | CN108415999A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 朱明亮;李廷威;肖运龙 | 申请(专利权)人: | 广州要啦网络有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 510665 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时分析 行为数据 大数据流 实时采集 分屏 实时获取 网页 阅读 网页数据分析 用户访问网站 展示 离线处理 热点区域 深度指标 多维 维度 热力 直观 应用 | ||
1.一种网页热点的实时获取方法,其特征在于:包括以下步骤:
实时采集用户访问网站的行为数据;
采用大数据流式处理技术对实时采集的行为数据进行实时分析计算,所述实时分析计算包括阅读深度分屏计算和热力图计算;
展示实时分析计算的结果。
2.根据权利要求1所述的一种网页热点的实时获取方法,其特征在于:所述实时采集用户访问网站的行为数据这一步骤,具体包括:
浏览器实时将用户访问网站的行为数据发送至反向代理服务器;
反向代理服务器将接收的行为数据均衡发送至采集服务器集群;
采集服务器集群将接收的行为数据实时发送至消息队列。
3.根据权利要求2所述的一种网页热点的实时获取方法,其特征在于:所述采用大数据流式处理技术对实时采集的行为数据进行实时分析计算这一步骤,具体包括:
流式处理系统实时读取消息队列的数据;
流式处理系统根据实时读取的数据进行阅读深度分屏计算;
流式处理系统根据实时读取的数据进行热力点击图计算。
4.根据权利要求3所述的一种网页热点的实时获取方法,其特征在于:所述流式处理系统根据实时读取的数据进行阅读深度分屏计算这一步骤,具体包括:
对实时读取的数据进行快速去重,得到去重后的数据;
以站点id、日期、页面url以及屏数为维度,根据去重后的数据计算分屏的阅读指标,所述分屏的阅读指标包括访客数、页面浏览量、独立ip数、访问时长和行为事件次数;
将分屏的阅读指标实时写入关系型数据库。
5.根据权利要求4所述的一种网页热点的实时获取方法,其特征在于:所述流式处理系统根据实时读取的数据进行热力点击图计算这一步骤,具体包括:
从实时读取的数据中获取点击行为的相对坐标;
根据获取的相对坐标计算行为事件在页面区域的坐标比例;
根据计算的坐标比例以分区+站点id+url+日期+元素id+坐标为主键,利用分布式数据库的计数器,累计行为次数写入分布式数据库。
6.根据权利要求5所述的一种网页热点的实时获取方法,其特征在于:所述从实时读取的数据中获取点击行为的相对坐标这一步骤,具体为:
采用Javascript技术找到鼠标点击位置的最小元素,以元素名称、同辈元素索引、同辈元素id、同辈元素class和同辈元素name值标识元素id,并确定元素的相对坐标(w,w1,w2,h,h1,h2),其中,w和h分别为当前页面一屏的长和高,w1和h1分别为元素的长度和高度,w2和h2分别为鼠标点击位置到元素左边界的长度和鼠标点击位置到元素上边界的长度。
7.根据权利要求6所述的一种网页热点的实时获取方法,其特征在于:所述根据获取的相对坐标计算行为事件在页面区域的坐标比例这一步骤,具体包括:
流式处理系统根据元素的相对坐标计算元素的横轴比例和纵轴比例,所述元素的横轴比例rw和纵轴比例rh的具体计算公式为:
rw=rw2/rw1,rw1=w1/w,rw2=w2/w,
rh=rh2/rh1,rh1=h1/h,rh2=h2/h;
返回坐标比例(rw,rh)。
8.根据权利要求7所述的一种网页热点的实时获取方法,其特征在于:所述展示实时分析计算的结果这一步骤,具体包括:
按热力图渲染规则找到待渲染元素;
从分布式数据库中读取待渲染元素的横轴比例和纵轴比例;
根据待渲染元素的横轴比例和纵轴比例定位出相应的待渲染坐标点并进行渲染。
9.一种网页热点的实时获取系统,其特征在于:包括:
实时采集模块,用于实时采集用户访问网站的行为数据;
实时分析计算模块,用于采用大数据流式处理技术对实时采集的行为数据进行实时分析计算,所述实时分析计算包括阅读深度分屏计算和热力图计算;
展示模块,用于展示实时分析计算的结果。
10.一种网页热点的实时获取系统,其特征在于:包括:
存储器,用于存储程序;
处理器,用于加载所述程序以执行如权利要求1-8任一项所述的网页热点的实时获取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州要啦网络有限公司,未经广州要啦网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810160614.4/1.html,转载请声明来源钻瓜专利网。