[发明专利]基于组件的浏览器操作行为数据采集方法在审
申请号: | 201710797710.5 | 申请日: | 2017-09-06 |
公开(公告)号: | CN107483622A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 梁林森;孙煜华;张志亮;陆慧;陆宏治;邹时容;吴永欢;梁哲辉 | 申请(专利权)人: | 广州供电局有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F17/30;H04L12/24 |
代理公司: | 南京利丰知识产权代理事务所(特殊普通合伙)32256 | 代理人: | 任立,艾中兰 |
地址: | 510656 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 组件 浏览器 操作 行为 数据 采集 方法 | ||
1.一种基于组件机制的浏览器操作行为数据采集方法,其特征在于包括如下步骤:
第一步:采集组件的部署
(1)组件注册,将浏览器数据采集组件打包而成的组件包添加到系统;
(2)组件配置,对已经部署的浏览器数据采集组件配置其运行参数;
第二步:数据采集
下载各采集组件的配置信息,启动对应的采集组件进行前端裸数据采集,通过分析用户行为的行为事件及由用户触发的后续操作,捕获有意义的数据,包括触发动作的锚点、页面的URL、标签信息、时间戳、响应时间、用户信息标识、系统信息;捕获到的数据被直接发送到数据存储服务器端;
第三步:数据存储
数据存储服务器端将接收到的数据存储在数据库中;
第四步:数据分析
数据分析服务器端根据数据相关性利用算法对存储在数据库中的数据进行分析整理,结果数据通过外部接口方式提供给行为数据的使用方进行二次分析。
2.如权利要求1所述的基于组件机制的浏览器操作行为数据采集方法,其特征在于所述数据库包含两大类数据表:
第一类:用户数据采集表,用于存放用户访问浏览器所产生的数据,包括访问的时间戳、点击的文本元素、点击的事件类型以及访问的URL;
第二类:由管理员进行编辑的元素-功能映射表,用于为用户的访问数据赋予语义信息,存放管理员对点击元素的映射关系的说明,包括:点击元素的路径、点击元素的说明及点击元素所在页面的说明。
3.如权利要求2所述的基于组件机制的浏览器操作行为数据采集方法,其特征在于所述映射表由管理员通过浏览器插件提供的接口进行编辑。
4.如权利要求1所述的基于组件机制的浏览器操作行为数据采集方法,其特征在于数据采集过程以静默的方式进行,不会给用户任何提示,用户在使用过程中不会感知到行为数据正在被采集。
5.如权利要求1所述的基于组件机制的浏览器操作行为数据采集方法,其特征在于当正在运行的采集组件有新的版本,触发自动或者手动升级:先停止当前正在运行的采集组件,下载对应的采集组件可执行文件,并重新加载。
6.如权利要求1所述的基于组件机制的浏览器操作行为数据采集方法,其特征在于当采集组件的配置发生变更时,将变更后的配置信息保存到数据库,重新下载最新的采集组件配置,调用对应采集组件的更新配置接口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州供电局有限公司,未经广州供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710797710.5/1.html,转载请声明来源钻瓜专利网。