[发明专利]网页曝光数据采集方法、系统、电子设备和存储介质在审
申请号: | 201810672066.3 | 申请日: | 2018-06-26 |
公开(公告)号: | CN108846116A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 唐琪;曲晓雷;宋昆 | 申请(专利权)人: | 北京京东金融科技控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王卫忠;袁礼君 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采集 数据采集信息 曝光数据 浏览器 视窗 存储介质 电子设备 网页代码 网页状态 网页 网页访问请求 网页内容解析 动态采集 独立配置 自动识别 监听 遍历 加载 解耦 上报 返回 响应 | ||
1.一种网页曝光数据采集方法,其特征在于,包括如下步骤:
S10、响应网页访问请求,将网页内容解析为DOM树结构;
S20、加载所述网页的数据采集信息,根据所述数据采集信息遍历所述DOM树结构,定位待采集DOM元素;
S30、根据各待采集DOM元素与浏览器当前视窗的相对位置,判断各待采集DOM元素是否被显示于浏览器当前视窗;
S40、当所述待采集DOM元素被显示于浏览器当前视窗时,采集并上报被显示的所述待采集DOM元素的曝光数据;
S50、监听网页状态,当所述网页状态发生变化时,返回所述步骤S30。
2.如权利要求1所述的网页曝光数据采集方法,其特征在于,所述步骤S50包括:
对所述网页的DOM树结构进行监听;
当所述DOM树结构中任一DOM元素发生变化时,返回所述步骤S30。
3.如权利要求2所述的网页曝光数据采集方法,其特征在于,所述DOM元素的变化包括:DOM元素增加、DOM元素删除和DOM元素修改。
4.如权利要求1所述的网页曝光数据采集方法,其特征在于,所述步骤S50包括:
对所述网页的滚动事件进行监听;
当所述网页发生滚动时,返回所述步骤S30。
5.如权利要求1所述的网页曝光数据采集方法,其特征在于,所述步骤S30包括:
获取各待采集DOM元素的坐标信息,根据所述待采集DOM元素的坐标信息计算其中心位置;
当所述待采集DOM元素的中心位置位于浏览器当前视窗时,判断所述待采集DOM元素被显示于浏览器当前视窗。
6.如权利要求1所述的网页曝光数据采集方法,其特征在于,上报所述曝光数据时,各被显示的待采集DOM元素的曝光数据采用唯一对应所述待采集DOM元素的标识ID进行标识。
7.如权利要求1所述的网页曝光数据采集方法,其特征在于,所述曝光数据包括被显示的所述待采集DOM元素的曝光量和点击量。
8.一种网页曝光数据采集系统,其特征在于,包括如下模块:
解析模块,响应网页访问请求,将网页内容解析为DOM树结构;
DOM元素定位模块,加载所述网页的数据采集信息,根据所述数据采集信息遍历所述DOM树结构,定位待采集DOM元素;
位置判断模块,根据各待采集DOM元素与浏览器当前视窗的相对位置,判断各待采集DOM元素是否被显示于浏览器当前视窗;
采集模块,当所述待采集DOM元素被显示于浏览器当前视窗时,采集并上报被显示的所述待采集DOM元素的曝光数据;
监听模块,监听网页状态,当所述网页状态发生变化时,触发所述位置判断模块。
9.如权利要求8所述的网页曝光数据采集系统,其特征在于,所述监听模块包括:
DOM树监听单元,对所述网页的DOM树结构进行监听,当所述DOM树结构中任一DOM元素发生变化时,触发所述位置判断模块。
10.如权利要求8所述的网页曝光数据采集系统,其特征在于,所述监听模块包括:
滚动监听单元,对所述网页的滚动事件进行监听,当所述网页发生滚动时,触发所述位置判断模块。
11.如权利要求8所述的网页曝光数据采集系统,其特征在于,所述位置判断模块执行:
获取各待采集DOM元素的坐标信息,根据所述待采集DOM元素的坐标信息计算其中心位置;
当所述待采集DOM元素的中心位置位于浏览器当前视窗时,判断所述待采集DOM元素被显示于浏览器当前视窗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东金融科技控股有限公司,未经北京京东金融科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810672066.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:内容传播方法、装置及服务器
- 下一篇:商业快讯的去重筛选方法及装置