[发明专利]网页加载速度的确定方法和装置有效
申请号: | 201510703871.4 | 申请日: | 2015-10-26 |
公开(公告)号: | CN106611010B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 李新国;冯鸳鹤;詹小磊 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/957 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 加载 速度 确定 方法 装置 | ||
1.一种网页加载速度的确定方法,其特征在于,包括:
对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据;
从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间;
根据所述停留时间确定访问的网页是否为加载速度慢的网页;
在确定出加载速度慢的网页的情况下,检测所述确定出的加载速度慢的网页中是否存在列表页;
在检测出存在所述列表页时,剔除所述确定出的加载速度慢的网页中的列表页;
在确定出加载速度慢的网页的情况下,检测所述确定出的加载速度慢的网页是否存在列表页包括:在确定出加载速度慢的网页的情况下,记录所述加载速度慢的网页的统一资源定位符;爬取记录的统一资源定位符对应的网页数据;根据所述网页数据判断所述记录的统一资源定位符对应的网页是否为列表页。
2.根据权利要求1所述的方法,其特征在于,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:
统计在所述同一会话中所述同一来源在所述同一网页的总停留时间和总访问次数;
获取在所述同一会话中所述同一来源最后一次访问所述同一网页的停留时间;
利用以下公式计算在所述同一会话中除最后一次访问所述同一网页的平均访问时间:
t=(T-T1)/(N-1)
其中,T为所述总停留时间,T1为所述最后一次访问所述同一网页的停留时间,N为所述总访问次数;
判断所述t是否大于或等于时间阈值;
在所述t大于或等于所述时间阈值时,确定所述访问的网页为加载速度慢的网页。
3.根据权利要求1所述的方法,其特征在于,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:
统计在所述同一会话中所述同一来源访问所述同一网页的停留时间大于等于时间阈值的访问次数;
判断停留时间大于等于所述时间阈值的访问次数是否超过次数阈值;
在判断出停留时间大于等于所述时间阈值的访问次数超过次数阈值时,确定所述访问的网页为加载速度慢的网页。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据之后,以及从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间之前,所述方法还包括:
按照访问的时间先后顺序对在同一会话中同一来源对所述同一网页的访问数据进行排序;
依次判断相邻两条访问数据之间的时间间隔是否小于时间间隔阈值;
在相邻两条访问数据之间的时间间隔小于所述时间间隔阈值时,剔除相邻两条访问数据中后一条访问数据。
5.一种网页加载速度的确定装置,其特征在于,包括:
获取单元,用于对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据;
提取单元,用于从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间;
确定单元,用于根据所述停留时间确定访问的网页是否为加载速度慢的网页;
检测单元,用于在确定出加载速度慢的网页的情况下,检测所述确定出的加载速度慢的网页中是否存在列表页;
第一剔除单元,用于在检测出存在所述列表页时,剔除所述确定出的加载速度慢的网页中的列表页;
所述检测单元包括:记录模块,用于在确定出加载速度慢的网页的情况下,记录所述加载速度慢的网页的统一资源定位符;爬取模块,用于爬取记录的统一资源定位符对应的网页数据;第一判断模块,用于根据所述网页数据判断所述记录的统一资源定位符对应的网页是否为列表页。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510703871.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页关键字审计的方法及装置
- 下一篇:一种多数据库综合集成接入方法