[发明专利]一种网页资源的嗅探方法以及装置在审
申请号: | 201410361637.3 | 申请日: | 2014-07-25 |
公开(公告)号: | CN104166545A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 张伟;陈晨;张铮;齐彦鹏 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F9/44 | 分类号: | G06F9/44;G06F17/30 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 刘杰 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 资源 方法 以及 装置 | ||
技术领域
本发明涉及互联网技术领域,尤其涉及一种网页资源的嗅探方法以及装置。
背景技术
随着互联网技术的不断发展,互联网与人们日常生活的联系越来越紧密,比如,人们可以通过互联网下载各类资源,如视频资源、音频资源等等。
目前,网站所提供的网页包括许多无关资源如广告资源等等,从而会导致用户浪费大量的时间与精力用于在网页上可能提供资源的地方去寻找自己实际所需要的资源如某个特定软件等等。
在现有技术中,为了节省用户时间,网页浏览软件在打开某个网页时,会进行资源嗅探,具体来讲,会全局扫描网页浏览软件所获取的网页数据,并对网页数据中的RAR、ZIP、MP4等关键字进行匹配,再通过使用正则表达式等算法判断所匹配到的数据是否为资源网址,如果是资源网址则将这些网址记录下来并呈现给用户,从而避免用户花费大量的时间与精力在网页上去寻找自己所需要的资源。
但是,由于现有技术中在对网页进行资源嗅探时,需要对网页数据进行全文过滤,导致了效率低下以及匹配准确率不高,同时,无法获取网页通过JavaScript(Java描述语言,一种脚本语言)动态获得的资源链接地址。
因此,现有技术中在对网页进行资源嗅探时,存在因需要对网页数据进行全文过滤而造成的效率低下、以及无法获取网页通过JavaScript动态获得的资源链接地址的技术问题。
发明内容
本发明实施例通过提供一种网页资源的嗅探方法以及装置,解决了现有技术中在对网页进行资源嗅探时,存在因需要对网页数据进行全文过滤而造成的效率低下、以及无法获取网页通过JavaScript动态获得的资源链接地址的技术问题。
本发明实施例一方面提供一种网页资源的嗅探方法,包括:
基于一网页访问指令,访问第一网页;
构建所述第一网页的文件对象模型DOM树,并在构建所述DOM树的过程中,对所述第一网页中的第一资源标签进行识别;
基于识别出的所述第一资源标签,获取所述第一资源标签对应的第一资源,并将所述第一资源呈现给用户;
监视所述DOM树是否发生变化;
在所述DOM树发生变化且所述第一资源标签变化为第二资源标签时,获取所述第二资源标签对应的第二资源,并将所述第二资源呈现给用户,其中,所述第二资源标签与所述第一资源标签不相同。
可选地,所述在构建所述第一网页的文件对象模型DOM树之前,所述方法还包括:获取需要嗅探的资源类型。
可选地,所述获取需要嗅探的资源类型,具体为:
获取需要嗅探的通用资源类型和/或非通用资源类型。
可选地,所述对所述第一网页中的第一资源标签进行识别,具体为:
对所述第一网页中的通用资源标签和/或非通用资源标签进行识别,其中所述通用资源标签与所述通用资源类型对应,所述非通用资源标签与所述非通用资源类型对应。
可选地,在所述获取所述第一资源标签对应的第一资源之后,所述方法还包括:
将所述第一资源保存到哈希集合中,以确定所述第一资源的唯一性。
本发明实施例另一方面还提供一种网页资源的嗅探装置,包括:
访问单元,用于基于一网页访问指令,访问第一网页;
构建单元,用于构建所述第一网页的DOM树;
第一识别单元,用于基于所述DOM树,对所述第一网页中的第一资源标签进行识别;
第一获取单元,用于基于识别出的所述第一资源标签,获取所述第一资源标签对应的第一资源,并将所述第一资源呈现给用户;
监视单元,用于监视所述DOM树是否发生变化;
所述第一获取单元还用于在所述监视单元确定所述DOM树发生变化且所述第一资源标签变化为第二资源标签时,获取所述第二资源标签对应的第二资源,并将所述第二资源呈现给用户,其中,所述第二资源标签与所述第一资源标签不相同。
可选地,所述装置还包括第二获取单元,所述第二获取单元用于在所述构建所述第一网页的文件对象模型DOM树之前,获取需要嗅探的资源类型。
可选地,所述第二获取单元具体用于获取需要嗅探的通用资源类型和/或非通用资源类型。
可选地,所述构建单元具体用于对所述第一网页中的通用资源标签和/或非通用资源标签进行识别,其中,所述通用资源标签与所述通用资源类型对应,所述非通用资源标签与所述非通用资源类型对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410361637.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:移动设备及实现移动设备空中触控的系统、控制装置
- 下一篇:复合式触控覆盖板