[发明专利]广告过滤方法和装置有效
申请号: | 201410180750.1 | 申请日: | 2014-04-30 |
公开(公告)号: | CN105095236A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 田文 | 申请(专利权)人: | 优视科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 宋子良 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 广告 过滤 方法 装置 | ||
技术领域
本发明涉及浏览器领域,具体而言,涉及一种广告过滤方法和装置。
背景技术
在浏览器上,广告过滤插件adblock是一个广泛应用的广告过滤插件。其基本原理是设置一系列的过滤规则,在浏览器发出资源请求之前,先检查其统一资源定位符(UniformResourceLocator,简称url)是否命中某条过滤规则,如果命中某条过滤规则,可以确定浏览器请求的资源为广告,浏览器无需请求该资源。
为了达到较好的过滤效果,通常需要设置较多的过滤规则,比如adblock提供的过滤规则就超过2万条。目前的浏览器广告过滤方法是:当用户通过浏览器输入某个url时,利用该url逐个对过滤规则进行匹配,如果匹配上某个过滤规则,则返回true(表示需要进行广告过滤),否则返回false(表示不需要进行广告过滤)。由于在浏览器中设置有大量的广告的过滤规则,在浏览器每一次网络请求时,与大量的过滤规则逐个进行匹配,使得广告过滤时性能开销较大,同时由于过滤规则数量大,导致每次广告过滤时间长。
针对现有技术中由于过滤规则数量大导致每次广告过滤时间长的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种广告过滤方法和装置,以解决由于过滤规则数量大导致每次广告过滤时间长问题。
为了实现上述目的,根据本发明的一个方面,提供了一种广告过滤方法。根据本发明的浏览器广告过滤方法包括:获取在浏览器中输入的统一资源定位符;利用广告过滤规则的关键字对所述统一资源定位符进行匹配;如果所述统一资源定位符与所述关键字匹配,则将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配;以及如果所述统一资源定位符与所述关键字对应的广告过滤规则匹配,则利用所述广告过滤规则进行广告过滤。
进一步地,在所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配之前,所述浏览器广告过滤方法还包括:获取与所述广告过滤规则对应的关键字;建立与所述广告过滤规则对应的关键字的字典树;其中,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配步骤包括:获取所述字典树中的关键字;判断所述统一资源定位符与所述字典树中的关键字是否匹配。
进一步地,所述获取与所述广告过滤规则对应的关键字包括:读取所述广告过滤规则的文件;从所述广告过滤规则的文件中提取所述关键字;所述建立与广告过滤规则对应的关键字的字典树包括:建立所述关键字与所述广告过滤规则的对应关系;根据提取的关键字建立所述字典树。
进一步地,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配包括:判断所述统一资源定位符与所述广告过滤规则的关键字是否匹配,其中,如果判断出所述统一资源定位符与所述广告过滤规则的关键字匹配,则将所述关键字对应的广告过滤规则转换为正则表达式;将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配包括:将所述统一资源定位符与所述正则表达式进行匹配;其中,如果所述统一资源定位符与所述正则表达式匹配,则输出所述正则表达式对应的广告过滤规则,通过输出的所述正则表达式对应的广告过滤规则进行广告过滤。
进一步地,在所述获取在浏览器中输入的统一资源定位符之后,所述浏览器广告过滤方法还包括:将所述统一资源定位符传入分段器;在所述分段器中对所述统一资源定位符进行分段,得到多个分段字符;其中,所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配包括:逐个将所述多个分段字符与关键字匹配器中的关键字进行匹配。
为了实现上述目的,根据本发明的另一方面,提供了一种广告过滤装置。根据本发明的浏览器广告过滤装置包括:第一获取单元,用于获取在浏览器中输入的统一资源定位符;第一匹配单元,用于利用广告过滤规则的关键字对所述统一资源定位符进行匹配;第二匹配单元,用于当所述统一资源定位符与所述关键字匹配时,将所述统一资源定位符与所述关键字对应的广告过滤规则进行匹配;以及过滤单元,用于当所述统一资源定位符与所述关键字对应的广告过滤规则匹配时,利用所述广告过滤规则进行广告过滤。
进一步地,所述浏览器广告过滤装置还包括:第二获取单元,用于在所述利用广告过滤规则的关键字对所述统一资源定位符进行匹配之前,获取与所述广告过滤规则对应的关键字;建立单元,用于建立与所述广告过滤规则对应的关键字的字典树;其中,所述第一匹配单元包括:获取模块,用于获取所述字典树中的关键字;第一判断模块,用于判断所述统一资源定位符与所述字典树中的关键字是否匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优视科技有限公司,未经优视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410180750.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面调度的处理方法和装置
- 下一篇:以瀑布流方式显示图片的方法和设备