[发明专利]广告拦截规则库的建立方法、装置、设备及存储介质在审
申请号: | 202110957095.6 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113641911A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 任文超;李涛 | 申请(专利权)人: | 郑州阿帕斯数云信息科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 姜凤岩 |
地址: | 450046 河南省郑州市郑东新区*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 广告 拦截 规则 建立 方法 装置 设备 存储 介质 | ||
1.一种广告拦截规则库的建立方法,其特征在于,包括:
获取多个样本统一资源定位符URL和所述样本URL的特征信息,根据所述样本URL的特征信息和第一预设特征模式,对所述样本URL进行分类,得到多个第一类别;所述第一类别中包括第一分类基准URL,所述第一类别中的样本URL的特征信息与所述第一分类基准URL在所述第一预设特征模式下的第一特征模式信息相匹配;
按照预设的问题URL选取规则,在各个所述第一类别中确定问题类别,汇总所述问题类别中的样本URL,得到各个问题URL;
根据所述问题URL的特征信息和第二预设特征模式,对所述问题URL进行分类,得到多个第二类别;所述第二类别中包括第二分类基准URL,所述第二类别中的问题URL的特征信息与所述第二分类基准URL在所述第二预设特征模式下的第二特征模式信息相匹配;
根据所述第一分类基准URL和所述第二分类基准URL对应的页面中包含的广告资源,建立广告拦截规则库;所述广告拦截规则库包括所述第一分类基准URL的域名、所述第二分类基准URL的域名以及每个域名对应的广告拦截规则;所述广告拦截规则用于拦截相应域名所对应的页面中的广告资源。
2.根据权利要求1所述的方法,其特征在于,获取多个样本统一资源定位符URL和所述样本URL的特征信息,包括:
获取历史请求进行广告拦截的多个URL,根据所述多个URL确定样本URL;
对所述样本URL进行解析,获得所述样本URL的特征信息;其中,特征信息包括:URL域名、URL长度、站内路径、参数名、参数值、路径深度、参数个数、参数排序中的至少一项。
3.根据权利要求1所述的方法,其特征在于,在根据所述样本URL的特征信息和第一预设特征模式,对所述样本URL进行分类,得到多个第一类别之前,还包括:
获取预设的URL筛选条件;所述URL筛选条件包括URL长度筛选条件、路径深度筛选条件、参数个数筛选条件中的至少一项;
根据所述URL筛选条件和所述样本URL的特征信息,对所述样本URL进行筛选;
根据所述样本URL的特征信息和第一预设特征模式,对所述样本URL进行分类,得到多个第一类别,包括:
根据筛选得到的样本URL的特征信息和第一预设特征模式,对筛选得到的样本URL进行分类,得到多个第一类别。
4.根据权利要求1所述的方法,其特征在于,根据所述样本URL的特征信息和第一预设特征模式,对所述样本URL进行分类,得到多个第一类别,包括:
根据预设的基准选择规则,在所述样本URL中选取第一分类基准URL,根据所述第一预设特征模式,对所述第一分类基准URL的特征信息进行处理,得到所述第一分类基准URL在所述第一预设特征模式下的第一特征模式信息;
将所述第一特征模式信息与所述样本URL的特征信息进行匹配,根据匹配结果,将所述第一分类基准URL和相匹配的样本URL归属为同一类并构建第一类别;
对于所述样本URL中剩余的URL,重复上述选取第一分类基准URL、信息匹配、构建第一类别的动作,直到将各个所述样本URL均划分至相应的第一类别。
5.根据权利要求4所述的方法,其特征在于,根据预设的基准选择规则,在所述样本URL中选取第一分类基准URL,包括:
按照预设的排序规则,对各个所述样本URL进行排序,在所述排序中,选择第一个未被划分至相应的第一类别中的样本URL作为所述第一分类基准URL。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州阿帕斯数云信息科技有限公司,未经郑州阿帕斯数云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110957095.6/1.html,转载请声明来源钻瓜专利网。