[发明专利]一种URL识别率的分析方法及装置有效
申请号: | 202010207359.1 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111460337B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 尹志勇 | 申请(专利权)人: | 武汉思普崚技术有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 430070 湖北省武汉市东湖新技术开发区光谷大道3*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 url 识别率 分析 方法 装置 | ||
1.一种URL识别率的分析方法,其特征在于,所述方法应用于用户终端,用户终端以远程登录的方式与审计产品建立连接,所述方法包括:
获取审计产品的URL列表,所述URL列表用于存储审计产品在任意时刻所审计的URL;
获取预设时间段对应的URL集合,所述URL集合中任意一个URL的时间戳在所述预设时间段内;
分别统计所述URL集合中未识别URL和已识别URL的数量;
计算所述已识别URL在所述URL集合中的占比,将所述占比作为URL识别率。
2.根据权利要求1所述的分析方法,其特征在于,分别统计所述URL集合中未识别URL和已识别URL的数量,包括:
根据所述URL集合中URL对应的第一特征信息,将所述URL集合划分为两个URL子集合,所述URL子集合分别为第一URL子集合和第二URL子集合,其中,所述第一URL子集合中的URL为已识别URL,所述第二URL子集合中的URL为未识别URL,所述第一特征信息指示所述URL集合中的URL是否被识别;
将所述第一URL子集合中URL的数量作为所述URL集合中已识别URL的数量,将所述第二URL子集合中URL的数量作为所述URL集合中未识别URL的数量。
3.根据权利要求2所述的分析方法,其特征在于,在根据所述URL集合中URL对应的第一特征信息,将所述URL集合划分为两个URL子集合之后,还包括:
在所述URL子集合中,判断是否存在第二特征信息相同的第一目标URL,其中,所述第二特征信息指示所述URL子集合中URL的域名;
如果存在,则对所述第一目标URL执行去重操作。
4.根据权利要求1所述的分析方法,其特征在于,在计算所述已识别URL在所述URL集合中的占比,将所述占比作为URL识别率之后,还包括:
判断所述URL识别率是否低于预设阈值;
如果是,下载所述URL集合中的未识别URL;
根据所述未识别URL对应的第三特征信息,将所述未识别URL划分为第一组未识别URL和第二组未识别URL,其中,所述第三特征信息指示所述未识别URL的通信协议;
在各组未识别URL中,判断是否存在第四特征信息相同的第二目标URL,其中,所述第四特征信息指示所述未识别URL对应的资源的地址;
如果存在,则统计所述第二目标URL的重复次数,并对所述第二目标URL执行去重操作。
5.根据权利要求4所述的分析方法,其特征在于,在统计所述第二目标URL的重复次数,并对所述第二目标URL执行去重操作之后,还包括:
将各组未识别URL执行去重操作后剩余的未识别URL作为第三目标URL,判断所述第三目标URL是否合法;
如果是,则将合法的第三目标URL添加至URL库。
6.一种URL识别率的分析装置,其特征在于,所述装置应用于用户终端,用户终端以远程登录的方式与审计产品建立连接,所述装置包括:
第一获取模块,用于获取审计产品的URL列表,所述URL列表用于存储审计产品在任意时刻所审计的URL;
第二获取模块,用于获取预设时间段对应的URL集合,所述URL集合中任意一个URL的时间戳在所述预设时间段内;
统计模块,用于分别统计所述URL集合中未识别URL和已识别URL的数量;
计算模块,用于计算所述已识别URL在所述URL集合中的占比,将所述占比作为URL识别率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉思普崚技术有限公司,未经武汉思普崚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010207359.1/1.html,转载请声明来源钻瓜专利网。