[发明专利]显示扫描进度的方法及装置有效
申请号: | 201310728802.X | 申请日: | 2013-12-25 |
公开(公告)号: | CN103699845B | 公开(公告)日: | 2017-05-17 |
发明(设计)人: | 郭朝辉;张龙;张楠 | 申请(专利权)人: | 北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 黄志华 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 显示 扫描 进度 方法 装置 | ||
技术领域
本发明涉及信息安全技术领域,尤其涉及一种显示扫描进度的方法及装置。
背景技术
随着网络安全问题的日益突出,各企业根据各自的业务需求,需要对各自的站点定期的使用网页(web)漏洞扫描器进行漏洞扫描。web漏洞扫描器能够自定义扫描策略,并通过扫描策略对web站点进行系统漏洞和应用漏洞的发现与检测,并为客户提供详细的解决方案。其中,web漏洞扫描器能够检测到的漏洞包括:结构化查询语言(Structured Query Language,SQL)注入、跨站脚本攻击(Cross Site Script,XSS)、可扩展标记语言路径语言(XML PathLanguage,XPath,XML:Ensible Markup Language)、弱口令、敏感文件等。
Web漏洞扫描器主要以扫描任务为处理单元,一个扫描任务就是一个站点,在对站点进行扫描时,web漏洞扫描器内的爬虫模块首先对该站点进行统一资源定位符(Uniform Resource Locator,URL)的爬取,爬虫模块爬取到的URL经过预设的过滤规则进行过滤后由扫描模块进行扫描。
Web漏洞扫描器在扫描过程中,需要实时的将扫描进度显示给用户,以便用户能够及时的获知任务进度。现有技术一般通过下述方式向用户显示扫描进度:
将扫描模块当前已经扫描完成的页面链接的数目作为当前完成工作量,将需要扫描模块进行扫描的所有页面链接的数目作为此次扫描任务的总工作量,然后将当前完成工作量与总工作量的比值作为当前扫描进度,将计算出的当前扫描进度实时显示给用户。每当扫描模块扫描完成一个页面链接,就按照上述方式更新扫描进度。
其中,爬虫模块爬取到的所有页面链接经过预设的过滤规则进行过滤,过滤后的页面链接即为扫描模块需要扫描的页面链接,因此,现有技术在计算扫描任务的总工作量时非常依赖于爬虫模块最终爬取到的所有页面链接的数目。但是,由于站点规模的大小不同、网络环境不同,爬虫模块爬取站点中的所有页面链接所需的时间也不同,因此,在爬虫模块爬取完所有页面链接之前,web漏洞扫描器无法准确地计算出最终需要扫描模块进行扫描的所有页面链接的数目,即,扫描任务的总工作量在爬虫模块爬取完站点中的所有页面链接之前是不确定的,因此,按照现有技术的上述方案,在爬虫模块爬取完站点中的所有页面链接之前,web漏洞扫描器无法实时、准确地向用户显示当前扫描进度,用户也就无法根据进度详情预估整个任务的扫描结束时间,从而严重影响了用户体验。
发明内容
本发明实施例提供一种显示扫描进度的方法及装置,用以解决现有技术中在爬虫模块爬取完所有页面链接之前,无法向用户显示当前扫描进度的问题。
本发明实施例提供如下技术方案:
本发明实施例提出一种显示扫描进度的方法,包括:
根据爬虫模块当前已爬取完成的页面链接的数目以及在爬虫模块当前已爬取完成的页面链接中需要扫描模块进行扫描的页面链接的数目,确定爬取扫描产出比;
根据所述爬取扫描产出比以及爬虫模块将要爬取的页面链接的数目,确定在爬虫模块将要爬取的页面链接中需要扫描模块进行扫描的页面链接的数目;
根据在爬虫模块当前已爬取完成的页面链接中需要扫描模块进行扫描的页面链接的数目以及在爬虫模块将要爬取的页面链接中需要扫描模块进行扫描的页面链接的数目,确定需要扫描模块进行扫描的所有页面链接的数目;
确定扫描模块当前已扫描完成的页面链接的数目;
根据扫描模块当前已扫描完成的页面链接的数目以及需要扫描模块进行扫描的所有页面链接的数目,确定当前扫描进度,并显示确定出的当前扫描进度。
由上可见,本发明实施例技术方案中,在爬虫模块爬取完站点中的所有页面链接之前,扫描模块每扫描完成一个页面链接,就根据爬虫模块当前已爬取完成的页面链接中需要扫描模块进行扫描的页面链接的数目以及在爬虫模块将要爬取的页面链接中需要扫描模块进行扫描的页面链接的数目,估算扫描任务的总工作量,然后根据扫描模块当前已扫描完成的页面链接的数目(即当前完成工作量)与扫描任务的总工作量,确定并显示当前扫描进度,因此即使爬虫模块未爬取完站点中的所有页面链接,也能够实时、准确地向用户显示当前扫描进度,使用户能够根据进度详情预估整个任务的扫描结束时间,保障了用户的使用体验。
优选的,通过下述方式确定爬取扫描产出比:
其中,cor为爬取扫描产出比;
accept为在爬虫模块当前已爬取完成的页面链接中需要扫描模块进行扫描的页面链接的数目;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司,未经北京神州绿盟信息安全科技股份有限公司;北京神州绿盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310728802.X/2.html,转载请声明来源钻瓜专利网。