[发明专利]一种基于模板获取漏洞信息的方法在审
申请号: | 201711176206.X | 申请日: | 2017-11-22 |
公开(公告)号: | CN107958156A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 孔美琪;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 获取 漏洞 信息 方法 | ||
技术领域
本发明涉及云计算安全技术领域,特别是一种基于模板获取漏洞信息的方法。
背景技术
随着互联网深入千家万户,信息安全日益重要。当需要了解漏洞信息时,简练、精准的获取漏洞信息就显得异常重要,而传统的获取方法会带来以下问题:
一是耗时且繁琐,需要逐个访问漏洞网站,找到对应的漏洞模块,再逐个了解漏洞详情,非常耗时,而且操作麻烦;
二是不够精准,访问漏洞网站时会有各种其他的信息,需要在大量信息中搜索到需要的漏洞信息;
三是不够灵活,无法根据需要来获取漏洞信息。
为了便捷地获取漏洞信息,确保获取漏洞信息的精准性,提高获取的灵活性,需要一种更便捷灵活的漏洞获取方法。
发明内容
本发明解决的技术问题在于提出一种基于模板获取漏洞信息的方法,可以更便捷、灵活地获取漏洞信息,确保漏洞信息的精准性,解决了传统校验方法耗时长、操作繁琐、无法根据需要获取特定漏洞信息等问题。
本发明解决上述技术问题的技术方案是:
所述的方法是按照漏洞网站的网页结构定义数据格式模板,根据模板将从漏洞网站爬取的页面信息进行抽取;从而获得漏洞信息。
所述的方法具体包括如下步骤:
步骤1:配置获取漏洞的网址;
步骤2:定义数据格式模板;
步骤3:根据网址爬取页面信息;
步骤4:根据模板抽取特定漏洞信息;
步骤5:按照指定的结构把数据存储到指定的数据库。
所述的获取漏洞的网址是能正常连通,并且能获取到漏洞信息的网址。
所述根据网址爬取页面信息是通过爬虫程序爬取漏洞信息网址获取到的整个页面内容。
所述的根据模板抽取特定漏洞信息是按照模板定义的规则匹配出需要的漏洞信息。
本发明通过自定义模板,搜索匹配时能直接按照模板定义的规则匹配出需要的信息;无需通过人工逐一访问漏洞网站,筛选、排除大量其他信息后才能获取到想要的漏洞信息,节省70%的时间。本发明也可以解决传统漏洞收集工具在增加、删除和修改所需信息时需要改动代码,重新编译发布的问题,只需修改模板定义即可。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明的方法流程图。
具体实施方式
如图1所示,本发明实施的步骤流程如下:
1、配置获取漏洞的网址,在配置文件中配置如下:
#获取漏洞信息的网址
vul.url=${url_cnnvd}
2、定义数据格式模板,模板定义如下:
#漏洞标题
vul.title=//div[@class=//"list_list//"]/ul/li
#漏洞链接
vul.link=//div[@class=//"fl//"]/a
#漏洞ID
vul.id=//div[@class=//"fl//"]/p/a/text()
#漏洞级别
vul.level=//div[@class=//"fr//"]/img/@title
#漏洞更新时间
vul.updateTime=//div[@class=/"fr/"]/text()
3、根据网址爬取页面信息,代码如下:
4、根据模板抽取特定漏洞信息,代码如下:
5、保存到数据库,代码如下:
整个流程结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711176206.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种系统初始化方法和装置
- 下一篇:一种用于计算机的开机保护装置