[发明专利]一种网络资产识别的方法、装置及电子设备在审
申请号: | 202111231845.8 | 申请日: | 2021-10-22 |
公开(公告)号: | CN114004961A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 张卓;张迎苹;古琳莹;张楠;田杰 | 申请(专利权)人: | 绿盟科技集团股份有限公司;北京神州绿盟科技有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V30/148;G06N20/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 潘雪 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 资产 识别 方法 装置 电子设备 | ||
本申请公开一种网络资产识别的方法、装置及电子设备,该方法包括获取待处理的文本数据,从文本数据中提取出与网络资产数据库中的网络资产数据相匹配的子数据,并将提取出的子数据作为候选网络资产,然后计算候选网络资产之间的概率值,选取满足预设条件的概率值,将概率值对应的候选网络资产作为目标网络资产。通过上述方法可以实现从文本数据提取结构化的网络资产,扩大可识别网络资产的种类和范围,有效解决现有技术中识别网络资产准确率低的问题。
技术领域
本申请涉及计算机技术领域,尤其涉及一种网络资产识别的方法、装置及电子设备。
背景技术
当前,为了保障网络安全,安全产品需要进行网络安全监控、漏洞扫描上报、威胁态势感知等一系列的网络安全管理活动,为了更好进行网络安全管理活动,首先需要对网络资产的进行探测与识别。换而言之,从类似协议报文等的网络信息中获取到的网络资产信息越多、获取到的网络资产信息越完整,那么安全产品所能进行的网络安全管理活动便越有效。
目前,对网络资产的识别的方法,尤其是针对应用服务、中间件、大数据框架、WEB框架等网络资产的识别方法,大多是采用相应的匹配规则对应用层的协议报文等文本数据来进行相应的匹配来实现的。
例如,若“BC”为需要识别的网络资产,“BC”出现在“A”之后“D”之前,那么制定识别“BC”的匹配规则,选取在“A”之后“D”之前的字段作为网络资产。然而,类似协议报文的文本数据在生成的过程中本身的形式是不确定的,也就是说,“BC”还可以在“V”之后,如果是在“V”之后,便会出现无法识别出“BC”的情况。
鉴于此,在当前网络资产规模及其识别需求高速增长的场景下,使用现有技术的匹配规则来识别网络资产存在识别准确率低的问题。
发明内容
本申请提供一种网络资产识别的方法、装置及电子设备,用以识别文本数据中的网络资产,解决现有技术中存在识别网络资产准确率低的问题,有效提升识别网络资产的准确性,在扩大可识别网络资产的种类和范围的同时,还降低识别网络资产的成本。
第一方面,本申请提供了一种网络资产识别的方法,所述方法包括:
获取待处理的文本数据;
从所述文本数据中提取子数据作为候选网络资产,其中,所述子数据为与网络资产数据库中的网络资产数据相匹配的数据;
计算所述候选网络资产之间的概率值,选取满足预设条件的概率值,将所述概率值对应的候选网络资产作为目标网络资产。
通过上述方法,用以识别文本数据中的网络资产,解决现有技术中存在识别网络资产准确率低的问题,有效扩大可识别网络资产的种类和范围,在提升识别网络资产的准确性的同时,还降低识别网络资产的成本。
在一种可能的设计中,所述从文本数据中提取子数据作为候选网络资产,包括如下情况中的一种或多种:
通过字符比对方式,从文本数据中提取与网络资产数据相匹配的子数据作为候选网络资产;
通过模糊识别方式,从文本数据中提取与网络资产数据相匹配的子数据作为候选网络资产;
通过相似度计算方式,从文本数据中提取与网络数据相匹配的子数据作为候选网络资产。
通过字符比对方式、模糊识别方式和相似度计算方式中这三种方式的任意结合,可以实现对候选网络资产的提取,改变传统技术中对匹配规则的依赖,扩大可识别网络资产的种类和范围,有效提升识别网络资产的准确性,同时降低识别网络资产的成本。
在一种可能的设计中,所述从文本数据中提取子数据作为候选网络资产,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绿盟科技集团股份有限公司;北京神州绿盟科技有限公司,未经绿盟科技集团股份有限公司;北京神州绿盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111231845.8/2.html,转载请声明来源钻瓜专利网。