[发明专利]一种网络资产识别的方法、装置及电子设备在审

申请号：	202111231845.8	申请日：	2021-10-22
公开（公告）号：	CN114004961A	公开（公告）日：	2022-02-01
发明（设计）人：	张卓;张迎苹;古琳莹;张楠;田杰	申请（专利权）人：	绿盟科技集团股份有限公司;北京神州绿盟科技有限公司
主分类号：	G06V10/22	分类号：	G06V10/22;G06V30/148;G06N20/00
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	潘雪
地址：	100089 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种网络资产识别方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开一种网络资产识别的方法、装置及电子设备，该方法包括获取待处理的文本数据，从文本数据中提取出与网络资产数据库中的网络资产数据相匹配的子数据，并将提取出的子数据作为候选网络资产，然后计算候选网络资产之间的概率值，选取满足预设条件的概率值，将概率值对应的候选网络资产作为目标网络资产。通过上述方法可以实现从文本数据提取结构化的网络资产，扩大可识别网络资产的种类和范围，有效解决现有技术中识别网络资产准确率低的问题。

技术领域

本申请涉及计算机技术领域，尤其涉及一种网络资产识别的方法、装置及电子设备。

背景技术

当前，为了保障网络安全，安全产品需要进行网络安全监控、漏洞扫描上报、威胁态势感知等一系列的网络安全管理活动，为了更好进行网络安全管理活动，首先需要对网络资产的进行探测与识别。换而言之，从类似协议报文等的网络信息中获取到的网络资产信息越多、获取到的网络资产信息越完整，那么安全产品所能进行的网络安全管理活动便越有效。

目前，对网络资产的识别的方法，尤其是针对应用服务、中间件、大数据框架、WEB框架等网络资产的识别方法，大多是采用相应的匹配规则对应用层的协议报文等文本数据来进行相应的匹配来实现的。

例如，若“BC”为需要识别的网络资产，“BC”出现在“A”之后“D”之前，那么制定识别“BC”的匹配规则，选取在“A”之后“D”之前的字段作为网络资产。然而，类似协议报文的文本数据在生成的过程中本身的形式是不确定的，也就是说，“BC”还可以在“V”之后，如果是在“V”之后，便会出现无法识别出“BC”的情况。

鉴于此，在当前网络资产规模及其识别需求高速增长的场景下，使用现有技术的匹配规则来识别网络资产存在识别准确率低的问题。

发明内容

本申请提供一种网络资产识别的方法、装置及电子设备，用以识别文本数据中的网络资产，解决现有技术中存在识别网络资产准确率低的问题，有效提升识别网络资产的准确性，在扩大可识别网络资产的种类和范围的同时，还降低识别网络资产的成本。

第一方面，本申请提供了一种网络资产识别的方法，所述方法包括：

获取待处理的文本数据；

从所述文本数据中提取子数据作为候选网络资产，其中，所述子数据为与网络资产数据库中的网络资产数据相匹配的数据；

计算所述候选网络资产之间的概率值，选取满足预设条件的概率值，将所述概率值对应的候选网络资产作为目标网络资产。

通过上述方法，用以识别文本数据中的网络资产，解决现有技术中存在识别网络资产准确率低的问题，有效扩大可识别网络资产的种类和范围，在提升识别网络资产的准确性的同时，还降低识别网络资产的成本。

在一种可能的设计中，所述从文本数据中提取子数据作为候选网络资产，包括如下情况中的一种或多种：

通过字符比对方式，从文本数据中提取与网络资产数据相匹配的子数据作为候选网络资产；

通过模糊识别方式，从文本数据中提取与网络资产数据相匹配的子数据作为候选网络资产；

通过相似度计算方式，从文本数据中提取与网络数据相匹配的子数据作为候选网络资产。