[发明专利]一种基于机器学习的离群资产检测方法及系统在审
申请号: | 202111194965.5 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113641682A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 韩旭东;曲志峰;张胜猛;高峰 | 申请(专利权)人: | 中孚安全技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06K9/62;G06N20/00 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 赵阳 |
地址: | 250101 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 离群 资产 检测 方法 系统 | ||
1.一种基于机器学习的离群资产检测方法,其特征在于,包括如下步骤:
S1:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中;
S2:把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息;
S3:把离群资产信息写入离群资产表。
2.根据权利要求1所述的基于机器学习的离群资产检测方法,其特征在于,所述资产基本信息包括:
资产信息、资产漏洞信息、资产告警信息和资产访问信息。
3.根据权利要求2所述的基于机器学习的离群资产检测方法,其特征在于,所述步骤S1具体为:
对资产信息、资产漏洞信息、资产告警信息、资产访问信息基于资产ID进行关联;基于资产ID和资产状态分组聚合生成资产统计信息;
把资产统计信息存储到资产统计表中。
4.根据权利要求1所述的基于机器学习的离群资产检测方法,其特征在于,所述离群资产算法模型采用K-Means聚类算法,K-Means聚类算法的聚类个数K设置为6,K-Means聚类算法采用的距离函数为欧几里得距离函数。
5.根据权利要求4所述的基于机器学习的离群资产检测方法,其特征在于,所述K-Means聚类算法具体包括:
将需要度量样本之间的距离,用p个资产属性来表示n个样本的数据矩阵如下:
其中,x代表资产统计信息属性的取值,xnp代表第n个资产的第p个属性,资产属性包括资产状态、资产漏洞数、资产告警数和资产访问数;
度量资产之间的相似性采用欧几里得距离函数,具体如下:
其中,d(
6.根据权利要求4所述的基于机器学习的离群资产检测方法,其特征在于,所述步骤S2具体包括:
S21:从资产统计表中随机选取K个资产统计对象作为初始的聚类中心;
S22:分别计算每个资产统计对象到各个聚类中心的距离,将对象分配到距离最近的聚类中;
S23:所有资产统计对象分配完成后,重新计算K个聚类中心;
S24:将本次计算得到的K个聚类中心与前一次计算得到的K个聚类中心比较,判断聚类中心是否发生变化,若是,则转到步骤S22,否则转到步骤S25;
S25:输出聚类结果;
S26:计算每个聚类的正常半径;
S27:从每个聚类中,找出大于正常半径的点,即离群点,并从聚类中剔除,形成不属于任何簇的离群资产信息。
7.根据权利要求6所述的基于机器学习的离群资产检测方法,其特征在于,所述聚类的正常半径为聚类的平均距离与1.5倍标准差之和。
8.根据权利要求1所述的基于机器学习的离群资产检测方法,其特征在于,所述步骤S3包括:
使用预设的离群资产的数据结果进行离群资产信息的整理,形成离群资产;
把离群资产写入离群资产表。
9.一种基于机器学习的离群资产检测系统,其特征在于,包括:
资产数据存储库,用于存储资产基本信息、离群资产信息,以及对资产基本信息进行信息预处理生成的资产统计信息;
计算单元,用于把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息。
10.根据权利要求9所述的基于机器学习的离群资产检测系统,其特征在于,所述资产数据存储库包括:
资产信息存储单元,用于使用资产信息表存储资产信息,资产信息表的数据项包括资产ID、资产名称、资产状态和登记时间;
资产漏洞信息存储单元,用于使用资产漏洞表存储资产的漏洞信息,资产漏洞表的数据项包括主键、资产ID、漏洞类型和漏洞检测时间,资产漏洞表的资产ID与资产信息表的资产ID关联;
资产告警信息存储单元,用于使用资产告警表存储资产的监控告警信息,资产告警表的数据项包括主键、资产ID、告警类型和告警时间,资产告警表的资产ID与资产信息表的资产ID关联;
资产访问信息存储单元,用于使用资产访问表存储资产对外访问或访问该资产的访问信息,资产访问表的数据项包括主键、资产ID、访问类型和访问时间;
资产统计信息存储单元,用于使用资产统计表存储经过预处理的资产统计信息,资产统计表的数据项包括主键、统计日期,资产ID、资产状态、漏洞个数、告警个数、访问次数等,资产统计表的资产ID与资产信息表的资产ID关联;
离群资产信息存储单元,用于使用离群资产表存储经过离群资产算法模型形成的不属于任何簇的离群资产信息,离群资产表的数据项包括主键、资产ID,资产名称、检测时间,异常描述和处置状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中孚安全技术有限公司,未经中孚安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111194965.5/1.html,转载请声明来源钻瓜专利网。