[发明专利]一种基于机器学习的离群资产检测方法及系统在审
申请号: | 202111194965.5 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113641682A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 韩旭东;曲志峰;张胜猛;高峰 | 申请(专利权)人: | 中孚安全技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06K9/62;G06N20/00 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 赵阳 |
地址: | 250101 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 离群 资产 检测 方法 系统 | ||
本发明提出的一种基于机器学习的离群资产检测方法及系统,所述方法包括:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中;把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息;把离群资产信息写入离群资产表。本发明能够通过基于机器学习的聚类算法对待检测资产数据集进行聚合,将不属于任何簇的资产对象判定为资产数据集中的离群点,从而得到离群资产,结合人工判定及时解除资产风险。
技术领域
本发明涉及数据处理技术领域,更具体的说是涉及一种基于机器学习的离群资产检测方法及系统。
背景技术
随着电子政务与信息化融合日益深化,网络和业务系统已经成为各种机构日常办公、办事的基础设施,而承载业务系统的服务器、日常办公用的终端以及保障组织内部信息安全的安全设备,它们作为组织的有形资产,长期稳定运行是业务顺利开展的基本保障。
虽然传统的监控软件在发现设备故障、运行异常等方面确实起到了一定的作用,但现有的监控软件只能发现故障和运行异常的设备资产,在设备资产在正常运行情况下无法及时发现异常,存在明显的监控盲点。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于机器学习的离群资产检测方法及系统,能够通过基于机器学习的聚类算法对待检测资产数据集进行聚合,将不属于任何簇的资产对象判定为资产数据集中的离群点,从而得到离群资产,结合人工判定及时解除资产风险。
本发明为实现上述目的,通过以下技术方案实现:
一种基于机器学习的离群资产检测方法,包括如下步骤:
S1:对资产基本信息进行预处理,形成资产统计信息,并存储到资产统计表中;
S2:把资产统计信息作为离群资产算法模型的输入信息,应用离群资产算法模型,生成不属于任何簇的离群资产信息;
S3:把离群资产信息写入离群资产表。
进一步,所述资产基本信息包括:
资产信息、资产漏洞信息、资产告警信息和资产访问信息。
进一步,所述步骤S1具体为:
对资产信息、资产漏洞信息、资产告警信息、资产访问信息基于资产ID进行关联;基于资产ID和资产状态分组聚合生成资产统计信息;
把资产统计信息存储到资产统计表中。
进一步,所述离群资产算法模型采用K-Means聚类算法,K-Means聚类算法的聚类个数K设置为6,K-Means聚类算法采用的距离函数为欧几里得距离函数。
进一步,所述K-Means聚类算法具体包括:
将需要度量样本之间的距离,用p个资产属性来表示n个样本的数据矩阵如下:
其中,x代表资产统计信息属性的取值,xnp代表第n个资产的第p个属性,资产属性包括资产状态、资产漏洞数、资产告警数和资产访问数;
度量资产之间的相似性采用欧几里得距离函数,具体如下:
其中,d(
进一步,所述步骤S2具体包括:
S21:从资产统计表中随机选取K个资产统计对象作为初始的聚类中心;
S22:分别计算每个资产统计对象到各个聚类中心的距离,将对象分配到距离最近的聚类中;
S23:所有资产统计对象分配完成后,重新计算K个聚类中心;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中孚安全技术有限公司,未经中孚安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111194965.5/2.html,转载请声明来源钻瓜专利网。