[发明专利]一种恶意代码家族聚类方法和系统有效
申请号: | 201910565940.8 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110458187B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 杨航锋;李树栋;吴晓波;韩伟红;范美华;付潇鹏;方滨兴;田志宏;殷丽华;顾钊铨;李默涵;仇晶;唐可可 | 申请(专利权)人: | 广州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/56 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种恶意代码家族聚类方法及系统,方法包括采用T‑SNE算法对原始恶意代码执行序列进行降维可视化,具体为:使用T‑SNE算法对每个数据点近邻的分布进行建模,其中近邻是指相互靠近数据点的集合;构建模型,通过非线性函数变换将数据点映射到相应概率分布上;对构建的模型进行训练,通过计算低维空间的条件概率,从而计算损失函数的梯度;使用K‑means算法对恶意代码家族进行聚类,具体为:确定分类个数K和聚类中心;通过计算对象与聚类中心的距离对所有对象进行簇划分;重新计算新的聚类中心,判断是否满足条件。系统包括降维可视化模块和聚类模块。通过本发明不仅降低了如何确定K‑means算法中k的难题,还提高了恶意代码家族聚类的准确性。 | ||
搜索关键词: | 一种 恶意代码 家族 方法 系统 | ||
【主权项】:
1.一种恶意代码家族聚类方法,其特征在于,包括下述步骤:/n采用T-SNE算法对原始恶意代码执行序列进行降维可视化,具体包括下述步骤:/n使用T-SNE算法对每个数据点近邻的分布进行建模,其中近邻是指相互靠近数据点的集合;/n构建模型,通过非线性函数变换将数据点映射到相应概率分布上;/n对构建的模型进行训练,通过计算低维空间的条件概率,从而计算损失函数的梯度;/n使用K-means算法对恶意代码家族进行聚类,具体包括下述步骤:/n确定分类个数K和聚类中心;/n通过计算对象与聚类中心的距离对所有对象进行簇划分;/n重新计算新的聚类中心,判断是否满足中心点不再改变的条件,如果不满足,则返回通过计算对象与聚类中心的距离对所有对象进行簇划分的步骤,如果满足,则找到聚类中心点。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910565940.8/,转载请声明来源钻瓜专利网。