[发明专利]一种基于近邻传播聚类算法的多步异常点检测方法有效

专利信息
申请号: 201910452071.8 申请日: 2019-05-28
公开(公告)号: CN110162975B 公开(公告)日: 2022-10-25
发明(设计)人: 朱会娟;冯霞;王良民;黎洋;顾伟;曹晓雯;房浩 申请(专利权)人: 江苏大学
主分类号: G06F21/56 分类号: G06F21/56;G06K9/62
代理公司: 南京华恒专利代理事务所(普通合伙) 32335 代理人: 宋方园
地址: 212000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于近邻传播聚类算法的多步异常点检测方法,通过挖掘正常应用程序以获取到正常数据流模式,然后采用多步异常点检测方法来检测恶意软件,最终实现不依赖已知恶意软件模型可以在Android恶意软件出现初期做到有效预警的目的。本发明可有效解决异常点检测时所面临的“维数灾难”问题,从而避免冗余特征或过多的无关特征的数据噪音对异常点检测技术的干扰;同时克服传统的基于聚类或基于距离的异常点检测技术对初始值选择的过度依赖,通过Virusshare与Google Play获取的实际数据集结合十折交叉验证法验证本发明的有效性,综上,本发明在网络安全领域具有广阔的应用前景。
搜索关键词: 一种 基于 近邻 传播 算法 异常 检测 方法
【主权项】:
1.一种基于近邻传播聚类算法的多步异常点检测方法,其特征在于:包括以下步骤:步骤1、从Android官方网站Google Play获取正常Android应用程序,并从病毒数据样本库中获取恶意App,构建应用程序App样本集,该样本集中包括正常样本和恶意样本分别为训练集和测试集;步骤2、使用FLOWDROID工具提取样本集中的数据流,从而构造数据流频率的高维数据集X=(x1,x2,...,xn)∈Rm×n,m是指统计出来的数据流个数,即数据集的原始特征维度,n表示样本集中样本的数量;步骤3、以数据流为特征构建特征向量,将每个样本App中调用对应数据流特征的频率作为特征值,若该样本App没有调用某个数据流的对应特征值则标记为0;步骤4、采用EsttSNE降维技术对步骤3的高维数据进行降维;步骤5、划分App样本入13个涉及到用户敏感信息的子类;步骤6、对于每一个子类中取部分正常App采用近临传播算法AP进行聚类,即将App划分为不同的主题来挖掘该类主题的正常模式,并计算该主题的参考点;步骤7、采用NPOD方法计算候样本集的异常得分,即依据步骤6计算到的13组参考点集合计算候选App在这13个子类中的异常得分,如果App没有划分入对应的子类则其异常得分标记为0,并构建异常得分向量;步骤8、采用预先划分好的训练集训练1SVM分类器模型;步骤9、采用预先划分好的测试集,然后通过步骤8训练出的1SVM分类器来对Android应用程序是否为恶意软件进行预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910452071.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top