[发明专利]一种基于近邻传播聚类算法的多步异常点检测方法有效

申请号：	201910452071.8	申请日：	2019-05-28
公开（公告）号：	CN110162975B	公开（公告）日：	2022-10-25
发明（设计）人：	朱会娟;冯霞;王良民;黎洋;顾伟;曹晓雯;房浩	申请（专利权）人：	江苏大学
主分类号：	G06F21/56	分类号：	G06F21/56;G06K9/62
代理公司：	南京华恒专利代理事务所(普通合伙) 32335	代理人：	宋方园
地址：	212000 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于近邻传播聚类算法的多步异常点检测方法，通过挖掘正常应用程序以获取到正常数据流模式，然后采用多步异常点检测方法来检测恶意软件，最终实现不依赖已知恶意软件模型可以在Android恶意软件出现初期做到有效预警的目的。本发明可有效解决异常点检测时所面临的“维数灾难”问题，从而避免冗余特征或过多的无关特征的数据噪音对异常点检测技术的干扰；同时克服传统的基于聚类或基于距离的异常点检测技术对初始值选择的过度依赖，通过Virusshare与Google Play获取的实际数据集结合十折交叉验证法验证本发明的有效性，综上，本发明在网络安全领域具有广阔的应用前景。
搜索关键词：	一种基于近邻传播算法异常检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于近邻传播聚类算法的多步异常点检测方法，其特征在于：包括以下步骤：步骤1、从Android官方网站Google Play获取正常Android应用程序，并从病毒数据样本库中获取恶意App，构建应用程序App样本集，该样本集中包括正常样本和恶意样本分别为训练集和测试集；步骤2、使用FLOWDROID工具提取样本集中的数据流，从而构造数据流频率的高维数据集X＝(x₁,x₂,...,x_n)∈R^m×n，m是指统计出来的数据流个数，即数据集的原始特征维度，n表示样本集中样本的数量；步骤3、以数据流为特征构建特征向量，将每个样本App中调用对应数据流特征的频率作为特征值，若该样本App没有调用某个数据流的对应特征值则标记为0；步骤4、采用EsttSNE降维技术对步骤3的高维数据进行降维；步骤5、划分App样本入13个涉及到用户敏感信息的子类；步骤6、对于每一个子类中取部分正常App采用近临传播算法AP进行聚类，即将App划分为不同的主题来挖掘该类主题的正常模式，并计算该主题的参考点；步骤7、采用NPOD方法计算候样本集的异常得分，即依据步骤6计算到的13组参考点集合计算候选App在这13个子类中的异常得分，如果App没有划分入对应的子类则其异常得分标记为0，并构建异常得分向量；步骤8、采用预先划分好的训练集训练1SVM分类器模型；步骤9、采用预先划分好的测试集，然后通过步骤8训练出的1SVM分类器来对Android应用程序是否为恶意软件进行预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江苏大学，未经江苏大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910452071.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于近邻传播聚类算法的多步异常点检测方法有效

专利文献下载