[发明专利]移动终端应用的分类和检测方法在审
申请号: | 201711469132.9 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108197474A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 王伟;马君丽;解男男;刘吉强;韩臻 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 分类算法 应用 分类结果 移动终端应用 分类 检测 特征向量 单一分类 多分类器 分类性能 人工成本 人工审核 输出 有效地 投票 算法 表决 开发 | ||
1.一种移动终端应用的分类和恶意检测方法,其特征在于,包括:
提取出应用样本的特征向量,将所述应用样本的特征向量分别输入到各种分类算法中;
每种分类算法分别输出所述应用样本为恶意应用或者正常应用的分类结果,将各种分类算法输出的分类结果进行投票表决处理,得到应用样本最终的分类结果。
2.根据权利要求1所述的移动终端应用的分类和检测方法,其特征在于,所述的提取出应用样本的特征向量,包括:
采用静态分析方法对各个应用样本的.apk文件进行分析,提取应用样本的11个类型的特征,所述11个类型包括申请权限、过滤匹配Intent、受限制API调用、应用组件名、与代码相关的特征、证书信息、Payload信息、字符串特征、使用的权限、硬件特征和可疑API调用,每个类型的特征包含了多个子特征,将所有类型的特征组成特征集合;
将所述特征集合格式化处理成向量格式,得到应用样本的特征向量集合,每一个特征向量代表一个应用样本,每个样本用其apk文件的SHA-1值作为唯一标识,每个特征向量中包含应用样本的分类标签和特征信息。
3.根据权利要求2所述的移动终端应用的分类和检测方法,其特征在于,所述的将所述应用样本的特征向量分别输入到各种分类算法中,包括:
将所述应用样本的特征向量分别输入到支持向量机、随机森林、K近邻、分类回归树和朴素贝叶斯共5种常用的分类算法中。
4.根据权利要求3所述的移动终端应用的分类和检测方法,其特征在于,所述的每种分类算法分别输出应用样本为恶意应用或者正常应用的分类结果,将各种分类算法输出的分类结果进行投票表决处理,得到应用样本最终的分类结果,包括:
所述支持向量机、随机森林、K近邻、分类回归树和朴素贝叶斯分类算法分别输出应用样本为正常应用样本或者恶意应用样本的分类结果,将这5种分类算法的分类结果进行投票表决处理,得到应用样本最终的分类结果。
5.根据权利要求4所述的移动终端应用的分类和检测方法,其特征在于,所述的方法还包括:
从第三方应用市场采集不同类别的移动终端的应用样本,用采集的应用样本数据构成应用样本数据集;
通过VirusTotal对所述应用样本数据集中存储的应用样本进行扫描,将其中杀毒软件报警数目少于2个的应用样本标定为正常,将杀毒软件报警数目大于或等于2个的样本标定为恶意。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711469132.9/1.html,转载请声明来源钻瓜专利网。