[发明专利]一种基于机器学习的安卓恶意程序检测方法有效
申请号: | 201810116416.8 | 申请日: | 2018-02-06 |
公开(公告)号: | CN108304720B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 何春凤;崔渊博;聂嘉贺;阿曼太;王宇;金红;杨满智;刘长永 | 申请(专利权)人: | 恒安嘉新(北京)科技股份公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 恶意程序 检测 方法 | ||
1.一种基于机器学习的安卓恶意程序检测方法,其特征在于,所述方法包括:
从样本库中对黑白样本进行特征提取;
使用样本集训练模型,样本包括黑样本和白样本;
待检测程序提取特征后通过训练的好的模型进行识别,若识别为黑样本,则对该样本进行家族分类,如识别为白样本,则进行异常检测,判别是否是新的恶意样本;
将识别结果反馈至样本库保存;
对黑白样本进行特征提取的方法包括:
静态特征向量提取和动态特征向量提取;其中,
所述静态特征向量提取包括:
行为特征提取和权限特征提取;
将提取到的静态的行为特征、静态的权限特征和动态特征构成一条特征向量;其中,提取有183个静态特征,包括54个行为特征和129个权限特征,以及提取有77个动态特征,构建一个包含260个特征的特征向量;所述动态特征向量的提取通过基于定制ROM的动态沙箱来检测获取,所述动态沙箱分别在应用层、框架层、运行环境层及内核层加入检测代码,并编译生成系统镜像,然后和载入的样本共同写入虚拟机或真机,并输出结果。
2.如权利要求1所述的基于机器学习的安卓恶意程序检测方法,其特征在于,所述行为特征提取的方法包括:使用API引擎,采用静态分析方法获取函数调用和命令,获取静态的行为特征;所述权限特征提取的方法包括:对AndriodManifest.xml配置文件进行分析,获取静态的APP权限特征。
3.如权利要求1所述的基于机器学习的安卓恶意程序检测方法,其特征在于,提取的所述动态特征包括:使用模拟器获取宏观行为特征、API调用特征、Dalvik指令特征、系统调用特征、ARM指令特征,其中,宏观行为特征模拟基于应用程序的攻击、API调用特征和Dalvik指令特征模拟基于系统核心程序的攻击、系统调用特征模拟基于linux内核的攻击、ARM指令特征模拟基于硬件的特征。
4.如权利要求1所述的恶意程序检测方法,其特征在于,还包括在线更新模型的过程,使用引擎中识别错误的样本,添加到原来的样本重新训练新的模型,在新的模型召回率和准确率都满足条件的时候替换掉原来的模型。
5.如权利要求1所述的恶意程序检测方法,其特征在于,所述模型训练采用xgboost算法。
6.如权利要求1所述的恶意程序检测方法,其特征在于,所述异常检测采用IsolationForest算法。
7.如权利要求1所述的恶意程序检测方法,其特征在于,对黑样本进行家族的分类采用卷积神经网络和K-means算法综合实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒安嘉新(北京)科技股份公司,未经恒安嘉新(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810116416.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:Android恶意代码分析与检测算法
- 下一篇:一种恶意代码检测系统