[发明专利]基于机器学习的Android权限提升漏洞检测方法及系统有效
申请号: | 201811013176.5 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109255241B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 张文;邵帅;崔浩亮;姜鑫;李若影 | 申请(专利权)人: | 国鼎网络空间安全技术有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06F21/56 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 孙民兴 |
地址: | 100192 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 android 权限 提升 漏洞 检测 方法 系统 | ||
1.一种基于机器学习的Android权限提升漏洞检测方法,其特征在于,包括:
解析Android APK文件信息,提取包含完整APK信息的APK特征集;
所述APK特征集包括Android应用基础特征和应用代码特征,所述Android应用基础特征包括AndroidManifest.xml文件标签特征和权限特征,所述应用代码特征包括smali文件中的方法及系统API;
通过分析漏洞原理,从APK特征集中选择与权限提升漏洞相关的相关特征集,所述相关特征集包括系统权限和系统API;对相关特征集进行特征清洗和量化,转化为样本特征集;
将样本特征集输入到机器学习算法中,得到分类模型;
相关特征集在特征清洗和量化之前,还包括:
通过词袋法将系统权限和系统API转换成可用于特征量化的形式;
通过词袋法将系统API转换成可用于特征量化的形式之前,还包括:
将系统API按照其归属的功能类进行聚类,再将聚类结果作为API特征几何取值集合,系统API聚类完成后,通过统计代码特征中属于某一类的系统API出现次数,作为API的特征维度值;
特征清洗为缺失值处理,缺失值小于30%的维度可根据该维度的其它取值拟合缺失值,缺失值数量大于30%则表示该特征为无效特征,去除该维度;
样本特征集输入到机器学习算法中得到分类模型的方法为:
机器学习算法采用分类算法,将输入的样本特征集划分为训练集和验证集,训练集样本用于训练分类模型,验证集样本用于验证模型的泛化程度;
完成模型训练后,需根据模型在验证集上的表现调整算法中的参数,比较不同参数下的评估结果,选择评估结果最优的模型作为分类模型。
2.如权利要求1所述的基于机器学习的Android权限提升漏洞检测方法,其特征在于,特征量化为将清洗后的特征量化为供机器学习算法的数值或向量形式。
3.如权利要求2所述的基于机器学习的Android权限提升漏洞检测方法,其特征在于,特征量化的方式可根据特征类型分为数值特征的量化、类型特征的量化和文本特征的量化。
4.如权利要求2所述的基于机器学习的Android权限提升漏洞检测方法,其特征在于,采用哑编码的方式将系统权限转为向量的形式;
系统API维度的统计数据为连续数值的形式,其直接作为维度特征输入到机器学习算法中。
5.一种用于实现如权利要求1-4中任一项所述的基于机器学习的Android权限提升漏洞检测方法的检测系统,其特征在于,包括:
特征提取模块,用于解析Android APK文件信息,提取包含完整APK信息的APK特征集;
特征处理模块,用于通过分析漏洞原理,从APK特征集中选择与权限提升漏洞相关的相关特征集,对相关特征集进行特征清洗和量化,转化为样本特征集;所述相关特征集包括系统权限和系统API;
训练模块,用于将样本特征集输入到机器学习算法中,得到分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国鼎网络空间安全技术有限公司,未经国鼎网络空间安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811013176.5/1.html,转载请声明来源钻瓜专利网。