[发明专利]一种基于朴素贝叶斯的安卓恶意应用的检测方法及装置有效
申请号: | 201910212100.3 | 申请日: | 2019-03-20 |
公开(公告)号: | CN110008700B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 文伟平;李经纬 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 朴素 贝叶斯 恶意 应用 检测 方法 装置 | ||
1.一种基于朴素贝叶斯的安卓恶意应用检测方法,其特征是,首先构建加权的朴素贝叶斯检测模型;再根据加权的朴素贝叶斯检测模型对待检测的安卓应用进行分类,识别该待检测应用是否为恶意应用;
构建加权的朴素贝叶斯检测模型包括步骤1~步骤3:
步骤1,对训练样本集中的正常应用或恶意应用文件进行解析,提取其中的静态特征;
步骤2,对提取出来的静态特征采用特征归约方法进行处理,得到精简后的特征集合T,并基于特征集合T中的特征,对训练样本集提取得到特征矩阵;特征矩阵中每个元素表示为aij,取值为0或1;当取值为0时表示第i个应用中不存在第j个特征,当取值为1时表示第i个应用中存在第j个特征;所述特征归约方法包括基于区分度的特征规约;
所述基于区分度的特征规约,通过去除恶意应用中区分度小于区分度阈值的特征,由此减少需提取的特征数量;
设恶意应用样本总量为M,正常应用的样本总量为B,具有特征fi的恶意应用样本数量为Mi,具有特征fi的恶意应用样本数量为Bi;
特征fi在恶意应用中出现的频率:FMi=Mi/M;在正常应用中出现的频率为FBi=Bi/B;
将区分度Diff(fi)表示为:
Diff(fi)=1-min{FMi,FBi}/max{FMi,FBi}
其中,Diff(fi)取值为[0,1];
步骤3,将特征矩阵作为检测模型训练的输入,训练加权的朴素贝叶斯检测模型,得到训练好的加权的朴素贝叶斯检测模型;即通过统计得到每个特征属性在正常应用样本中出现的频率P(f1|Benignware),P(f2|Benignware),...,P(fn|Benignware)和在恶意应用样本中出现的频率P(f1|Malware),P(f2|Malware),...,P(fn|Malware);其中,n为训练样本集中特征属性的数量;
步骤4,对待检测安卓应用文件进行解析,提取静态特征,包括:权限信息、组件信息、API调用信息;
步骤5,将所获取的静态特征形成特征向量,输入加权的朴素贝叶斯检测模型中,分别采用式1和式2计算得到待检测安卓应用为正常应用的概率和待检测安卓应用为恶意应用的概率;
其中,P(Benignware)为待检测应用为正常应用的概率;P(Malware)为待检测应用为恶意应用的概率;Diff(fi)为特征fi的区分度权重;P(fi|Benignware)为特征Fi在训练集的正常样本中出现的频率;P(fi|Malware)为特征Fi在训练集的恶意样本中出现的频率;
步骤6,通过比较待检测安卓应用为正常应用和恶意应用的概率,将其识别为正常应用或恶意应用;当待检测应用为正常应用的概率P(Benignware)大于待检测应用为恶意应用的概率P(Malware)时,则将该待检测应用识别为正常应用;当待检测应用为正常应用的概率P(Benignware)小于该待检测应用为恶意应用的概率P(Malware)时,则将该应用识别为恶意应用;
通过上述步骤,实现基于朴素贝叶斯的安卓恶意应用检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910212100.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:病毒检测方法及装置
- 下一篇:一种医疗软件许可文件的回收方法及系统