[发明专利]一种深度学习系统的漏洞检测方法和装置有效
申请号: | 201810878887.2 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109190379B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 赵越;郭建敏;姜宇;顾明;孙家广 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 系统 漏洞 检测 方法 装置 | ||
1.一种用于恶意软件检测的深度学习系统的漏洞检测方法,其特征在于,包括:
以最大化神经元覆盖率为导向,从待测深度学习系统中选取并激活若干个神经元;所述待测深度学习系统为恶意软件检测系统,所述若干个神经元构成的路径即程序的路径;
基于所述若干个神经元的张量表达式,以及所述待测深度学习系统的预测差的张量表达式,构建优化函数,并通过最大化所述优化函数获取若干个扰动;其中,所述预测差为所述待测深度学习系统的预设标签中其余标签的概率与原始标签的概率之差;
若所述若干个扰动中任一扰动满足预设条件,则基于所述任一扰动获取检测样本,通过所述检测样本对所述待测深度学习系统的漏洞进行检测;所述检测样本是为引发软件崩溃或宕机所生成的输入;
所述优化函数如下:
式中,obj为所述优化函数,c0为所述原始标签的概率,ci为所述预设标签中任一所述其余标签的概率,nj为任一所述神经元的张量表达式,m+1为所述预设标签的数量,n为所述神经元的数量,λ为超参数。
2.根据权利要求1所述的方法,其特征在于,所述以最大化神经元覆盖率为导向,从待测深度学习系统中选取并激活若干个神经元,具体包括:
基于高权重选取策略,以及高激活频率选取策略、低激活频率选取策略和激活阈值选取策略中的至少一种,从所述待测深度学习系统中选取并激活若干个神经元。
3.根据权利要求2所述的方法,其特征在于,所述基于高权重选取策略,以及高激活频率选取策略、低激活频率选取策略和激活阈值选取策略中的至少一种,从待测深度学习系统中选取并激活若干个神经元,具体包括:
当预设神经元激活数量为n时,分别基于所述高权重选取策略、所述高激活频率选取策略、所述低激活频率选取策略和所述激活阈值选取策略从所述待测深度学习系统中选取n/4个神经元并激活。
4.根据权利要求1所述的方法,其特征在于,所述通过最大化所述优化函数获取若干个扰动,具体包括:
将上一输入与所述上一输入得到的扰动相加更新当前输入;
基于所述当前输入,通过梯度上升算法最大化所述优化函数,得到所述当前输入对应的扰动。
5.根据权利要求4所述的方法,其特征在于,所述若所述若干个扰动中任一扰动满足预设条件,则基于所述任一扰动获取检测样本,通过所述检测样本对所述待测深度学习系统的漏洞进行检测,具体包括:
若所述若干个扰动中任一扰动对应的神经元覆盖率大于所述任一扰动的前一扰动对应的神经元覆盖率,且所述任一扰动的扰动距离小于预设距离阈值,则将所述任一扰动与原始输入相加作为检测样本,并通过所述检测样本对所述待测深度学习系统的漏洞进行检测。
6.根据权利要求5所述的方法,其特征在于,所述通过所述检测样本对所述待测深度学习系统的漏洞进行检测,具体包括:
若将所述检测样本输入至所述待测深度学习系统输出的标签与所述原始标签不同,则所述检测样本为对抗样本;
否则,将所述检测样本更新为所述原始输入,返回执行所述以最大化神经元覆盖率为导向,从待测深度学习系统中选取并激活若干个神经元的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810878887.2/1.html,转载请声明来源钻瓜专利网。