[发明专利]基于RASP的机器学习模型安全检测方法有效
申请号: | 202110557257.7 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113468524B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 王劲松;张锐钊;张洪豪;卜超 | 申请(专利权)人: | 天津理工大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06N20/00 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300384 天津市南*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 rasp 机器 学习 模型 安全 检测 方法 | ||
1.一种基于RASP的机器学习模型安全检测方法,其特征在于:所述的基于RASP的机器学习模型安全检测方法包括按顺序进行的下列步骤:
1)收集已有的多个恶意代码样本,对所有恶意代码样本进行分类、对比并查找出相同的字符和数字,然后根据字符和数字出现的规律按照规则转换为规则表达式,之后将规则表达式进行存储而构建成用于静态检测机器学习模型文件的规则库;
2)将上述规则库中的规则表达式与待检测的机器学习模型文件的内容进行匹配,如果匹配成功,则判定该机器学习模型文件为恶意文件并结束运行,否则进入下一步骤;
3)建立监听集合,从上述多个恶意代码样本中提取出敏感函数和敏感类作为监听对象并记录到监听集合中;设置处理中心,选择检测方法以及各个危险等级的处理策略,并配置白名单或黑名单,建立参数规则库;创建监听函数,在监听集合中插入监听函数而形成监听点,设置执行虚拟机的跟踪功能而对待检测的机器学习模型文件进行跟踪,获得的跟踪数据由处理中心记录到日志文件中,由此构建成监测环境;
4)运行待检测的机器学习模型文件并检测,如果待检测的机器学习模型文件中调用了上述监听集合中插入有监听函数的敏感函数或敏感类,监听函数将收集监听数据并转发至处理中心,由处理中心进行处理;
5)待检测的机器学习模型文件运行结束后,对由步骤3)获得的跟踪数据和步骤4)获得的监听数据进行处理,得到特征数据;
6)建立恶意代码检测模型,然后将上述特征数据输入恶意代码检测模型中进行预测,最后由恶意代码检测模型输出预测结果;
7)如果恶意代码检测模型输出的预测结果是待检测的机器学习模型文件为恶意文件,更新恶意代码样本,同时更新规则库,结束运行。
2.根据权利要求1所述的基于RASP的机器学习模型安全检测方法,其特征在于:在步骤1)中,所述收集已有的多个恶意代码样本,对所有恶意代码样本进行分类、对比并查找出相同的字符和数字,然后根据字符和数字出现的规律按照规则转换为规则表达式,之后将规则表达式进行存储而构建成用于静态检测机器学习模型文件的规则库的具体步骤如下:
101)收集已有的多个恶意代码样本Sm;
102)将上述多个恶意代码样本Sm按代码相似或功能相似的原则进行分类,然后对比同一类中的恶意代码样本Sm,寻找出该类每个恶意代码样本Sm中都存在的一些字符和数字Lm或者在同一位置出现的有限的字符和数字Lm并记录;
103)根据字符和数字Lm出现的规律按照规则转换为程序可解析的规则表达式L_Exp;
104)将所有规则表达式L_Exp进行存储而构建成规则库DL。
3.根据权利要求1所述的基于RASP的机器学习模型安全检测方法,其特征在于:在步骤2)中,所述将上述规则库中的规则表达式与待检测的机器学习模型文件的内容进行匹配的具体步骤如下:
201)加载待检测的机器学习模型文件F;
202)从上述规则库DL中顺序加载一个规则表达式L_Exp;
203)使用该规则表达式L_Exp不回溯地搜索匹配待检测的机器学习模型文件F的整个内容;
204)如果待检测的机器学习模型文件F中存在符合该规则表达式L_Exp的逻辑内容,则结束匹配过程,否则重复步骤202)—步骤204),直到所有规则表达式L_Exp匹配一遍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110557257.7/1.html,转载请声明来源钻瓜专利网。