[发明专利]识别恶意文件的方法、装置、电子设备及存储介质在审
申请号: | 201910619922.3 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110363000A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 朱学文;罗丹 | 申请(专利权)人: | 深圳市腾讯网域计算机网络有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F21/60;G06F17/16 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 李镇江 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 待识别文件 恶意文件 元素集合 向量 元素矩阵 组合向量 索引 存储介质 电子设备 识别文件 数据分组 摘要对比 预设 | ||
1.一种识别恶意文件的方法,其特征在于,所述方法包括:
根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵;
基于所述待识别文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述待识别文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,其中,第一类元素集合、第二类元素集合是根据预定元素划分规则对所述待识别文件元素矩阵中的元素进行划分确定的;
对各第一类元素集合的第一向量的组合向量求摘要,得到所述待识别文件的第一摘要;
对各第二类元素集合的第二向量的组合向量求摘要,得到所述待识别文件的第二摘要;
对待识别文件的第一摘要和第二摘要的组合向量求摘要,得到所述待识别文件的索引摘要;
将所述待识别文件的索引摘要与预设恶意文件库中恶意文件的索引摘要对比,从而确定所述待识别文件是否为恶意文件。
2.根据权利要求1所述的方法,其特征在于,预设恶意文件库中恶意文件的索引摘要预先通过以下方式获得:
根据预定数据分组规则对恶意文件的数据分组,分成的每一组数据作为恶意文件元素矩阵中的一个元素,组成恶意文件元素矩阵;
基于所述恶意文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述恶意文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,其中,第一类元素集合、第二类元素集合是根据预定元素划分规则对所述恶意文件元素矩阵中的元素进行划分确定的;
对各第一类元素集合的第一向量的组合向量求摘要,得到所述恶意文件的第一摘要;
对各第二类元素集合的第二向量的组合向量求摘要,得到所述恶意文件的第二摘要;
对恶意文件的第一摘要和第二摘要的组合向量求摘要,得到所述恶意文件的索引摘要。
3.根据权利要求1所述的方法,其特征在于,所述待识别文件的数据包括待识别文件的二进制表示中的字节,所述根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵,包括:
从所述待识别文件的二进制表示中按顺序将每预定数目个字节,作为一个元素取出,按自上而下、从左到右的顺序填入预设矩阵宽度的空白矩阵中。
4.根据权利要求1所述的方法,其特征在于,所述待识别文件的数据包括待识别文件的字符,所述根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵,包括:
从所述待识别文件中按顺序将预定数目个字符,并转换成比特串作为一个元素取出,按自上而下、从左到右的顺序填入预设矩阵宽度的空白矩阵中。
5.根据权利要求3或4所述的方法,其特征在于,在按自上而下、从左到右的顺序填入预设矩阵宽度的空白矩阵中之后,所述方法还包括:
如果对于所述待识别文件,所有元素已取出完毕,在所述空白矩阵中未填充的位置填入预定占位符。
6.根据权利要求1所述的方法,其特征在于,在根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵之后,所述方法还包括:
在待识别文件元素矩阵中引入第一混淆因子,所述第一混淆因子包括以下中的至少一项:
待识别文件元素矩阵中每个元素后拼接的预设比特;
在待识别文件元素矩阵中预定行数位置增加的预设的元素行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯网域计算机网络有限公司,未经深圳市腾讯网域计算机网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910619922.3/1.html,转载请声明来源钻瓜专利网。