[发明专利]一种信息处理方法、设备、系统和计算机可读存储介质在审
申请号: | 201911286142.8 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111159111A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 樊谦君 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 贾伟;张颖玲 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 设备 系统 计算机 可读 存储 介质 | ||
本发明实施例公开了一种信息处理方法,所述方法包括:获取文件行为样本数据;其中,所述文件行为样本数据包括第一类型文件被操作时的第一数据和第二类型文件在被操作时的第二数据;基于所述文件行为样本数据,确定文件分类模型的信息处理参数;基于确定所述信息处理参数的所述文件分类模型,执行文件分类过程。本发明还公开了一种信息处理设备、系统和计算机可读存储介质。本发明可以快速实现恶意文件和非恶意文件的分类。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息处理方法、设备、系统和计算机可读存储介质。
背景技术
随着网络数据的广泛共享和快速传播,网络数据安全隐患,尤其从网络下载得到的、需要在本地操作的文件的安全性也日益严峻。为了检测下载到本地的文件的安全性,相对技术中,通常会采用哈希黑白名单、或者基于启发式规则的检测方法对文件进行分析。然而,文件的哈希值在文件被改动之后就会发生变化,基于启发式规则的检测方法,需要依赖于人工提取某一类文件的静态特征。因此,哈希黑白名单的文件检测方法,在文件发生微小改变时就会显得无能为力,基于启发式规则的检测方法,无法检测更广泛类别的文件,所以,以上两种文件检测方法,均无法实现恶意文件和非恶意文件的快速分类检测。
发明内容
有鉴于此,本发明提供了一种信息处理方法、设备、系统和计算机可读存储介质,基于文件被操作后获取的动态数据执行文件分类,从而可以快速实现恶意文件和非恶意文件的分类。
本发明的方案是这样的:
一种信息处理方法,所述方法包括:
获取文件行为样本数据;其中,所述文件行为样本数据包括第一类型文件被操作时的第一数据和第二类型文件在被操作时的第二数据;所述第一数据和所述第二数据是不同类型的文件行为数据;
基于所述文件行为样本数据,确定文件分类模型的信息处理参数;
基于确定所述信息处理参数的所述文件分类模型,对目标文件执行文件分类过程。
可选的,所述获取文件行为样本数据,包括:
加载所述第一类型文件以及所述第二类型文件至文件行为解析环境中;
在所述文件行为解析环境中操作所述第一类型文件以及所述第二类型文件,得到所述文件行为样本数据。
可选的,所述在所述文件行为解析环境中操作所述第一类型文件以及所述第二类型文件,得到所述文件行为样本数据,包括:
在所述文件解析环境中操作所述第一类型文件以及所述第二类型文件,得到文件行为数据信息;
对所述文件行为数据信息执行文件行为提取操作,得到所述文件行为样本数据;其中,所述文件行为数据信息包括文件路径提取,和/或,命令行提取。
可选的,所述基于所述文件行为样本数据,确定文件分类模型的信息处理参数,包括:
将所述文件行为样本数据输入至所述文件分类模型中,得到文件分类结果;
基于所述文件行为样本数据以及所述文件分类结果,确定所述文件分类模型的所述信息处理参数。
可选的,所述基于所述文件行为样本数据以及所述文件分类结果,确定所述文件分类模型的所述信息处理参数,包括:
基于所述文件行为样本数据,得到第一文件类型参数;
基于所述文件分类结果,得到第二文件类型参数;
基于所述第一文件类型参数与所述第二文件类型参数的匹配关系,调整所述文件分类模型的参数,得到所述信息处理参数。
可选的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911286142.8/2.html,转载请声明来源钻瓜专利网。