[发明专利]一种信息处理方法、设备、系统和计算机可读存储介质在审

申请号：	201911286142.8	申请日：	2019-12-13
公开（公告）号：	CN111159111A	公开（公告）日：	2020-05-15
发明（设计）人：	樊谦君	申请（专利权）人：	深信服科技股份有限公司
主分类号：	G06F16/16	分类号：	G06F16/16
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	贾伟;张颖玲
地址：	518055 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信息处理方法设备系统计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种信息处理方法，所述方法包括：获取文件行为样本数据；其中，所述文件行为样本数据包括第一类型文件被操作时的第一数据和第二类型文件在被操作时的第二数据；基于所述文件行为样本数据，确定文件分类模型的信息处理参数；基于确定所述信息处理参数的所述文件分类模型，执行文件分类过程。本发明还公开了一种信息处理设备、系统和计算机可读存储介质。本发明可以快速实现恶意文件和非恶意文件的分类。

技术领域

本发明涉及信息处理技术领域，尤其涉及一种信息处理方法、设备、系统和计算机可读存储介质。

背景技术

随着网络数据的广泛共享和快速传播，网络数据安全隐患，尤其从网络下载得到的、需要在本地操作的文件的安全性也日益严峻。为了检测下载到本地的文件的安全性，相对技术中，通常会采用哈希黑白名单、或者基于启发式规则的检测方法对文件进行分析。然而，文件的哈希值在文件被改动之后就会发生变化，基于启发式规则的检测方法，需要依赖于人工提取某一类文件的静态特征。因此，哈希黑白名单的文件检测方法，在文件发生微小改变时就会显得无能为力，基于启发式规则的检测方法，无法检测更广泛类别的文件，所以，以上两种文件检测方法，均无法实现恶意文件和非恶意文件的快速分类检测。

发明内容

有鉴于此，本发明提供了一种信息处理方法、设备、系统和计算机可读存储介质，基于文件被操作后获取的动态数据执行文件分类，从而可以快速实现恶意文件和非恶意文件的分类。

本发明的方案是这样的：

一种信息处理方法，所述方法包括：

获取文件行为样本数据；其中，所述文件行为样本数据包括第一类型文件被操作时的第一数据和第二类型文件在被操作时的第二数据；所述第一数据和所述第二数据是不同类型的文件行为数据；

基于所述文件行为样本数据，确定文件分类模型的信息处理参数；

基于确定所述信息处理参数的所述文件分类模型，对目标文件执行文件分类过程。

可选的，所述获取文件行为样本数据，包括：

加载所述第一类型文件以及所述第二类型文件至文件行为解析环境中；

在所述文件行为解析环境中操作所述第一类型文件以及所述第二类型文件，得到所述文件行为样本数据。

可选的，所述在所述文件行为解析环境中操作所述第一类型文件以及所述第二类型文件，得到所述文件行为样本数据，包括：

在所述文件解析环境中操作所述第一类型文件以及所述第二类型文件，得到文件行为数据信息；