[发明专利]一种Webshell检测方法及装置在审
申请号: | 202210435197.6 | 申请日: | 2022-04-24 |
公开(公告)号: | CN114662109A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 李治霖;郭煚;黄龙 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F8/41;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘熔;董骁毅 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 webshell 检测 方法 装置 | ||
1.一种Webshell检测方法,其特征在于,所述方法包括:
获取待检测的PHP源文件;
将所述待检测的PHP源文件经过编译处理,得到所述待检测的PHP源文件对应的opcode序列;
将所述待检测的PHP源文件对应的opcode序列中的opcode按照词频进行排序后,进行词向量转化,得到所述待检测的PHP源文件对应的输入特征矩阵;
将所述待检测的PHP源文件对应的输入特征矩阵输入Webshell检测模型,输出Webshell检测结果;
其中,所述Webshell检测模型是基于PHP源文件样本训练后获得的,所述PHP源文件样本包括PHP源文件和对应的标签。
2.根据权利要求1所述的Webshell检测方法,其特征在于,将所述待检测的PHP源文件经过编译处理,得到所述待检测的PHP源文件对应的opcode序列,包括:
通过词法分析将所述待检测的PHP源文件分割为PHP片段;
对所述PHP片段进行语法分析,生成抽象语法树;
将所述抽象语法树静态解析为opcode,得到所述待检测的PHP源文件对应的opcode序列。
3.根据权利要求1所述的Webshell检测方法,其特征在于,将所述待检测的PHP源文件对应的opcode序列中的opcode按照词频进行排序后,进行词向量转化,得到所述待检测的PHP源文件对应的输入特征矩阵包括:
将所述待检测的PHP源文件对应的opcode序列中的opcode按照词频进行排序后,进行词向量转化,得到所述待检测的PHP源文件对应的二维特征矩阵;
将所述二维特征矩阵的所有行排列成一行,得到所述待检测的PHP源文件对应的输入特征矩阵。
4.根据权利要求1所述的Webshell检测方法,其特征在于,基于PHP源文件样本训练获得所述Webshell检测模型的步骤包括:
对所述PHP源文件样本中的所述PHP源文件进行预处理,得到训练样本;
基于预处理后的所述PHP源文件样本对原始模型进行训练,获得所述Webshell检测模型。
5.根据权利要求4所述的Webshell检测方法,其特征在于,对所述PHP源文件样本中的所述PHP源文件进行预处理包括:
将所述PHP源文件经过编译处理,得到所述PHP源文件对应的opcode序列;
将所述PHP源文件对应的opcode序列中的opcode按照词频进行排序后,进行词向量转化,得到所述PHP源文件对应的输入特征矩阵。
6.根据权利要求5所述的Webshell检测方法,其特征在于,将所述PHP源文件经过编译处理,得到所述PHP源文件对应的opcode序列,包括:
通过词法分析将所述PHP源文件分割为PHP片段;
对所述PHP片段进行语法分析,生成抽象语法树;
将所述抽象语法树静态解析为opcode,得到所述PHP源文件对应的opcode序列。
7.根据权利要求5所述的Webshell检测方法,其特征在于,将所述PHP源文件对应的opcode序列中的opcode按照词频进行排序后,进行词向量转化,得到所述PHP源文件对应的输入特征矩阵包括:
将所述PHP源文件对应的opcode序列中的opcode按照词频进行排序后,进行词向量转化,得到所述PHP源文件对应的二维特征矩阵;
将所述二维特征矩阵的所有行排列成一行,得到所述PHP源文件对应的输入特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210435197.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基站组合电路及通信基站
- 下一篇:一种氢气混和分配处理装置