[发明专利]基于语义分割的恶意软件基因快速检测方法和装置有效
申请号: | 201811342373.1 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109492396B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 涂小毅;范渊 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 分割 恶意 软件 基因 快速 检测 方法 装置 | ||
本发明提供了一种基于语义分割的恶意软件基因快速检测方法及装置,由基因库训练后的语义分割模型可极大提高实时样本的匹配检测效率,被训练后的语义分割模型不需要携带基因库的特性甚至可嵌入离线实时安全产品中;自动抽象特征提取特性及后续成熟的优化技术可提高恶意变形的基因识别正确率。
技术领域
本发明涉及信息安全技术领域,具体而言,涉及一种基于语义分割的恶意软件基因快速检测方法和装置。
背景技术
恶意软件基因提取及识别技术大概于2008年左右被提出,前期主要将使用的特定个人习惯的代码片段提取为基因用于识别恶意软件开发者或APT组织,后续逐渐扩大加入恶意软件家族基因用于识别其变种迭代和新家族判断。
目前,常规的恶意软件基因匹配技术有两大问题:
1.基因库的规模随恶意软件数量的增加而呈指数级增长,带来常规检索和匹配方式效率低下,甚至无法落地应用;
2.庞大的基因库无法嵌入安全产品或离线部署;
3.常规模糊匹配技术或人工经验形成的预处理技术,对恶意变形的基因识别正确率较差。
发明内容
针对上述现有技术中存在的问题,本发明提供了一种基于语义分割的恶意软件基因快速检测方法和装置。
第一方面,本发明实施例提供了一种基于语义分割的恶意软件基因快速检测方法,所述方法包括:
将待检测样本进行反汇编成待检测反汇编代码;
将待检测反汇编代码转化成待检测图片;
将所述待检测图片输入语义分割模型,输出解析图片;
根据所述解析图片,得到检测结果。
进一步的,所述语义分割模型训练方法包括:
获取基础样本,并对所述基础样本进行反汇编成样本反汇编代码;
将样本反汇编代码转化成样本图片,并且将所述样本图片整理成数据集;
利用上所述数据集训练原有语义分割模型形成语义分割模型。
进一步的,将样本反汇编代码转化成样本图片,并且将所述样本图片整理成数据集,包括:
将所述数据集按7:2:1的比例分为训练集、验证集和交叉测试集。
进一步的,利用上所述数据集训练原有语义分割模型形成语义分割模型,包括:
利用训练集、验证集和交叉测试集来训练测试原有语义分割模型。
进一步的,将所述待检测图片输入语义分割模型,输出解析图片之后,所述方法还包括:
根据待检测反汇编代码和预设标识数组优化解析图片;
第二方面,本发明实施例还提供了一种基于语义分割的恶意软件基因快速检测装置,所述装置包括:
反汇编模块,用于将待检测样本进行反汇编成待检测反汇编代码;
转化模块,用于将待检测反汇编代码转化成待检测图片;
解析模块,用于将所述待检测图片输入语义分割模型,输出解析图片;
检测模块,用于根据所述解析图片,得到检测结果。
进一步的,所述装置还包括训练模块;
所述训练模块用于:
获取基础样本,并对所述基础样本进行反汇编成样本反汇编代码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811342373.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检测恶意程序的方法、装置及存储介质
- 下一篇:一种计算机信息安全系统