[发明专利]二进制代码文件溯源方法在审
申请号: | 201910853284.1 | 申请日: | 2019-09-10 |
公开(公告)号: | CN110569629A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 陶金龙;纪祖赑;高艳鹍;冯大成;张建伟;汪进银 | 申请(专利权)人: | 北京计算机技术及应用研究所 |
主分类号: | G06F21/16 | 分类号: | G06F21/16;G06F8/53 |
代理公司: | 11011 中国兵器工业集团公司专利中心 | 代理人: | 赵欣 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种二进制代码文件溯源方法,该方法通过反汇编生成汇编代码,然后基于汇编指令生成二进制文件的Simhash特征值,最后结合倒排索引方法和Simhash汉明距离计算,实现二进制代码文件相似性比对,并最终完成二进制代码文件溯源。该方法具有较好的时间和空间复杂度,能够满足在海量代码库中进行二进制代码文件快速溯源分析的要求,具有较高的准确率和召回率。 | ||
搜索关键词: | 二进制代码 溯源 时间和空间复杂度 二进制文件 文件相似性 倒排索引 汉明距离 汇编代码 汇编指令 代码库 反汇编 准确率 比对 分析 | ||
【主权项】:
1.一种二进制代码文件溯源方法,其特征在于,具体包括以下步骤:/n第一步,二进制文件反汇编:将二进制文件中的代码段转化成汇编代码;/n第二步,二进制代码特征计算:基于汇编代码生成二进制代码文件的Simhash值;/n第三步,基于特征的文件溯源:通过计算两个Simhash值之间的汉明距离,就可以判定两个二进制代码文件是否相似,完成二进制代码文件的溯源。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910853284.1/,转载请声明来源钻瓜专利网。