[发明专利]基于动态胎记的多线程程序抄袭检测方法及相关设备有效
申请号: | 202011506964.5 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112559978B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 周文安;吴梦远;陆祉丞;谢逸凡 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F21/10 | 分类号: | G06F21/10;G06F8/75 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 孙晓凤 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 胎记 多线程 程序 抄袭 检测 方法 相关 设备 | ||
本说明书实施例提供一种基于动态胎记的多线程程序抄袭检测方法及相关设备。该方法包括:采用动态插桩技术,向待测程序中插入自定义函数,获取系统调用序列;利用K值可变的D‑Kgram算法处理系统调用序列,分别生成gram长度为不同K值的若干个子序列;对若干个子序列进行单一线程化筛选,得到特征子序列集合;分别构建原程序和可疑程序的动态胎记;将动态胎记转化为向量,利用余弦相似度方法得到原程序与可疑程序的相似度;计算在多次输入下相似度的均值并依据检测阈值,得出可疑程序是否抄袭原程序的结论。本说明书提供的方法及相关设备可有效规避线程交织特性对动态胎记的影响,使得抄袭检测的效果更好。
技术领域
本说明书一个或多个实施例涉及软件抄袭检测领域,尤其涉及一种基于动态胎记的多线程程序抄袭检测方法及相关设备。
背景技术
近年来,软件抄袭行为愈演愈烈,软件抄袭行为一方面影响计算机相关专业学生的培养,另一方面对软件知识产权的保护造成了严重威胁。因此,软件抄袭检测技术成为了研究重点。
在软件知识产权争端中,原告方很可能无法获取到被告方的源代码,而软件胎记技术就适用于无法获取软件源代码的场景。因此,只需要二进制可运行文件的软件胎记技术得到了越来越多的关注。软件胎记技术又依据提取过程是否需要程序运行,分为软件静态胎记技术和软件动态胎记技术。软件动态胎记技术由于其动态监控程序运行的特性,更能体现程序运行时的特征,所以性能比软件静态胎记技术更好。
现有的软件动态胎记技术,在单线程程序的抄袭检测领域取得了较好的成果。然而,对于多线程程序,线程交织的特性对程序动态监测和胎记提取造成了很大影响。多线程程序的运行过程具有不确定性,使得动态监测程序运行的结果也具有不确定性,动态胎记无法很好的衡量程序的运行行为。所以,现有的软件动态胎记技术还难以应用到多线程程序抄袭检测中。
又由于多线程程序可以提高CPU的利用率和程序的效率,多线程编程已经逐渐成为软件开发的主流。因此,亟需一种能够实现对多线程程序抄袭进行检测的方法。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于动态胎记的多线程程序抄袭检测方法及相关设备,以克服现有技术中的不足。
基于上述目的,本说明书一个或多个实施例提供了一种基于动态胎记的多线程程序抄袭检测方法,包括:
获取待测程序在一程序输入下的每个系统调用函数对应的系统调用号和线程号,组成系统调用序列;
利用参数K值可变的Dynamic-K-gram算法处理所述系统调用序列,分别生成gram长度为不同K值的若干个子序列;
对所述若干个子序列进行单一线程化筛选,得到特征子序列集合;
通过统计所述特征子序列集合中各特征子序列在所述系统调用序列中出现的频率,构建所述待测程序的动态胎记;
将原程序和可疑程序作为所述待测程序,得到所述原程序和可疑程序分别对应的所述动态胎记;
将所述原程序和可疑程序对应的动态胎记转化为向量,根据所述向量得到胎记系数;利用所述胎记系数和所述向量计算余弦相似度,以得到所述程序输入下的原程序与可疑程序的相似度;
计算得到不同程序输入下的多个所述相似度,并依据检测阈值,得出可疑程序是否抄袭原程序的结论。
基于同一发明构思,本说明书一个或多个实施例还提供了一种基于动态胎记的多线程程序抄袭检测装置,包括:
获取模块,被配置为获取待测程序在一程序输入下的每个系统调用函数对应的系统调用号和线程号,组成系统调用序列;
第一生成模块,被配置为利用参数K值可变的Dynamic-K-gram算法处理所述系统调用序列,分别生成gram长度为不同K值的若干个子序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011506964.5/2.html,转载请声明来源钻瓜专利网。