[发明专利]基于源代码多标签图神经网络的程序代码抄袭类型检测方法与系统有效

申请号：	201810226651.0	申请日：	2018-03-19
公开（公告）号：	CN108446540B	公开（公告）日：	2022-02-25
发明（设计）人：	万海;刘欣怡	申请（专利权）人：	中山大学
主分类号：	G06F21/12	分类号：	G06F21/12;G06K9/62;G06N3/04
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	林丽明
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于源代码多标签图神经网络的程序代码抄袭类型检测方法，包括以下步骤：S1.对于一份代码文本，利用自定义的代码微混淆工具为其生成一份抄袭版本，并同时记录抄袭类型；S2.对代码文本及其抄袭版本进行代码属性图特征向量的提取；S3.对代码文本及其抄袭版本的代码属性图特征向量进行整合，为神经网络提供良好的输入，令整合后的代码文本及其抄袭版本的代码属性图特征向量为正例；S4.利用步骤S2～S3的方法整合得到代码文本‑代码文本的代码属性图特征向量，令其为反例；S5.利用神经网络定义一个多任务学习网络模型，针对每份正例/反例的输入同时训练10个分类器，最终输出一个10维向量，每个维度代表定义的一种抄袭类型，从而为评定者提供抄袭证据。
搜索关键词：	基于源代码标签神经网络程序代码抄袭类型检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于源代码多标签图神经网络的程序代码抄袭类型检测方法，其特征在于：包括以下步骤：S1.对于一份代码文本，利用自定义的代码微混淆工具为其生成一份抄袭版本，并同时记录抄袭类型；S2.对代码文本及其抄袭版本进行代码属性图特征向量的提取；S3.对代码文本及其抄袭版本的代码属性图特征向量进行整合，为神经网络提供良好的输入，令整合后的代码文本及其抄袭版本的代码属性图特征向量为正例；S4.利用步骤S2～S3的方法整合得到代码文本‑代码文本的代码属性图特征向量，令其为反例；S5.利用神经网络定义一个多任务学习网络模型，针对每份正例/反例的输入同时训练10个分类器，最终输出一个10维向量，每个维度代表定义的一种抄袭类型，从而为评定者提供抄袭证据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810226651.0/，转载请声明来源钻瓜专利网。

上一篇：一种软件授权方法和软件授权文件生成系统
下一篇：基于有限状态机和符号执行的源代码加固方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于源代码多标签图神经网络的程序代码抄袭类型检测方法与系统有效

专利文献下载