[发明专利]基于源代码多标签图神经网络的程序代码抄袭类型检测方法与系统有效
申请号: | 201810226651.0 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108446540B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 万海;刘欣怡 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F21/12 | 分类号: | G06F21/12;G06K9/62;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于源代码多标签图神经网络的程序代码抄袭类型检测方法,包括以下步骤:S1.对于一份代码文本,利用自定义的代码微混淆工具为其生成一份抄袭版本,并同时记录抄袭类型;S2.对代码文本及其抄袭版本进行代码属性图特征向量的提取;S3.对代码文本及其抄袭版本的代码属性图特征向量进行整合,为神经网络提供良好的输入,令整合后的代码文本及其抄袭版本的代码属性图特征向量为正例;S4.利用步骤S2~S3的方法整合得到代码文本‑代码文本的代码属性图特征向量,令其为反例;S5.利用神经网络定义一个多任务学习网络模型,针对每份正例/反例的输入同时训练10个分类器,最终输出一个10维向量,每个维度代表定义的一种抄袭类型,从而为评定者提供抄袭证据。 | ||
搜索关键词: | 基于 源代码 标签 神经网络 程序代码 抄袭 类型 检测 方法 系统 | ||
【主权项】:
1.基于源代码多标签图神经网络的程序代码抄袭类型检测方法,其特征在于:包括以下步骤:S1.对于一份代码文本,利用自定义的代码微混淆工具为其生成一份抄袭版本,并同时记录抄袭类型;S2.对代码文本及其抄袭版本进行代码属性图特征向量的提取;S3.对代码文本及其抄袭版本的代码属性图特征向量进行整合,为神经网络提供良好的输入,令整合后的代码文本及其抄袭版本的代码属性图特征向量为正例;S4.利用步骤S2~S3的方法整合得到代码文本‑代码文本的代码属性图特征向量,令其为反例;S5.利用神经网络定义一个多任务学习网络模型,针对每份正例/反例的输入同时训练10个分类器,最终输出一个10维向量,每个维度代表定义的一种抄袭类型,从而为评定者提供抄袭证据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810226651.0/,转载请声明来源钻瓜专利网。