[发明专利]一种基于深度学习的作业查重方法在审
申请号: | 202110279211.3 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113011154A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 张凌;胡布焕;张晶 | 申请(专利权)人: | 华南理工大学;赛尔网络有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/33;G06F16/338;G06F40/263;G06F40/268;G06F40/216;G06F40/284;G06F40/30;G06F16/35;G06N3/04;G06Q50/20 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 作业 方法 | ||
本发明公开了一种基于深度学习的作业查重方法,包括:获取学生课程作业数据及作业模板文件,判断作业模板格式,对获取到的作业进行切题处理,判断作业中的题目是主观题还是客观题,对切题后的作业中的主观题答案进行文本预处理,利用深度学习技术(即卷积神经网络模型)计算学生作业之间的相似度,并且分析相似度计算结果,将相似度高的学生作业聚一类,生成相似度报告。为了方便教师查看相似内容情况,本发明对相似作业之间的相似内容进行标记。本发明能够找出作业语义相似的文本内容,解决许多抄袭检测方法抗干扰效果差的问题。
技术领域
本发明涉及学生作业查重的技术领域,尤其是指一种基于深度学习的作业查重方法。
背景技术
在高校的在线辅助教学中,电子文档成为了学生作业提交的主要形式之一。随着人们对学术道德的重视,如何协助教师找出学生提交的作业中抄袭内容,成为一个研究的热点。
目前抄袭检测系统有很多,例如国内的中国知网(CNKI)学术不端文献检测系统,国外的Turnitin、PlagScan、Dupli Checker等系统。这些系统能够协助教师找出学生提交作业中抄袭的部分,但是由于这些系统以互联网作为抄袭源,所以很难发现学生本地作业之间存在的抄袭关系。目前人们研究和投入使用的抄袭检测方法有很多,最流行的是基于词法的抄袭检测方法。基于词法的抄袭检测方法主要考虑文本中的词汇特征,例如早期投入使用较多的基于指纹特征提取的方法。基于指纹特征提取的方法将文档表示为一个指纹序列,根据指纹序列来计算文档之间的相似度。基于词法的抄袭检测方法适合用于简单的复制粘贴,但当抄袭者对文本有释义替换等躲避检测的行为时,这类方法效果不显著。也有研究者使用基于语法的抄袭检测方法(例如词性标注)、基于语义的抄袭方法(例如显示语义分析、潜在语义分析)和基于机器学习的抄袭检测方法(例如支持向量机、线性回归模型)等。
随着深度学习在计算机领域的广泛应用,许多研究者使用深度学习来实现抄袭检测,并且取得一些较好的成果。抄袭检测技术的重点之一是文本相似度计算,在文本相似度计算中利用深度学习技术可以很好的发现文本释义替换、同义词替换等情况,所以在抄袭检测任务中,利用深度学习相关技术,可以不仅可以发现字面抄袭,也能发现语义抄袭。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于深度学习的作业查重方法,可以准确找出作业语义相似的文本内容,解决许多抄袭检测方法抗干扰效果差的问题。
为实现上述目的,本发明所提供的技术方案为:一种基于深度学习的作业查重方法,包括以下步骤:
1)获取学生课程作业数据及作业模板文件;
2)判断作业模板格式,对获取到的作业进行切题处理,判断作业中的题目是主观题还是客观题;
3)对切题后的作业中的主观题答案进行文本预处理;
4)计算学生作业之间的相似度;
5)分析相似度计算结果,将相似度高的学生作业聚一类,生成相似度报告;
6)对相似作业之间的相似内容进行标记,完成作业查重。
在步骤1)中,所述学生课程作业数据是指从在线学习平台的课程中获取的学生作业;所述作业模板文件是指在线学习平台上,担任课程的教师或者助教在课程中提交的作业作答格式的文件。
在步骤2)中,判断作业模板格式,对获取到的作业进行切题处理,判断作业中的题目是主观题还是客观题,具体情况如下:
判断作业模板格式:系统中为教师提供多种作业模板格式,利用正则表达式判断获取到的作业模板属于哪一种模板格式;
对获取到的作业进行切题处理:判断作业模板格式后,利用该模板格式对应的正则表达式对学生作业进行切题,并且返回作业切题结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;赛尔网络有限公司,未经华南理工大学;赛尔网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110279211.3/2.html,转载请声明来源钻瓜专利网。