[发明专利]基于维基百科与WordNet的论述题自动评卷方法有效
申请号: | 201910315031.9 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110059318B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 朱新华;徐庆婷;张兰芳;张波 | 申请(专利权)人: | 海道(深圳)教育科技有限责任公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/35;G06F40/247;G06F40/194 |
代理公司: | 广州海藻专利代理事务所(普通合伙) 44386 | 代理人: | 付朝文;裴康明 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 百科 wordnet 论述题 自动 评卷 方法 | ||
本发明提供了一种基于维基百科与WordNet的论述题自动评卷方法,通过WordNet形成领域学科的初始主干概念空间,并通过维基百科与WordNet扩展形成领域学科的概念空间、术语集与领域概念页面集,然后通过学科的概念空间与概念页面集为领域术语建立起语义描述向量,最终使用术语语义描述为论述题的教师答案文本与学生答卷文本分别建立起相应的文本语义描述向量,并通过计算答案文本与答卷文本语义描述向量的相似度能自动得出论述题评卷的得分,且有利于提高评分的精度。
技术领域
本发明涉及教育技术与计算机应用技术领域,具体是基于维基百科与WordNet的论述题自动评卷方法。
背景技术
考试试卷中的试题从答案组成的形式上,被普遍分为客观题与主观题两大类。答案以选项编号表示的单选题、多选题、判断题等试题被称为客观题,而答案采用自然语言表示的简答题、名词解释和论述题等试题被称为主观题。由于单选题、多选题、判断题等客观题目的答案都是以选项编号表示,目前计算机对于此类题型进行自动阅卷时,只需将标准答案的选项编号与学生答案的选项编号进行简单的匹配运算,匹配成功则答案正确,该处理技术已经取得较好的成果。但对于答案采用自然语言表示的主观题自动阅卷技术,如:对简答题、名词解释和论述题等自动评卷,由于其受到自然语言理解、模式识别等理论与技术瓶颈影响,效果不是很理想。
主观题不同于客观题,不仅需要采用自然语言表示答案,而且具有一定的主观性,允许学生在一定的范围内答题,因此答案往往不是唯一的,而且学生答题的方式会有多种形式。另一方面,教师在批阅试卷的时候,还可能会受到主观因素的影响,以及学生字体是否美观、卷面是否整洁等的影响,使得教师在评分时,出现不合理的加分或扣分现象,有失考试的公正性和公平性。主观题的计算机自动阅卷,既减轻了教师人工阅卷的劳动强度,又减少人为因素的影响,保证了阅卷的客观性、公正性,因此主观题计算机自动阅卷技术的研究,具有重要的意义。然而,由于主观题学生答案的多样性与随意性,目前还没有使用计算机对主观题进行自动阅卷的成熟技术。
目前,在各类主观题计算机自动阅卷系统中,普遍采用关键字匹配技术实现简答题与名词解释类的短文本主观题自动阅卷,即在答案中标注出若干关键字或关键词,将其与学生答案进行匹配,并根据匹配成功的多少对学生答案进行评分,由于自然语言的多样性与随意性,这种方法的评分准确率非常低。为提高评卷的准确率,目前出现了少量的基于词语相似度、语法分析与依存关系等语义技术的主观题自动阅卷方法,这类评卷方法虽然可以在评卷过程中融入语义技术,提高评卷的准确率,但大多仍默认学生的答题方式与标准答案都是以完整的单个句子形式给出,并采用统一的基于句子相似度的方法进行评卷,一旦主观题的答案由多个句子组成,这类语义技术的系统的评分效果仍然很差。论述题是一种答案由多个句子、甚至多个段落的长文本所构成的主观题,例如,主观题“试详细说明程序设计的基本过程”的答案就由多个段落的长文本所组成,对于这类长文本的论述题,目前仍然没有理想的方法实现准确地自动评卷。为解决这一难题,本发明提出了一种基于维基百科与WordNet的论述题自动评卷方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海道(深圳)教育科技有限责任公司,未经海道(深圳)教育科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910315031.9/2.html,转载请声明来源钻瓜专利网。