[发明专利]离题作文检测方法及装置、模型训练方法及装置在审
申请号: | 202211700106.3 | 申请日: | 2022-12-28 |
公开(公告)号: | CN116384404A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 王梦昀;汪洋;盛志超;王士进;魏思 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F18/22;G06N3/045;G06N3/048 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 宗广静 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离题 作文 检测 方法 装置 模型 训练 | ||
本申请提供了一种离题作文检测方法及装置、模型训练方法及装置,涉及计算机技术领域。该离题作文检测方法包括:获取针对目标主题作答的待检测作文;确定目标主题对应的K篇参考范文;确定待检测作文和K篇参考范文文本间的主题相似度;基于待检测作文和K篇参考范文文本间的主题相似度,确定待检测作文是否离题,避免了传统技术中由于题目文本较短、主题较宽泛、跨语言等造成的检测误判的问题,可以快速有效地检测出离题作文,为待检测作文自动评分提供有效参考,提升作文离题检测的准确率。
技术领域
本申请涉及计算机技术领域,具体涉及一种离题作文检测方法及装置、模型训练方法及装置。
背景技术
随着人工智能技术的发展与普及,传统教育正经历着从信息化教育到智能化教育的又一次改变。如何给予学生更快速、更精准的反馈成为教育改革的重点方向之一。作文题目由于其主观性较大,不同教师在评阅过程中容易受到疲劳、个人主观情绪的影响,而缺乏统一的标准。随着深度学习技术的发展,基于神经网络的智能评阅技术,通过训练模型自动提取文本相应特征,在一定程度上能够减少智能评阅系统的复杂度。
然而,在考试作答中,经常存在乱写、抄袭等离题样本,由于传统技术是基于题目进行离题判断,题目非常简短且包含的信息量有限,容易存在较大的误判概率。
发明内容
为了解决上述技术问题,提出了本申请。本申请实施例提供了一种离题作文检测方法及装置、模型训练方法及装置。
第一方面,本申请一实施例提供了一种离题作文检测方法,该方法包括:获取针对目标主题作答的待检测作文;确定目标主题对应的K篇参考范文;确定待检测作文和K篇参考范文文本间的主题相似度;基于待检测作文和K篇参考范文文本间的主题相似度,确定待检测作文是否离题。
结合第一方面,在第一方面的某些实现方式中,基于待检测作文和K篇参考范文文本间的主题相似度,确定待检测作文是否离题,包括:确定目标主题对应的主题发散度;基于待检测作文和K篇参考范文文本间的主题相似度以及主题发散度,确定待检测作文是否离题。
结合第一方面,在第一方面的某些实现方式中,基于待检测作文和K篇参考范文文本间的主题相似度以及主题发散度,确定待检测作文是否离题,包括:预先确定M个目标主题各自对应的主题发散度与离题阈值之间的映射表;基于M个目标主题各自对应的主题发散度与离题阈值之间的映射表,确定目标主题的主题发散度对应的离题阈值;将主题相似度与主题发散度对应的离题阈值进行对比,确定待检测作文是否离题。
结合第一方面,在第一方面的某些实现方式中,确定目标主题对应的主题发散度,包括:提取K篇参考范文各自的隐层特征,隐层特征用于表征K篇参考范文各自对应的文本向量;基于K篇参考范文各自的隐层特征,确定K篇参考范文中每两篇参考范文之间的余弦距离值;基于K篇参考范文中每两篇参考范文之间的余弦距离,确定目标主题对应的主题发散度。
结合第一方面,在第一方面的某些实现方式中,确定待检测作文和K篇参考范文文本间的主题相似度,包括:提取待检测作文和K篇参考范文各自的隐层特征,隐层特征用于表征待检测作文和K篇参考范文各自对应的文本向量;基于待检测作文和K篇参考范文各自的隐层特征,确定待检测作文和K篇参考范文的余弦距离均值;基于待检测作文和K篇参考范文的余弦距离均值,确定主题相似度。
结合第一方面,在第一方面的某些实现方式中,确定目标主题对应的K篇参考范文,包括:获取针对M个目标主题作答的N篇待检测作文;将N篇待检测作文进行聚类处理,确定M个目标主题分别对应的M个类别信息;基于N篇待检测作文和M个类别信息,确定靠近目标主题对应的聚类中心的K篇待检测作文;将K篇待检测作文确定为目标主题对应的K篇参考范文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211700106.3/2.html,转载请声明来源钻瓜专利网。