[发明专利]离题作文检测方法及装置、模型训练方法及装置在审

专利信息
申请号: 202211700106.3 申请日: 2022-12-28
公开(公告)号: CN116384404A 公开(公告)日: 2023-07-04
发明(设计)人: 王梦昀;汪洋;盛志超;王士进;魏思 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/289;G06F18/22;G06N3/045;G06N3/048
代理公司: 北京布瑞知识产权代理有限公司 11505 代理人: 宗广静
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 离题 作文 检测 方法 装置 模型 训练
【说明书】:

本申请提供了一种离题作文检测方法及装置、模型训练方法及装置,涉及计算机技术领域。该离题作文检测方法包括:获取针对目标主题作答的待检测作文;确定目标主题对应的K篇参考范文;确定待检测作文和K篇参考范文文本间的主题相似度;基于待检测作文和K篇参考范文文本间的主题相似度,确定待检测作文是否离题,避免了传统技术中由于题目文本较短、主题较宽泛、跨语言等造成的检测误判的问题,可以快速有效地检测出离题作文,为待检测作文自动评分提供有效参考,提升作文离题检测的准确率。

技术领域

本申请涉及计算机技术领域,具体涉及一种离题作文检测方法及装置、模型训练方法及装置。

背景技术

随着人工智能技术的发展与普及,传统教育正经历着从信息化教育到智能化教育的又一次改变。如何给予学生更快速、更精准的反馈成为教育改革的重点方向之一。作文题目由于其主观性较大,不同教师在评阅过程中容易受到疲劳、个人主观情绪的影响,而缺乏统一的标准。随着深度学习技术的发展,基于神经网络的智能评阅技术,通过训练模型自动提取文本相应特征,在一定程度上能够减少智能评阅系统的复杂度。

然而,在考试作答中,经常存在乱写、抄袭等离题样本,由于传统技术是基于题目进行离题判断,题目非常简短且包含的信息量有限,容易存在较大的误判概率。

发明内容

为了解决上述技术问题,提出了本申请。本申请实施例提供了一种离题作文检测方法及装置、模型训练方法及装置。

第一方面,本申请一实施例提供了一种离题作文检测方法,该方法包括:获取针对目标主题作答的待检测作文;确定目标主题对应的K篇参考范文;确定待检测作文和K篇参考范文文本间的主题相似度;基于待检测作文和K篇参考范文文本间的主题相似度,确定待检测作文是否离题。

结合第一方面,在第一方面的某些实现方式中,基于待检测作文和K篇参考范文文本间的主题相似度,确定待检测作文是否离题,包括:确定目标主题对应的主题发散度;基于待检测作文和K篇参考范文文本间的主题相似度以及主题发散度,确定待检测作文是否离题。

结合第一方面,在第一方面的某些实现方式中,基于待检测作文和K篇参考范文文本间的主题相似度以及主题发散度,确定待检测作文是否离题,包括:预先确定M个目标主题各自对应的主题发散度与离题阈值之间的映射表;基于M个目标主题各自对应的主题发散度与离题阈值之间的映射表,确定目标主题的主题发散度对应的离题阈值;将主题相似度与主题发散度对应的离题阈值进行对比,确定待检测作文是否离题。

结合第一方面,在第一方面的某些实现方式中,确定目标主题对应的主题发散度,包括:提取K篇参考范文各自的隐层特征,隐层特征用于表征K篇参考范文各自对应的文本向量;基于K篇参考范文各自的隐层特征,确定K篇参考范文中每两篇参考范文之间的余弦距离值;基于K篇参考范文中每两篇参考范文之间的余弦距离,确定目标主题对应的主题发散度。

结合第一方面,在第一方面的某些实现方式中,确定待检测作文和K篇参考范文文本间的主题相似度,包括:提取待检测作文和K篇参考范文各自的隐层特征,隐层特征用于表征待检测作文和K篇参考范文各自对应的文本向量;基于待检测作文和K篇参考范文各自的隐层特征,确定待检测作文和K篇参考范文的余弦距离均值;基于待检测作文和K篇参考范文的余弦距离均值,确定主题相似度。

结合第一方面,在第一方面的某些实现方式中,确定目标主题对应的K篇参考范文,包括:获取针对M个目标主题作答的N篇待检测作文;将N篇待检测作文进行聚类处理,确定M个目标主题分别对应的M个类别信息;基于N篇待检测作文和M个类别信息,确定靠近目标主题对应的聚类中心的K篇待检测作文;将K篇待检测作文确定为目标主题对应的K篇参考范文。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211700106.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top