[发明专利]评阅方法、评阅装置、电子设备以及计算机可读存储介质在审
申请号: | 202111665520.0 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114358579A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 陈子恒;沙晶;刘丹;王士进;魏思 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06Q50/20;G06N3/04;G06N3/08;G06K9/62;G06F40/289 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评阅 方法 装置 电子设备 以及 计算机 可读 存储 介质 | ||
本申请公开了评阅方法、评阅装置、电子设备以及计算机可读存储介质。该评阅方法包括:获取到待评分的数学文本;其中,数学文本包括标准答案以及用户作答内容,数学文本包括数学式子和文字信息;其中,数学文本为经过分词处理后的文本;将数学文本输入到评分预测模型中,利用评分预测模型对数学文本中的文字信息以及数学式子进行识别;其中,评分预测模型是利用不完整的数学文本进行训练得到的;其中,不完整的数学文本包括被掩盖的数学式子以及被掩盖的文字信息;基于识别结果对用户作答内容进行评分并输出得分率。本申请能够较好地根据用户作答内容进行预测,从而满足解答题自动评阅的需求。
技术领域
本申请涉及自然语言处理领域,特别是涉及评阅方法、评阅装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网技术的发展,在线教育的用户数量日益俱增,需要大量的人力应对大规模的题目评阅。其中,对于选择填空题,可以通过简单的答案匹配实现高效的评阅,而由于解答题过程的主观性及解法的多样性,导致不同老师对于评阅结果也存在一定的主观性,既不利于学生对自己进行客观的评价,也增加了老师的工作强度。
现有的数学题自动批改方法,主要是依据标准答案与学生作答的匹配程度来计算得分。例如,通过真值代入学生作答,并与标准答案进行匹配的办法来进行数学代数式类型题目的评阅。或者,利用大量人为定义的规则分别对学生作答与标准答案进行结构化以及结论提取,并最终根据结论的匹配程度得出学生的得分。
然而,现有的评分预测模型无法准确理解数学文本中的数学语句的规律,就需要通过人工预先对标准答案以及学生作答进行结构化以及结论提取,这仍然会极大增加人力成本,无法满足解答题自动评阅的需求。
发明内容
本申请主要解决的技术问题是提供评阅方法、评阅装置、电子设备以及计算机可读存储介质,能够解决现有技术中解答题评阅导致的高额人力成本问题。
为解决上述技术问题,本申请采用的第一技术方案是提供一种评阅方法,包括:获取到待评分的数学文本;其中,数学文本包括标准答案以及用户作答内容,数学文本包括数学式子和文字信息;其中,数学文本为经过分词处理后的文本;将数学文本输入到评分预测模型中,利用评分预测模型对数学文本中的文字信息以及数学式子进行识别;其中,评分预测模型是利用不完整的数学文本进行训练得到的;其中,不完整的数学文本包括被掩盖的数学式子以及被掩盖的文字信息;基于识别结果对用户作答内容进行评分并输出得分率。
其中,获取到待评分的数学文本的步骤,具体包括:获取到多个待评分的数学文本;将数学文本输入到评分预测模型中,利用评分预测模型对数学文本中的文字信息以及数学式子进行识别的步骤,包括:将各数学文本输入评分预测模型中,利用评分预测模型对各数学文本中的文字信息以及数学式子进行识别,得到多个识别结果;基于识别结果对用户作答内容进行评分并输出得分率的步骤,包括:通过评分预测模型对多个全部识别结果进行评分,输出多个得分率,并通过评分预测模型得到多个得分率的均值;通过评分预测模型对多个得分率的均值以及各数学文本对应的得分率进行高斯分布拟合,并基于获得的各方差与第二设定阈值的对比结果,判断是否拒绝对各数学文本进行评阅;其中,响应于单个数学文本的方差大于第二设定阈值,拒绝对单个数学文本进行评分。
其中,利用不完整的数学文本进行训练的方法,具体包括:获取到第一样本数据集,各第一样本数据为不完整的数学文本;利用第一样本数据集对预设语言模型进行数学式子以及文字预测训练,得到第一模型;获取到第二样本数据集,各第二样本数据包括题目、标准答案、用户作答内容以及用户作答内容的评判信息;且第二样本数据包括数学式子以及文字信息;利用第二样本数据集对第一模型进行评分训练,得到评分预测模型。
其中,获取到第一样本数据集,各第一样本数据为不完整的数学文本的步骤,包括:获取到原始样本集,其中,各原始样本包括数学式子和文字信息;对各原始样本中的数学式子以及文字信息进行分词处理,以将数学式子以及文字信息切分成多个分词;将数学式子对应的分词以及文字信息对应的分词进行部分掩盖,得到第一样本数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111665520.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超声探头阻尼背衬的制造方法
- 下一篇:装饰膜及工件
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理