[发明专利]一种基于机器学习的自动化平行组卷的方法及系统有效
申请号: | 202111213646.4 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113656536B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 廖丽娜;朱智勇;彭海波;许利宁 | 申请(专利权)人: | 深圳市菁优智慧教育股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/335;G06F16/338;G06F40/194;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 杨丹;郝博 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 自动化 平行 方法 系统 | ||
本发明提出了一种基于机器学习的自动化平行组卷的方法及系统,其中,该方法包括:获取原始试卷;根据原始试卷中的题目,利用相似性算法,在候选题库中分别查询与每道题目相似的题目,组成第一题目列表;过滤第一题目列表得到第二题目列表;根据用户对题目及包含题目的试卷的历史处理行为建立预测模型,预测处理行为的概率;根据处理行为的概率计算题目评分,按照题目评分排序,选取排名靠前的一定数量的题目;对每种处理行为的概率分别进行排名,将排名转换为分数并融合排序,在组成平行试卷;根据用户对题目顺序的历史更改数据建立顺序调整模型,调整平行试卷中试题顺序;展示平行试卷,并根据用户的换题操作及顺序调整操作,得到最终试卷。
技术领域
本发明涉及机器学习技术领域,尤指一种基于机器学习的自动化平行组卷的方法及系统。
背景技术
在教育工作中,布置作业和组成考试的试卷(后续统一称之为组卷,组卷包括布置作业的组卷、单元测试的组卷、期中期末的组卷等)都需要在极其庞大的题库系统中进行(当前已经比较成熟的题库在千万量级,而且还在以每年几百万的速度递增)。
通常,用户在读懂一个题目并且判定是否需要加入题库的时间长度大概在20s~1min之间,因此在大批量的题库中找到合适的题目的工作量是巨大的。如何让用户高效率的在几千万的题库中搜索到更合适的试题,是一个很严重的挑战。
当前针对组卷场景,往往是根据教材版本、学科、年级信息、知识点信息、知识点对应的书本章节信息、题目的来源信息(比如,某年中考题、某学校的期末考试题等)进行筛选,再根据题目的入库时间、题目的难度、题目的来源等等进行排序,用户人工对对应题库里面的题目进行筛选。在这类做法中,至少存在以下不足:1、需要非常准确的对题目的知识点和章节的分类,题目的知识点标签的准确度直接影响到用户能否基于某个知识点或者章节找到该题目,而一般的题库在上传的时候是没有自带知识点标注的,而且全国每个机构的题库的知识点体系都有差异,需要人工基于对当前题目的理解,对应到本地的知识点体系中。2、用户需要大量的看对应知识点、章节的题目,因为某个知识点/某个章节的题库的量级也是非常巨大的(平均每个知识点的题库量级在几千道,全部筛选完毕需要上百个小时),一个用户在几千道题里面人工找到几十道题,其效率也是非常低下的,在现实情况下,只有放弃部分题目的质量,在几百个题目中筛选出几十道题就已经很不容易了。3、是题目组卷生成的试题质量受限于组卷用户自身的教研水平和认真程度,因此水平比较差的用户组的试卷大概率是比较差的(比如同一个知识点的重复考、难度系数的分布不合理、部分题目超纲等)。4、无法做到综合性题目的组卷,因为很多学科(比如地理、化学等)的大题的题目是综合性质的,会囊括很多个知识点,无法基于某一个知识点的搜索将该题目加入题库中(否则就容易造成学生当前还没学过其他关联知识点的情况下该题目不会做等情况),因此通过搜索知识点、筛选的方式对于综合类题目的组卷效果是极差的。
综上来看,亟需一种可以克服上述缺陷,能够按照用户偏好进行高效率组卷的技术方案。
发明内容
为解决现有技术存在的问题,本发明提出了一种基于机器学习的自动化平行组卷的方法及系统。本发明针对里面的每个题目自动替换成其他与当前题目类似的其他题目,同时辅助与用户比较偏好挑选的题目的方式,进行自动化的平行组卷工作。对于组出的试卷,用户可以针对性的对某些题目进行相似题替换,替换逻辑也是基于当前题目最相似的题目和用户偏好的题目类型做排序,同时提供用户搜索题库中所有题目的搜索框和筛选框,最大化提升用户组卷的效率,提高组出试卷的质量。
在本发明实施例的第一方面,提出了一种基于机器学习的自动化平行组卷的方法,该方法包括:
获取原始试卷;
根据所述原始试卷中的题目,利用相似性算法,在候选题库中分别查询与每道题目相似度最高的一定数量的题目,组成第一题目列表;
对第一题目列表进行过滤,得到第二题目列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市菁优智慧教育股份有限公司,未经深圳市菁优智慧教育股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111213646.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于深度学习的答题卡识别方法及系统
- 下一篇:弹性件、摄像模组及电子设备