[发明专利]一种通过试卷属性去重的方法、装置及存储介质在审
申请号: | 202111242576.5 | 申请日: | 2021-10-25 |
公开(公告)号: | CN114005118A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 韩均雷;陶扬;王辰成;刘海哮;刘冀星;李雨桐 | 申请(专利权)人: | 作业帮教育科技(北京)有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V30/40;G06Q50/20 |
代理公司: | 北京中联智道知识产权代理事务所(普通合伙) 11963 | 代理人: | 熊蒙 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 试卷 属性 方法 装置 存储 介质 | ||
本发明公开了一种通过试卷属性去重的方法、装置及存储介质,所述通过试卷属性去重的方法,包括:获取试卷库中的试卷以及该试卷的试卷属性信息;通过试卷属性信息在试卷库中进行匹配;将试卷属性信息匹配完全相同的各套试卷筛选出来合并入相同族。本发明将试卷属性信息匹配完全相同的各套试卷筛选出来合并入相同族包括:将试卷属性标签完整且全部匹配的试卷直接自动判定为重复试卷,将试卷属性标签部分缺失但匹配相同的试卷筛选出来待确认是否重复试卷,具体可通过人工判重;实现了系统先将符合自动判重条件的试卷直接去重,再将筛选出的待确认的疑似重复试卷由人工进行判重,即提高了试卷判重的效率,又避免了系统自动判重出现错误。
技术领域
本发明涉及在线教育技术领域,具体的涉及一种通过试卷属性去重的方法、装置及存储介质。
背景技术
在线教育平台为了提供拍照搜题、智能练习、作业批改等线上服务,一般都需要基于强大的试题数据库。现有的试题生产入库的流程一般是,首先通过各种渠道获取试题资源,试题资源可以是直接购买的试题库资源或者是获取试卷资源,针对获取的试卷资源,需要将试卷资源中的试题进行拆分,将拆分后的试题按照试题入库的格式要求进行生产入库。
然而,获取试卷资源的途径是多方面的,会通过不同的收集端口分别取收集试卷资源,这就导致收集在试卷库中的试卷会有重复,重复试卷的产生会导致相同试题的重复生产,在试题的生产流程中还需要进行去重,造成了系统资源的浪费,影响试题生产的效率。因此,如何解决试题库中相同试卷的去重问题,对于相同试题的重复生产的规避以及提升试题的生产效率具有重要的意义。
有鉴于此,特提出本发明。
发明内容
本发明为了解决上述技术问题,提供了一种通过试卷属性去重的方法、装置及存储介质,具体技术方案如下:
本发明提出了一种通过试卷属性去重的方法,包括:
获取试卷库中的试卷以及该试卷的试卷属性信息;
通过试卷属性信息在试卷库中进行匹配;
将试卷属性信息匹配完全相同的各套试卷筛选出来合并入相同族。
作为本发明的可选实施方式,所述获取试卷库中的试卷以及该试卷的试卷属性信息包括:
获取试卷库中试卷的试卷编号以及该试卷编号被标注的试卷属性标签,所述的试卷属性标签包括多个,分别表示试卷的多个属性信息;
将试卷编号与各试卷属性标签按照预设的数据化结构进行存储。
作为本发明的可选实施方式,所述通过试卷属性信息在试卷库中进行匹配包括:
针对试卷属性标签进行匹配;
若各试卷属性标签均对应相同,则试卷属性信息匹配完全相同。
作为本发明的可选实施方式,所述试卷库中的目标筛选试卷标注有第一试卷属性标签、第二试卷属性标签、……、第N试卷属性标签;
在试卷数据库中筛选出与目标筛选试卷的试卷属性标签数相同的第一试卷集;
在第一试卷集中以第一试卷属性标签为匹配条件筛选出相同第一试卷属性标签的第二试卷集;
在第二试卷集中以第二试卷属性标签为匹配条件筛选出相同第二试卷属性标签的第三试卷集;
……在第N试卷集中以第N试卷属性标签为匹配条件筛选出相同第N试卷属性标签的第N+1试卷集;
所述第N+1试卷集中试卷的试卷属性信息匹配完全相同。
作为本发明的可选实施方式,所述将试卷属性信息匹配完全相同的各套试卷筛选出来合并入相同族包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于作业帮教育科技(北京)有限公司,未经作业帮教育科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111242576.5/2.html,转载请声明来源钻瓜专利网。