[发明专利]一种题目与框题坐标映射的方法、存储介质及设备在审
申请号: | 202310360241.6 | 申请日: | 2023-04-06 |
公开(公告)号: | CN116416636A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 陈炳洁;王余;杨康;蔡伟谦 | 申请(专利权)人: | 珠海读书郎软件科技有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/10;G06V30/19;G06Q50/20 |
代理公司: | 广州德伟专利代理事务所(普通合伙) 44436 | 代理人: | 何文颖 |
地址: | 519000 广东省珠海市高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 题目 坐标 映射 方法 存储 介质 设备 | ||
1.一种题目与框题坐标映射的方法,其特征在于,具体过程为:
S1、在数据库中,预先录入教辅材料各页中的各个试题的数据信息,包括页码和试题文本数据;对于具有多个小题的试题,分别存储该试题的题干文本数据以及小题文本数据;
S2、导入教辅材料的页面原图;
S3、手动采用矩形框在页面原图上框出各个试题题块;其中,对于不具有多个小题的试题,用一个矩形框框出,对于具有多个小题的试题,则用不同的矩形框分别将该试题的题干以及各个小题框出;
S4、获取各个试题题块的坐标数据;
S5、对各个试题题块进行OCR识别得到对应的题块文本数据,然后与数据库中各个试题的试题文本数据进行对比;
当某个试题题块的题块文本数据与数据库中某个试题的试题文本数据相似度超过设定的相似度阈值时,直接将该试题题块的坐标数据与该试题进行绑定并录入到数据库中,形成该试题的坐标数据;
当有连续多个试题题块的题块文本数据有超过设定百分比的数量被包含于数据库中同一道试题的试题文本数据中,判定该连续多个试题题块隶属于同一道试题,并将该连续多个试题题块的坐标数据,按顺序分别与所匹配到的题干文本数据或小题文本数据进行绑定并记录在数据库中,形成该试题的题干的坐标数据以及各个小题的坐标数据。
2.根据权利要求1所述的方法,其特征在于,所述坐标数据包括试题题块的左上角坐标和右下角坐标。
3.根据权利要求1所述的方法,其特征在于,步骤S5中,当某个试题题块的题块文本数据与数据库中多个试题的试题文本数据相似度超过设定的相似度阈值,则将其坐标数据与数据库中相似度最高的试题进行绑定。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法。
5.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序时,实现权利要求1-3任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海读书郎软件科技有限公司,未经珠海读书郎软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310360241.6/1.html,转载请声明来源钻瓜专利网。