[发明专利]一种试卷版面题目自动拆分的方法在审
申请号: | 201910884281.4 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110705400A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 严军峰;董平;陈家海;叶家鸣;吴波 | 申请(专利权)人: | 安徽七天教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 11504 北京力量专利代理事务所(特殊普通合伙) | 代理人: | 姚远方 |
地址: | 230012 安徽省合肥市新站区铜*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 试卷 题目 版面 图像目标检测 坐标位置信息 方式获取 仿真数据 图片特征 图像数据 完整检测 网络架构 特征层 扫描 语文 数学 英语 拍摄 预测 改进 | ||
本发明涉及图像目标检测与识别技术领域,且公开了一种试卷版面题目自动拆分的方法,该系统基于改进后的yolov3网络架构设计,主要包含仿真数据生成、图片特征提取和特征层预测部分;该方法提出一种试卷版面题目自动拆分的方法,本方法主要针对包含数学、语文、英语等常用试卷在内的试卷版面题目自动拆分,本发明所述试卷版面题目拆分是指,通过本方法(包括但不限于本方法)从扫描或拍摄等方式获取的试卷图像数据中将每道题目单独完整检测,并获得其在试卷中的坐标位置信息的过程。
技术领域
本发明涉及图像目标检测与识别技术领域,具体为一种试卷版面题目自动拆分的方法。
背景技术
目标检测作为图像处理中的一个重要应用领域,在智能交通、安防、医疗、教育等领域得到了广泛的应用。同时,随着深度学习方法的不断应用,目标检测精度得到了大幅度的提高,尤其是目标物体具有特定形体特征的场景,目标检测准确率很高。然而,深度学习技术在试卷版面题目拆分中的应用较少,本方法将深度学习技术强大的卷积神经网络引入试卷版面题目拆分中,提出一种专门解决试卷版面题目拆分的新方法。
现有的针对试卷版面题目拆分中大多都是基于试卷版面题目固定位置拆分单个试题,这种拆分方法对不同板式试卷需要变更已知的试题坐标位置信息,不能适应所有版面试卷。而将深度学习的方法在版面分析的应用已经出现,其主要是利用强大的卷积神经网络分析版面中存在的文字区域、图片、表格和公式等检测,本质还是目标检测算法在版面分析中的直接使用,而将目标检测方法在试卷版面分析中以每道题为目标进行拆分的应用较少。以题目为目标单位自动拆分的方法能够将试卷中所有类型题目独立检测并拆分,有利于后续对每道题目单独OCR识别和知识点判定。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种试卷版面题目自动拆分的方法,通过将深度学习技术引入到试卷版面题目自动拆分中,解决了现有试卷版面题目基于固定位置拆分单个试题导致的非灵活扩展和手动标注数据耗时问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种试卷版面题目自动拆分的方法,其特征在于;该系统基于改进后的yolov3网络架构设计,主要包含仿真数据生成、图片特征提取和特征层预测部分。
优选的,所述主要特征具体描述为:主干网络yolov3用于从输入为1024x768大小图片中提取符合版面需要的特征,从而得到1/4、1/8、1/16和1/32四个特征图,四个特征图经过单独卷积后独立预测,同时当前特征图经过上采样后,与下层特征图拼接,并参与下层计算。
优选的,所述仿真数据生成具体描述为:使用程序设计自动生成和真实样本高度相似的训练数据,通过程序控制,在仿真数据过程中,随机生成指定数量的包含各种版面试卷题目图片及label数据。
优选的,所述图片特征提取具体描述为:在原有1/8、1/16和1/32特征图大小的基础上,新增1/4大小特征图参与预测,同时,主干网络中第三和第四个残差块的次数降为4,以此解决增加特征图个数带来的计算量问题,特征图单独预测中,舍弃原有3x3大小卷积,增加用于预测的特征图之间的拼接关系,使得上层预测特征图也参与下层预测。
优选的,所述分层预测具体描述为:权利4中所述特征提取到的四个不同层的特征图,分别进行convolutional set操作,该操作由多个1x1和3x3卷积组成,该操作结果进行上采样,并与下层特征图拼接后,经过1x1卷积得到用于预测的特征图,为了再次降低计算量,此处去掉原有3x3大小卷积操作,本方法将四个用于预测的F1-F4个特征图上采样,并使其与下层特征融合,丰富其特征。
优选的,包括以下具体步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽七天教育科技有限公司,未经安徽七天教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910884281.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数学公式自动识别的方法
- 下一篇:一种虹膜采集识别装置及方法