[发明专利]基于深度学习的试卷卷头学生信息自动检测方法有效

专利信息
申请号: 202110388294.X 申请日: 2021-04-12
公开(公告)号: CN113076900B 公开(公告)日: 2022-06-14
发明(设计)人: 陈向乐;黄双萍 申请(专利权)人: 华南理工大学
主分类号: G06V30/40 分类号: G06V30/40;G06V30/148;G06V10/774;G06V10/764;G06V10/80;G06K9/62;G06N3/04
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 试卷 学生 信息 自动检测 方法
【权利要求书】:

1.基于深度学习的试卷卷头学生信息自动检测方法,其特征在于,包括以下步骤:

S1、数据获取,使用扫描仪对多张学生试卷的正面进行扫描得到多张试卷全图,对试卷图像的卷头位置进行裁剪,得到多张试卷卷头图像;

S2、标注数据,对试卷卷头图像进行人工标注获取学生信息的检测框,并划分训练集和测试集;

S3、数据合成,通过合成数据扩充数据量;具体包括:

S31、对人工标注的真实数据进行数据统计分析,包括试卷卷头图像的宽高比、标注框的宽高比和大小以及标注框之间的距离;

S32、根据数据统计结果,设置生成图像的宽高、文本间距,自动化生成包含待填项目但还没有填写学生信息的试卷卷头图像,同时存储待填项目类别和坐标;

S33、在互联网上爬取学生信息的语料,包括学生姓名、班级以及学校,过滤长度大于10的文字信息,据信息所属的项目将其存入不同的json文件中,则每个json文件构成一个语料库,包含不同项目的学生信息;

S34、下载中文手写数据集,作为后续粘贴手写体单字图像的图像库;

S35、对试卷卷头的每一个待填项目,分别从对应的项目语料库中随机选取一条信息,对该条信息的每一个文字,图像库中都有与之对应的不同人手写的一组单字图像,从这组对应的图像中随机挑选一张,将该单字图像有序粘贴到试卷卷头图像中的待填项目右侧;

S36、对试卷卷头图像进行仿射变换、添加椒盐噪声、旋转以及高斯模糊;

S37、基于步骤S31至S36合成多张图像,与人工标注的真实数据合并构成训练集;

S4、构造文本检测器,使用卷积神经网络构造文本检测器,文本检测器包括特征提取网络、候选文本区域生成网络、区域特征采样模块以及文本定位网络,并且对候选文本区域生成网络和文本定位网络设计不同的损失函数;

S5、训练文本检测器,采用预训练模型,设置训练相关参数,将带标注的数据输入到文本检测器中训练;

S6、将测试数据输入训练好的文本检测器进行检测,得到学生信息的检测结果和概率。

2.根据权利要求1所述的基于深度学习的试卷卷头学生信息自动检测方法,其特征在于,所述步骤S2具体包括:

采用标注软件,人工标定学生信息的水平矩形框,包括位置和类别的标定;

将水平矩形框左上角的坐标以及宽高数据记录于文件中;

将图像随机划分为训练集和测试集。

3.根据权利要求1所述的基于深度学习的试卷卷头学生信息自动检测方法,其特征在于,所述特征提取网络具体为:

特征提取网络采用残差神经网络中的ResNet50和双向特征金字塔网络BiFPN,所述ResNet50通过捷径连接的方式既提高了特征提取能力,又缓解了网络退化问题;

所述BiFPN对提取到的不同层的特征同时进行自底向上和自顶向下的融合,最终得到多通道特征图F1。

4.根据权利要求3所述的基于深度学习的试卷卷头学生信息自动检测方法,其特征在于,所述候选文本区域生成网络具体为:

将多通道特征图F1输入到候选文本区域生成网络,得到候选文本区域R;

所述候选文本区域生成网络包括二分类网络以及检测框回归网络;

在二分类网络中,将F1输入卷积核大小为3*3,步长为1的卷积层256C中,输出256个通道的特征图F2;接着将特征图F2输入卷积层2kC中,卷积核大小为1*1,步长为1,输出通道数为2k;

在检测框回归网络中,将F1输入卷积层256C中进行特征提取得到特征图F2后输入到卷积层2kC后得到4k个坐标回归结果;

所述特征图F1每个像素点都预定义了k个不同尺寸和比例的锚点anchor,基于anchor回归可得到映射回原图的k个候选区域,每个候选区域包含2个分类置信度,对应二分类网络的2k个输出。

5.根据权利要求4所述的基于深度学习的试卷卷头学生信息自动检测方法,其特征在于,所述区域特征采样模块具体为:

给定整图的特征图F1和候选文本区域R,将F1的对应区域划分m*m个部分,对每个部分采样一个特征向量得到m*m尺寸的局部区域特征图F3。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110388294.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top