[发明专利]一种复杂场景下的试卷分割算法有效
申请号: | 201910031875.0 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109815948B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 李晓光;王麟腾;高猛;王世禹 | 申请(专利权)人: | 辽宁大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 沈阳杰克知识产权代理有限公司 21207 | 代理人: | 罗莹 |
地址: | 110000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 场景 试卷 分割 算法 | ||
一种复杂场景下的试卷分割算法,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。本发明提供的分割算法,在复杂场景下的试卷分割任务中具有很好的分割效果,可以很好的把字符区域、文本行区域、试题区域分割出来。
技术领域
本发明属于电子图像分割技术以及卷积神经网络领域,特别涉及一种复杂场景下的试卷分割算法。
背景技术
随着智慧教育以及人工智能的发展,在诸多应用场景中,移动设备拍摄的试卷图像分割是其中一个关键环节。由于移动设备拍摄场景和角度不固定,图像的尺寸、清晰度、局部曝光程度往往具有不确定性,试卷本身存在手写体打印体混合等复杂场景。目前已经出现了上千种图像分割的方法,但是在复杂场景下的试卷分割任务中,对于字符区域、文本行区域、试题区域分割效果往往难以满足需求。
发明内容
为了解决上述问题,本发明针对复杂场景下的试卷图像,提供一种能够很好的将字符区域、文本行区域、试题区域分割出来的复杂场景下的试卷分割算法。
为了实现上述目的,本发明创造采用的技术方案为:一种复杂场景下的试卷分割算法,其特征在于,其步骤为:
1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;
2)通过图像边缘计算连通区域以及其外接矩形;
3)根据不同连通区域外接矩形的IOU合并连通区域;
4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;
5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;
6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。
所述的步骤1)中,具体方法为:
1.1)将原始图像O通过颜色图像空间转换为灰度图像G;
1.2)通过边缘检测算法提取G的图像边缘E。
所述的步骤2)中,具体方法为:
2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠Aj;
2.2)计算Ai的外接矩形Di,记作Di=F(Ai),其中Di=(Xi,Yi,Wi,Hi),Xi,Yi,Wi,Hi分别表示Di左上顶点横坐标、左上顶点纵坐标、Di的宽度、Di的高度。
所述的步骤3)中,具体方法为:
3.1)计算Di与Dj的IOU,其中Dj∈{Di|i∈[1,n],i≠j};
3.2)设置阀值α,如果IOU>α,则Di←F(Ai∪Aj)且D←D-{Dj}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910031875.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:应用的测试方法、装置和计算机设备
- 下一篇:基于神经网络的发票公示方法和系统