[发明专利]空白行区域检测方法及设备有效
申请号: | 202010591376.X | 申请日: | 2020-06-24 |
公开(公告)号: | CN111738170B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王翔;兴百桥;刘军 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/146;G06T7/00;G06T7/62 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空白 区域 检测 方法 设备 | ||
本申请实施例提供一种空白行区域检测方法及设备,包括:获得文本图像中至少两个连通域;在至少两个连通域中确定至少一个目标连通域及对应的横向碰撞连通域;根据至少一个目标连通域及对应的横向碰撞连通域确定至少一个文本行;确定文本行的各个连通域对应的纵向碰撞连通域;当各个连通域与对应的纵向碰撞连通域间的垂直距离值均大于或等于垂直距离阈值时,确定各个连通域对应的纵向碰撞连通域与文本行之间存在空白行区域。该空白行区域检测方法能够对包括倾斜文本的文本图像中的空白行区域进行检测,提高了对文本图像中的空白行区域进行检测的成功率。
技术领域
本申请实施例涉及图像处理技术领域,尤其涉及一种空白行区域检测方法及设备。
背景技术
随着技术的进步,在批改学生的作业时,可以通过获取作业的文本图像,对作业进行自动批改,其中,较为重要的一步是对作业的文本图像进行拆分,以便于根据拆分后的图像进行题目拆分。
通常情况下,可以使用空白行区域检测方法在作业的文本图像中确定未包括任何文本的空白行区域,根据空白行区域对作业的文本图像进行拆分。在一种空白行区域检测方法中,通过投影方法得到文本图像中每个连通域在Y轴上的投影,将Y轴上未被任一投影覆盖的像素所在的像素行确定为空白像素行,将连续多个空白像素行所在的区域确定为空白行区域。
虽然上述方法可以对文本图像中的空白行区域进行检测,但实际中由于拍摄角度的问题,文本图像可能包括倾斜的文本行,在这种状况下即使文本图像中存在空白行区域,该空白行区域中的像素行在Y轴上的像素也可能被文本图像中的连通域在Y轴上的投影所覆盖,因此上述方法无法对包括倾斜文本的文本图像中空白行区域进行检测,对文本图像中的空白行区域进行检测的成功率较低。
发明内容
有鉴于此,本发明实施例所解决的技术问题之一在于提供一种空白行区域检测方法及设备,用以克服现有技术中存在的缺陷。
第一方面,本申请实施例提供了一种空白行区域检测方法,包括:
获得文本图像中至少两个连通域;
在至少两个连通域中确定至少一个目标连通域及对应的横向碰撞连通域,目标连通域在纵坐标轴上的投影和目标连通域对应的横向碰撞连通域在纵坐标轴上的投影存在重叠,且目标连通域与对应的横向碰撞连通域间的水平距离值小于或等于水平距离阈值;
根据至少一个目标连通域及对应的横向碰撞连通域确定至少一个文本行;
确定文本行的各个连通域对应的纵向碰撞连通域,连通域在横坐标轴上的投影和连通域对应的纵向碰撞连通域在横坐标轴上的投影存在重叠;
当各个连通域与对应的纵向碰撞连通域间的垂直距离值均大于或等于垂直距离阈值时,确定各个连通域对应的纵向碰撞连通域与文本行之间存在空白行区域。
可选地,在本申请一个实施例中,文本行的各个连通域对应的纵向碰撞连通域位于文本行的同一侧。
可选地,在本申请一个实施例中,在至少两个连通域中确定至少一个目标连通域及对应的横向碰撞连通域,包括:
确定至少两个连通域中各个连通域对应的横向碰撞连通域,连通域在纵坐标轴上的投影和连通域对应的横向碰撞连通域在纵坐标轴上的投影存在重叠;
获取各个连通域与对应的横向碰撞连通域之间的距离,根据各个连通域与对应的横向碰撞连通域之间的距离在各个连通域中确定至少一个目标连通域及对应的横向碰撞连通域。
可选地,在本申请一个实施例中,确定至少两个连通域中各个连通域对应的横向碰撞连通域,包括:
根据连通域中心点的横坐标或纵坐标对至少两个连通域进行排序;
依次确定排序后的至少两个连通域中各个连通域对应的横向碰撞连通域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010591376.X/2.html,转载请声明来源钻瓜专利网。