[发明专利]空白行区域检测方法及设备有效
申请号: | 202010591376.X | 申请日: | 2020-06-24 |
公开(公告)号: | CN111738170B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王翔;兴百桥;刘军 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/146;G06T7/00;G06T7/62 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空白 区域 检测 方法 设备 | ||
1.一种空白行区域检测方法,其特征在于,包括:
获得文本图像中至少两个连通域;
在所述至少两个连通域中确定至少一个目标连通域及对应的横向碰撞连通域,所述目标连通域在纵坐标轴上的投影和所述目标连通域对应的横向碰撞连通域在所述纵坐标轴上的投影存在重叠,且所述目标连通域与对应的横向碰撞连通域间的水平距离值小于或等于水平距离阈值;
根据所述至少一个目标连通域及对应的横向碰撞连通域确定至少一个文本行;
确定所述文本行的各个连通域对应的纵向碰撞连通域,所述文本行的各个连通域对应的纵向碰撞连通域位于所述文本行的同一侧,所述文本行的各个连通域在横坐标轴上的投影和所述文本行的各个连通域对应的纵向碰撞连通域在所述横坐标轴上的投影存在重叠;
当所述文本行的各个连通域与对应的纵向碰撞连通域间的垂直距离值均大于或等于垂直距离阈值时,确定所述文本行的各个连通域对应的纵向碰撞连通域与所述文本行之间存在空白行区域。
2.根据权利要求1所述的空白行区域检测方法,其特征在于,所述在所述至少两个连通域中确定至少一个目标连通域及对应的横向碰撞连通域,包括:
确定所述至少两个连通域中各个连通域对应的横向碰撞连通域,所述连通域在纵坐标轴上的投影和所述连通域对应的横向碰撞连通域在所述纵坐标轴上的投影存在重叠;
获取所述各个连通域与对应的横向碰撞连通域之间的距离,根据所述各个连通域与对应的横向碰撞连通域之间的距离在所述各个连通域中确定至少一个目标连通域及对应的横向碰撞连通域。
3.根据权利要求2所述的空白行区域检测方法,其特征在于,所述确定所述至少两个连通域中各个连通域对应的横向碰撞连通域,包括:
根据连通域中心点的横坐标或纵坐标对所述至少两个连通域进行排序;
依次确定排序后的所述至少两个连通域中各个连通域对应的横向碰撞连通域。
4.根据权利要求1所述的空白行区域检测方法,其特征在于,所述确定所述文本行的各个连通域对应的纵向碰撞连通域,包括:
根据连通域中心点的横坐标或纵坐标对所述文本行的连通域进行排序;
依次确定排序后的所述文本行的连通域中各个连通域所对应的纵向碰撞连通域。
5.根据权利要求1所述的空白行区域检测方法,其特征在于,所述获得文本图像中至少两个连通域,包括:
对所述文本图像进行二值化处理,以获取所述文本图像的二值图;
根据所述二值图进行连通域分析,并根据连通域分析结果获得所述文本图像中至少两个连通域。
6.根据权利要求1所述的空白行区域检测方法,其特征在于,所述获得文本图像中至少两个连通域,包括:
获得所述文本图像中每个连通域,并获得每个连通域的面积值;
将所述文本图像中面积值大于或等于第一面积阈值且小于或等于第二面积阈值的至少两个连通域确定为所述文本图像中至少两个连通域。
7.根据权利要求1所述的空白行区域检测方法,其特征在于,所述方法还包括:
根据所述空白行区域对所述文本图像进行拆分,以获取至少两个子文本图像;
将所述子文本图像输入题目拆分网络进行题目拆分,以获取题目拆分信息;
根据所述题目拆分信息获取所述文本图像中的至少一个题目图像区域,所述题目图像区域仅包含一道题目。
8.根据权利要求7所述的空白行区域检测方法,其特征在于,所述方法还包括:
将所述题目图像区域输入题号检测网络中进行题号检测,以获取题号拆分信息;
根据所述题号拆分信息获取所述题目图像区域中的至少一个题号图像区域,所述题号图像区域仅包含一道子题目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010591376.X/1.html,转载请声明来源钻瓜专利网。