[发明专利]文字检测识别方法、装置、电子设备及存储介质在审
申请号: | 202111279385.6 | 申请日: | 2021-10-30 |
公开(公告)号: | CN113920295A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 侯丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V30/10;G06T7/11;G06T7/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 检测 识别 方法 装置 电子设备 存储 介质 | ||
1.一种文字检测识别方法,其特征在于,所述方法包括:
对原始图像进行印章检测,得到印章区域;
采用所述原始图像的背景颜色的均值对所述印章区域进行填充,得到待检测图像;
对所述待检测图像进行文字检测,得到待识别文字区域图像;
对所述待识别文字区域图像进行表格框线检测,得到表格框线检测结果;
根据所述表格框线检测结果确定所述待识别文字区域图像的裁剪位置,以及基于所述裁剪位置对所述待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;
基于所述裁剪后的待识别文字区域图像,得到文字识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对原始图像进行印章检测,得到印章区域,包括:
将所述原始图像转换为第一二值图像;
根据所述第一二值图像确定所述原始图像中的圆形轮廓;
根据所述原始图像确定所述圆形轮廓的色调;
根据所述圆形轮廓的色调,得到所述印章区域。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一二值图像确定所述原始图像中的圆形轮廓,包括:
根据所述第一二值图像确定出所述原始图像中的轮廓;
计算所述轮廓围成图形的面积与所述轮廓的最小外接圆的面积之比,得到所述原始图像中多个轮廓的面积比;
将所述多个轮廓的面积比与预设的面积阈值进行比对,并将面积比大于或等于预设的面积阈值的轮廓确定为所述圆形轮廓。
4.根据权利要求3所述的方法,其特征在于,所述对所述待识别文字区域图像进行表格框线检测,得到表格框线检测结果,包括:
将所述待识别文字区域图像转换为第二二值图像;
沿高度方向遍历所述第二二值图像的每列像素,对所述每列像素进行求和;
将所述每列像素的求和结果作为元素存入列表,得到长为w的第一列表,w为大于1的整数;
沿宽度方向遍历所述第二二值图像的每行像素,对所述每行像素进行求和;
将所述每行像素的求和结果作为元素存入列表,得到长为h的第二列表,h为大于1的整数;
根据所述第一列表和所述第二列表,得到所述表格框线检测结果。
5.根据权利要求3所述的方法,其特征在于,所述表格框线检测结果包括存在竖向表格框线、存在横向表格框线和不存在表格框线;所述根据所述第一列表和所述第二列表,得到所述表格框线检测结果,包括:
计算所述第一列表中每个位置上的求和结果与相邻位置上的求和结果的第一差值,若所述第一差值中存在大于或等于第一预设值的目标第一差值,则确定所述表格框线检测结果为存在竖向表格框线;
计算所述第二列表中每个位置上的求和结果与相邻位置上的求和结果的第二差值,若所述第二差值中存在大于或等于第二预设值的目标第二差值,则确定所述表格框线检测结果为存在横向表格框线;
若所述第一差值中不存在所述目标第一差值且所述第二差值中不存在所述目标第二差值,则确定所述表格框线检测结果为不存在表格框线。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述表格框线检测结果确定所述待识别文字区域图像的裁剪位置,包括:
在所述表格框线检测结果为存在竖向表格框线和/或存在横向表格框线的情况下,根据竖向表格框线所在的列和/或横向表格框线所在的行确定所述裁剪位置;
在所述表格框线检测结果为不存在表格框线的情况下,根据所述第一列表和所述第二列表中首尾连续的0元素确定所述裁剪位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111279385.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通风换气窗体
- 下一篇:混动车辆的怠速控制方法、装置、设备及存储介质