[发明专利]文字检测识别方法、装置、电子设备及存储介质在审
申请号: | 202111279385.6 | 申请日: | 2021-10-30 |
公开(公告)号: | CN113920295A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 侯丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V30/10;G06T7/11;G06T7/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 检测 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种文字检测识别方法、装置、电子设备及存储介质,其中,该方法包括:对原始图像进行印章检测,得到印章区域;采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;对待检测图像进行文字检测,得到待识别文字区域图像;对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;基于裁剪后的待识别文字区域图像,得到文字识别结果。本申请实施例有利于提升文字检测和识别的精度。
技术领域
本申请涉及图像识别技术领域,尤其涉及一种文字检测识别方法、装置、电子设备及存储介质。
背景技术
随着计算机性能的不断提高,高度依赖中央处理器或图形处理器等计算资源的深度学习技术广泛应用于社会各行各业中,并取得了突出的成果。OCR(Optical CharacterRecognition,光学字符识别)技术是近年来发展较为成熟的基于深度学习的技术,其是指电子设备检查物件上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。一般情况下,OCR技术能够胜任文字的定位和识别,但是考虑到深度学习中神经网络在实现机制和资源占用等方面的限制,当物件存在干扰、噪声、失真等情况时,文字检测和识别的精度会受到影响。
发明内容
针对上述问题,本申请提供了一种文字检测识别方法、装置、电子设备及存储介质,有利于提升文字检测和识别的精度。
为实现上述目的,本申请实施例第一方面提供了一种文字检测识别方法,该方法包括:
对原始图像进行印章检测,得到印章区域;
采用原始图像的背景颜色的均值对印章区域进行填充,得到待检测图像;
对待检测图像进行文字检测,得到待识别文字区域图像;
对待识别文字区域图像进行表格框线检测,得到表格框线检测结果;
根据表格框线检测结果确定待识别文字区域图像的裁剪位置,以及基于裁剪位置对待识别文字区域图像进行裁剪,得到裁剪后的待识别文字区域图像;
基于裁剪后的待识别文字区域图像,得到文字识别结果。
结合第一方面,在一种可能的实施方式中,对原始图像进行印章检测,得到印章区域,包括:
将原始图像转换为第一二值图像;
根据第一二值图像确定原始图像中的圆形轮廓;
根据原始图像确定圆形轮廓的色调;
根据圆形轮廓的色调,得到印章区域。
结合第一方面,在一种可能的实施方式中,根据第一二值图像确定原始图像中的圆形轮廓,包括:
根据第一二值图像确定出原始图像中的轮廓;
计算轮廓围成图形的面积与轮廓的最小外接圆的面积之比,得到原始图像中多个轮廓的面积比;
将多个轮廓的面积比与预设的面积阈值进行比对,并将面积比大于或等于预设的面积阈值的轮廓确定为圆形轮廓。
结合第一方面,在一种可能的实施方式中,对待识别文字区域图像进行表格框线检测,得到表格框线检测结果,包括:
将待识别文字区域图像转换为第二二值图像;
沿高度方向遍历第二二值图像的每列像素,对每列像素进行求和;
将每列像素的求和结果作为元素存入列表,得到长为w的第一列表,w为大于1的整数;
沿宽度方向遍历第二二值图像的每行像素,对每行像素进行求和;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111279385.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通风换气窗体
- 下一篇:混动车辆的怠速控制方法、装置、设备及存储介质