[发明专利]文字检测识别方法、装置、电子设备及存储介质在审

申请号：	202111279385.6	申请日：	2021-10-30
公开（公告）号：	CN113920295A	公开（公告）日：	2022-01-11
发明（设计）人：	侯丽	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06V10/22	分类号：	G06V10/22;G06V30/10;G06T7/11;G06T7/62
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	熊永强
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字检测识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种文字检测识别方法、装置、电子设备及存储介质，其中，该方法包括：对原始图像进行印章检测，得到印章区域；采用原始图像的背景颜色的均值对印章区域进行填充，得到待检测图像；对待检测图像进行文字检测，得到待识别文字区域图像；对待识别文字区域图像进行表格框线检测，得到表格框线检测结果；根据表格框线检测结果确定待识别文字区域图像的裁剪位置，以及基于裁剪位置对待识别文字区域图像进行裁剪，得到裁剪后的待识别文字区域图像；基于裁剪后的待识别文字区域图像，得到文字识别结果。本申请实施例有利于提升文字检测和识别的精度。

技术领域

本申请涉及图像识别技术领域，尤其涉及一种文字检测识别方法、装置、电子设备及存储介质。

背景技术

随着计算机性能的不断提高，高度依赖中央处理器或图形处理器等计算资源的深度学习技术广泛应用于社会各行各业中，并取得了突出的成果。OCR(Optical CharacterRecognition，光学字符识别)技术是近年来发展较为成熟的基于深度学习的技术，其是指电子设备检查物件上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。一般情况下，OCR技术能够胜任文字的定位和识别，但是考虑到深度学习中神经网络在实现机制和资源占用等方面的限制，当物件存在干扰、噪声、失真等情况时，文字检测和识别的精度会受到影响。

发明内容

针对上述问题，本申请提供了一种文字检测识别方法、装置、电子设备及存储介质，有利于提升文字检测和识别的精度。

为实现上述目的，本申请实施例第一方面提供了一种文字检测识别方法，该方法包括：

对原始图像进行印章检测，得到印章区域；

采用原始图像的背景颜色的均值对印章区域进行填充，得到待检测图像；

对待检测图像进行文字检测，得到待识别文字区域图像；

对待识别文字区域图像进行表格框线检测，得到表格框线检测结果；

根据表格框线检测结果确定待识别文字区域图像的裁剪位置，以及基于裁剪位置对待识别文字区域图像进行裁剪，得到裁剪后的待识别文字区域图像；

基于裁剪后的待识别文字区域图像，得到文字识别结果。

结合第一方面，在一种可能的实施方式中，对原始图像进行印章检测，得到印章区域，包括：

将原始图像转换为第一二值图像；

根据第一二值图像确定原始图像中的圆形轮廓；