[发明专利]OCR识别文件的处理方法及其电子设备在审

申请号：	201910198318.8	申请日：	2019-03-15
公开（公告）号：	CN110059559A	公开（公告）日：	2019-07-26
发明（设计）人：	刘丽珍;吕小立	申请（专利权）人：	深圳壹账通智能科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	深圳市立智方成知识产权代理事务所(普通合伙) 44468	代理人：	王增鑫
地址：	518052 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	有效性条件图片缓存待识别文件电子设备重新获取计算机存储介质图像处理领域有效性检查图片生成图像检测系统资源服务器舍弃
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及图像处理领域，尤其是图像检测中的OCR识别的细分领域，公开一种OCR识别文件的处理方法，通过获取待识别文件的图片，并将所述图片进行缓存；根据有效性条件对所述图片进行有效性检查；当所述图片不符合所述有效性条件时，重新获取相应的图片；根据所述缓存的图片和重新获取的图片生成OCR识别文件。本发明还相应提供一种电子设备和计算机存储介质。本发明提供的技术方案，能够判断待识别文件中是否存在针对OCR识别的不符合有效性条件的识别缺陷，并且通过将全部图片缓存在本地或服务器中，不需要在发生识别缺陷时舍弃全部图片，提升影响生成后续供OCR识别文件的生成效率，避免浪费系统资源。

技术领域

本发明涉及图像识别领域，更具体地，涉及一种OCR识别文件的处理方法及其电子设备。

背景技术

OCR(Optical Character Recognition，光学字符识别)主要通过对载体上显示的光学字符进行识别，生成文本输出。以纸质文件的OCR识别为例，通过采集纸质文件上的印刷体得到的光学字符，对其进行识别，即可得到文本信息等数据。

当OCR识别的待识别文件中出现识别缺陷时，例如是OCR识别文件中出现漏页、某些图像模糊或者程序错误等情况。现有技术的技术方案只能是舍弃前期已经处理的图片，重新采集待识别文稿的图片作为OCR识别文件。例如在扫描或拍摄多页合同文件时，很有可能出现影响OCR识别文件等情况，此时只能舍弃已经得到的OCR识别文件的全部图片，重新进行图片采集。

现有技术中的技术方案生成待识别文件的效率较低，耗时长，重复操作次数多，不能满足现在的OCR识别要求。

发明内容

鉴于上述问题，本发明提出了一种OCR识别文件的处理方法，避免上述技术缺陷，能提升OCR待识别文件的生成效率。

第一方面，本发明实施例中提供了一种OCR识别文件的处理方法，包括：

获取待识别文件的图片，并将所述图片进行缓存；

根据有效性条件对所述图片进行有效性检查；

当所述图片不符合所述有效性条件时，重新获取相应的图片；

根据所述缓存的图片和重新获取的图片生成OCR识别文件。

结合第一方面，所述获取待识别文件的图片的步骤包括：

依次获取待识别文件的多张图片；

所述根据有效性条件对所述图片进行有效性检查的步骤，包括：

在生成OCR识别文件前，根据完整性条件对多张缓存的图片进行完整性检查；