[发明专利]OCR识别文件的处理方法及其电子设备在审
申请号: | 201910198318.8 | 申请日: | 2019-03-15 |
公开(公告)号: | CN110059559A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 刘丽珍;吕小立 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有效性条件 图片 缓存 待识别文件 电子设备 重新获取 计算机存储介质 图像处理领域 有效性检查 图片生成 图像检测 系统资源 服务器 舍弃 | ||
1.一种OCR识别文件的处理方法,其特征在于,包括:
获取待识别文件的图片,并将所述图片进行缓存;
根据有效性条件对所述图片进行有效性检查;
当所述图片不符合所述有效性条件时,重新获取相应的图片;
根据所述缓存的图片和重新获取的图片生成OCR识别文件。
2.根据权利要求1所述的OCR识别文件的处理方法,其特征在于,所述获取待识别文件的图片的步骤包括:
依次获取待识别文件的多张图片;
所述根据有效性条件对所述图片进行有效性检查的步骤,包括:
在生成OCR识别文件前,根据完整性条件对多张缓存的图片进行完整性检查;
所述当所述图片不符合所述有效性条件时,重新获取相应的图片的步骤,包括:
当所述图片不符合所述完整性条件时,获取待识别文件的相应缺失部分的图片。
3.根据权利要求2所述的OCR识别文件的处理方法,其特征在于,所述根据完整性条件对多张缓存的图片进行完整性检查的步骤,包括:
对所述缓存的图片的页码进行OCR识别,判定所述页码的连续性,当页码不连续时,判断所述图片漏页。
4.根据权利要求2所述的OCR识别文件的处理方法,其特征在于,所述根据完整性条件对多张缓存的图片进行完整性检查的步骤,包括
对所述缓存的图片的文本内容进行OCR识别,并获取所述文本内容中的关键词;
根据所述关键词对图片进行验证,若图片中识别的关键词与其他图片的关键词不一致,判定所述图片漏页。
5.根据权利要求2所述的OCR识别文件的处理方法,其特征在于,所述根据完整性条件对多张缓存的图片进行完整性检查的步骤,包括
分别对上一张图片的末行文本和下一张图片的首行文本进行OCR识别,得到第一文本内容和第二文本内容;
对所述第一文本内容和第二文本内容进行自然语义分析,若第一文本内容和第二文本内容不符合连续性,判定所述图片漏页。
6.根据权利要求3至5任一项所述的OCR识别文件的处理方法,其特征在于,所述重新获取相应的图片的步骤,包括:
根据所述漏页的位置,重新获取所述漏页的图片;
所述根据所述缓存的图片和重新获取的图片生成OCR识别文件的步骤,包括:
根据待识别文件的顺序将所述漏页的图片插入到所述缓存的图片相应的缺失位置,将所有图片转换为OCR识别文件。
7.根据权利要求1所述的OCR识别文件的处理方法,其特征在于,所述根据有效性条件对所述图片进行有效性检查的步骤,包括:
在生成OCR识别文件前,根据识别性条件对所述图片进行可识别性检查;
所述当所述图片不符合所述有效性条件时,重新获取相应的图片的步骤,包括:
当所述图片不具备可识别性时,重新获取相应的图片;
所述根据所述缓存的图片和重新获取的图片生成OCR识别文件的步骤,包括:
将所述重新获取的图片替换所述不具备可识别性的图片,根据所述缓存的图片和替换的图片生成OCR识别文件。
8.根据权利要求1所述的OCR识别文件的处理方法,其特征在于,所述根据有效性条件对所述图片进行有效性检查的步骤,包括:
在生成OCR识别文件前,判断所述图片是否存在虚化、存在非可识别区域或变形;
所述当所述图片不符合所述有效性条件时,重新获取相应的图片的步骤,包括:
根据所述存在虚化或存在非可识别区域或变形的图片的位置,重新获取相应位置的图片。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1~8任意一项所述的OCR识别文件的处理方法。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行如权利要求1~8中任一项权利要求所述的OCR识别文件的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910198318.8/1.html,转载请声明来源钻瓜专利网。