[发明专利]一种OCR图像识别的图像处理方法及系统在审
申请号: | 202010338815.6 | 申请日: | 2020-04-26 |
公开(公告)号: | CN111539415A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 宋国梁;颜长华 | 申请(专利权)人: | 梁华智能科技(上海)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38;G06K9/46 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 邹成娇 |
地址: | 201900 上海市宝山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ocr 图像 识别 处理 方法 系统 | ||
本发明公开了一种OCR图像识别的图像处理方法,包括S1.对待识别图像进行预处理,以输出符合预设规范的图像数据;S2.对预处理后的图像进行再处理以确定图像位置并进行图像上的字符定位;S3.进行文字识别、校正,并在字符识别、校正过程中进行反馈式重复识别,以获得最终的OCR识别结果。本方法和系统主要针对机打发票、各种表格、单证进行识别,识别精度高,识别速度快,适应性强,通过图像预处理校正和字符定位,增强OCR中的抗干扰能力,并基于理解度的反馈算法(即反馈模型)可以提高OCR的准确率,对于部分信息缺失以及识别错误有很强的纠正能力;能够相对传统OCR识别技术的识别效果,大大提升识别准确度。
技术领域
本发明涉及汉字识别技术领域,具体而言,为一种OCR图像识别方法及系统。
背景技术
OCR(Optical Character Recognition,光学字符识别)技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
随着图像传感器的不断发展,尤其是各种手机和专业(如安防)摄像头数目的指数增加,计算机图像数据在飞速增加;但图像质量则相对传统扫描仪或各种专业相机又相对降低;传统汉字OCR技术面临源图像数据质量不高,污染严重时,识别率会剧烈下降的问题。
计算机图像的汉字内容识别(汉字OCR)是图像识别中的难点问题,相对于英文字符识别,汉字数量众多,基本字符相似度高,易受干扰,分辨困难。对于票据,还会受到各种票据底纹、打印位置、打印清晰程度、覆盖污染物(章)的剧烈影响。根据2018年的相关市场调查,针对手机拍照的各种票据,市场上多家传统OCR厂商的测试效果均不理想,虽然新一代以深度神经网络为基础的端到端的OCR的方案在西方字符OCR领域取得了较好效果,但汉字由于基数庞大,需要的训练数据集要超过西方字符集的上千倍(保守估算),因此至今开放AI平台上的汉字OCR在较差的图像上表现相当不理想,并且,端到端的深度神经网络存在天然的误识别,易受到攻击。
有鉴于此,特提出本发明。
发明内容
针对现有技术中的缺陷,本发明提供一种OCR图像识别的图像处理方法及系统,以提高OCR的准确率。
为实现上述目的,本发明的技术方案如下:
一种OCR图像识别的图像处理方法,包括
S1.对待识别图像进行预处理,以输出符合预设规范的图像数据;
S2.对预处理后的图像进行再处理以确定图像位置并进行图像上的字符定位;
S3.进行文字识别、校正,并在字符识别、校正过程中进行反馈式重复识别,以获得最终的OCR识别结果。
进一步的,上述的OCR图像识别的图像处理方法中,所述对待识别图像进行预处理包括图像校正,图像校正包括三个阶段:
图像初步处理阶段,将待识别图像校正到规范形态;
初步字符识别反馈阶段,通过增设目标函数,根据字符识别过程反馈的信息对待识别图像进行再次校正处理;
字符识别并理解反馈阶段,通过增设目标函数,根据对字符识别信息进行检验过程中反馈的信息,对待识别图像进行再次校正处理。
进一步的,上述的OCR图像识别的图像处理方法中,所述对预处理后的图像进行处理以确定图像位置并进行图像上的字符定位,包括
去除待识别图像干扰信息,然后将图像二值化;
对待识别图像进行模糊处理,获得充分模糊的图像;
识别图像上的待识别文字的中心位置,对这些中心进行序列化处理,在其周围进行神经网络滑窗处理获取图像字符位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梁华智能科技(上海)有限公司,未经梁华智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010338815.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序