[发明专利]一种提高OCR识别率的方法在审
申请号: | 201710928072.6 | 申请日: | 2017-10-09 |
公开(公告)号: | CN107633245A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 周聪伟 | 申请(专利权)人: | 深圳市乐唯科技开发有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32 |
代理公司: | 深圳市凯达知识产权事务所44256 | 代理人: | 王琦 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 ocr 识别率 方法 | ||
技术领域
本发明涉及图像字符识别技术领域,具体涉及一种提高OCR识别率的方法。
背景技术
光学字符识别,简称OCR(Optical Character Recognition),是对输入图像进行电子扫描并从中提取文字的过程,相比人工手打文字速度快,出错率低,能节省大量人力资源,还可用于各种领域的自动化识别如车牌识别、身份证识别、银行卡识别等。
OCR识别率,即从图像中识别出文字的准确率。未识别出文字,已识别出文字的顺序,识别出来的文字是否正确都会对其产生影响。
综上,OCR识别对输入图形质量的要求较高,往往用户需要提供质量较高的图像才能有较好的识别质量。分辨率不能太低,色彩不能太丰富,对比度不能太低,图像上的文字不能有偏斜。OCR不可能每次识别都完全准确,所以还需要后期的人工校对。
发明内容
本发明的目的在于提供一种提高OCR识别率的方法,采用创新的技术手段预处理用户输入图像的质量,来提升OCR识别率,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种提高OCR识别率的方法,包括如下步骤:
S1:分辨率的控制,将待识别图像的分辨率控制在300dpi;
S2:亮度与对比度调整,对待识别的图像进行亮度调整,并调整文字在图像中的对比度,让文字更加显眼;
S3:灰度化,对已输入图像进行灰度处理,即使用算法将文字和其他颜色独立开,将图像处理成黑白二种色彩;
S4:图像角度纠正,对需要的图像进行旋转,调整其角度,使得图像上的文字不偏不斜。
优选的,所述图像分辨率的控制可通过iOS平台研发的文字扫描App实现。
优选的,所述文字扫描App内置Tesseract-OCR开源框架,通过Tesseract-OCR开源框架对图像的亮度和对比度进行自动调整。
优选的,所述文字扫描App连接开源跨平台计算机视觉库openCV对图像进行灰度化处理。
优选的,所述图像角度纠正可通过在文字扫描App展示图像的交互界面进行手动校正。
优选的,所述图像文字通过App输出识别后的文字到屏幕上,供用户对其进行编辑或拷贝。
与现有技术相比,本发明的有益效果是:
本发明提出的提高OCR识别率的方法,通过对待识别的图像依次经过分辨率的控制、亮度与对比度调整、灰度化及图像角度纠正等四个步骤,预处理用户输入图像的质量,使得图像文字的输出效果更加清晰,色彩更加分明,从而大大提升了OCR的识别率。
附图说明
图1为本发明实施例一工作流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中:一种提高OCR识别率的方法,包括如下步骤:
第一步:分辨率的控制,分辨率如果太低,OCR就无法从图像上得到足够的信息,识别率就会很低;相反如果分辨率太高,OCR会从图像上获取太多的信息,一些无用的信息会对OCR识别造成干扰,也会降低识别率,因此,将待识别图像的分辨率控制在300dpi左右,经过验证这个分辨率最为合适;
第二步:亮度与对比度调整,因为图像可能是在不同环境下拍摄的,其文字字迹可能比较淡,这时候灰度化可能并不能提高识别率,所以需要先调整图像的亮度,增加文字在图像上的对比度,让文字颜色更突出,而达到更高的OCR识别率;
第三步:灰度化,通常图像上都会携带大量的色彩,过多的色彩会对识别造成干扰,而文字的色彩往往都比较单一,因此使用灰度模式,通过算法将图像所有像素点变成黑色或白色两种色彩,将大大提高OCR的识别率;
第四步:图像角度纠正,同样因为拍摄环境的不同,图像可能是倾斜的,这种情况下经常会出现识别错误或者根本就识别不出来文字的情况,所以需要纠正图像的角度,让图像上的文字不偏不斜,也能提高OCR识别率。
具体实施例一:
请参阅图1,基于上述描述,以iOS平台文字扫描App为例,包括以下步骤:
第一步:用户打开文字扫描App拍照;
第二步:App对拍照得到的照片进行处理,改变图像的分辨率为300pdi;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市乐唯科技开发有限公司,未经深圳市乐唯科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710928072.6/2.html,转载请声明来源钻瓜专利网。