[发明专利]一种水印图像OCR识别方法及其系统在审
申请号: | 201810025351.6 | 申请日: | 2018-01-09 |
公开(公告)号: | CN108229460A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 欧阳永中 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/38;G06T1/00;G06T5/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 梁嘉琦 |
地址: | 528000 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 水印标识 水印 二值化处理 水印图像 图像 灰度处理 获取图像 区域对应 锐化处理 统一处理 原始图像 整体图像 坐标矫正 合并 标定 灰度 去除 锐化 图案 统一 图片 | ||
本发明公开了一种水印图像OCR识别方法及其系统,包括以下步骤,对图像进行坐标矫正;获取图像的水印标识;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上;执行OCR识别。本发明通过将水印部分的图案提出进行灰度、锐化、二值化处理后合并到原图中统一进行OCR识别,由于仅仅对水印部分区域的图像进行处理,不会因为统一处理导致整体图像识别困难,凸显出水印部分的文字,能有效提高对水印部分文字的识别准确性。
技术领域
本发明涉及图像识别领域,特别是一种水印OCR识别方法及其系统。
背景技术
带水印的图片,就是在文字的上面添加上一层半透明的图像,这层图像不会影响读者对于文字的阅读。OCR文字识别,指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。
发明内容
为解决上述问题,本发明的目的在于提供一种能够识别出包括水印图像上文字的一种水印OCR识别方法及其系统。
本发明解决其问题所采用的技术方案是:
一种水印图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;
将二值化处理后的水印标识部分的区域根据坐标合并到原始图像上,形成待处理图像;
对待处理图像执行OCR识别。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
进一步,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
一种水印图像OCR识别系统,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810025351.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种目标跟踪方法
- 下一篇:一种基于深度学习的隧道裂缝快速识别方法