[发明专利]一种分离式OCR识别方法及其系统在审
申请号: | 201810025349.9 | 申请日: | 2018-01-09 |
公开(公告)号: | CN108319945A | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 欧阳永中 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34;G06K9/46 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 梁嘉琦 |
地址: | 528000 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 水印标识 水印 标识符 去除 二值化处理 灰度处理 获取图像 区域对应 锐化处理 坐标模型 标定 图像 合并 图片 | ||
本发明公开了一种分离式图像OCR识别方法及其系统,包括以下步骤:建立坐标模型;获取图像的水印标识;标定坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别;根据水印标识部分区域对应坐标在待处理文字中插入标识符;灰度处理;USM锐化处理;二值化处理;对含水印标识部分的区域执行OCR识别;将相应待插入文字根据插入标识符插入到待处理文字。本发明采用文字分离的方式,将非水印部分的文字和水印部分的文字分别进行识别,其中通过提取水印部分的图片进行处理后再识别,最终分别将识别出的文字进行合并,本发明能有效提高对水印部分文字的识别准确性。
技术领域
本发明涉及图像识别领域,特别是一种分离式OCR识别方法及其系统。
背景技术
带水印的图片,就是在文字的上面添加上一层半透明的图像,这层图像不会影响读者对于文字的阅读。OCR文字识别,指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。
发明内容
为解决上述问题,本发明的目的在于提供一种能够识别出包括水印图像上文字的一种分离式OCR识别方法及其系统。
本发明解决其问题所采用的技术方案是:
一种分离式图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
根据水印标识部分区域对应坐标在待处理文字中插入标识符;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;
对含水印标识部分的区域进行二值化处理;
对含水印标识部分的区域执行OCR识别,识别出待插入文字;
将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
进一步,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810025349.9/2.html,转载请声明来源钻瓜专利网。