[发明专利]一种分离式OCR识别方法及其系统在审

申请号：	201810025349.9	申请日：	2018-01-09
公开（公告）号：	CN108319945A	公开（公告）日：	2018-07-24
发明（设计）人：	欧阳永中	申请（专利权）人：	佛山科学技术学院
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/32;G06K9/34;G06K9/46
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	梁嘉琦
地址：	528000 广东省佛山市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	水印标识水印标识符去除二值化处理灰度处理获取图像区域对应锐化处理坐标模型标定图像合并图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种分离式图像OCR识别方法及其系统，包括以下步骤：建立坐标模型；获取图像的水印标识；标定坐标；提取包含水印标识部分的区域；图片去除含有水印标识部分的区域；对去除含有水印标识部分的区域执行OCR识别；根据水印标识部分区域对应坐标在待处理文字中插入标识符；灰度处理；USM锐化处理；二值化处理；对含水印标识部分的区域执行OCR识别；将相应待插入文字根据插入标识符插入到待处理文字。本发明采用文字分离的方式，将非水印部分的文字和水印部分的文字分别进行识别，其中通过提取水印部分的图片进行处理后再识别，最终分别将识别出的文字进行合并，本发明能有效提高对水印部分文字的识别准确性。

技术领域

本发明涉及图像识别领域，特别是一种分离式OCR识别方法及其系统。

背景技术

带水印的图片，就是在文字的上面添加上一层半透明的图像，这层图像不会影响读者对于文字的阅读。OCR文字识别，指利用OCR(Optical Character Recognition，光学字符识别)技术，将图片、照片上的文字内容，直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。

发明内容

为解决上述问题，本发明的目的在于提供一种能够识别出包括水印图像上文字的一种分离式OCR识别方法及其系统。

本发明解决其问题所采用的技术方案是：

一种分离式图像OCR识别方法，包括以下步骤：

对图像进行坐标矫正，建立坐标模型；

获取图像的水印标识，在图像上标出包含有水印标识部分的区域；

标定水印标识部分区域对应坐标；

提取包含水印标识部分的区域；

图片去除含有水印标识部分的区域；

对去除含有水印标识部分的区域执行OCR识别，识别出待处理文字；

根据水印标识部分区域对应坐标在待处理文字中插入标识符；

对含水印标识部分的区域进行灰度处理；