[发明专利]图片文字识别方法、装置及平台在审

专利信息
申请号: 201910106685.0 申请日: 2019-02-02
公开(公告)号: CN109919146A 公开(公告)日: 2019-06-21
发明(设计)人: 周钊;郑莹斌;叶浩 申请(专利权)人: 上海兑观信息科技技术有限公司
主分类号: G06K9/20 分类号: G06K9/20;G06K9/34;G06K9/62;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 201404 上海市奉*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字信息 区域提取 子区域 局部分割 拼接处理 图片文字 拼接 图片分割 图片区域 合并 全局 分割
【说明书】:

一种图片文字识别方法,包括:局部分割,将包含有文字信息的图片分割为多个区域,判断每个区域是否含有文字信息,对于包含有文字信息的区域提取其中的文字信息;全局连接,将包含有文字信息的区域进行拼接处理,根据拼接合并后的区域提取识别出其中的文字信息。在局部分割步骤中,将所述的图片区域再进一步分割,生成多个子区域,判断每个子区域是否含有文字信息,对于包含有文字信息的子区域提取其中的文字信息;在全局连接步骤中,将包含有文字信息的子区域进行拼接处理,根据拼接合并后的区域提取识别出其中的文字信息。

技术领域

发明属于图像处理技术领域,特别涉及一种图片文字识别方法、装置及平台。

背景技术

现有的对图片中包含的文本文字的提取识别,通常会使用到OCR。光学字符识别技术(OCR),是通过扫描、摄影等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。相对一般文本,通常以最终识别率、识别速度、版面理解正确率及版面还原满意度4个方面作为OCR技术的评测依据;而相对于表格及票据,通常以识别率或整张通过率及识别速度为测定OCR技术的实用标准。

OCR中通常还包括字符检测和字符识别。其中字符检测技术,通过一些图像处理的方法,获取文字边缘,形状等特征,从而获取文字的区域。目前的技术都是通过深度学习的方法,利用深度神经网络获取文字的特征,然后通过预先定义的基础文字框进行分类,回归或者直接分割的方法确定文字的区域。字符识别技术,当前的技术是通过深度学习的方法,利用循环神经网络获取图像的连续特征,然后通过分类的方式确定每个识别块的文字。

如图1所示的文字识别方法,首先通过传统的图像处理的方法对输入的图像进行二值化处理,然后根据文字的特征进行模糊处理,最后用区域检测算法标定出文字的区域,然后送入到识别网络中进行图像的处理。该技术简单,效率高,占用的计算资源较少。但是这种方法的缺点是,对输入图像的要求较高,只能处理文字大小相近且直线排列的文字,不能处理任意形状的文字。这里的任意形状文字,是由于很多图片中的文字,由于艺术美化的需要,采用了变体文字的表现形式,不仅包括常用字体,还包括又各种夸张变形的字体,给文字的自动识别带来困难。

又,例如图2所示的文字识别方法,借鉴通用图像物体检测的思路(如Faster-RCNN),采用深度神经网络提取文字的特征,然后根据这些特征判断预先设定好基础的文本框(通常为不同长宽比的矩形)是否存在文字以及文字区域的偏移量,从而确定文字的区域。之后送入到识别网络中,获取文字信息。该方法的缺点是,对于图像中可能存在的长文字区域比较容易检测不准确,位置信息不够精准,不能解决弯曲字体的识别。

发明内容

本发明实施例提供了一种图片文字识别方法及装置,针对图片中任意字体字形和大小的文字进行识别提取,解决了现有图片文字识别方法对于变体文字识别差错较大的问题。

本发明实施例之一,一种图片文字识别方法,该方法包括:

局部分割,将包含有文字信息的图片分割为多个区域,判断每个区域是否含有文字信息,对于包含有文字信息的区域提取其中的文字信息;

全局连接,将包含有文字信息的区域进行拼接处理,确定拼接合并区域内文字的中心位置,在根据文字中心位置调整文字区域边界,确定包含文字信息的区域。

优选的,在局部分割步骤中,将所述的图片区域再进一步分割,生成多个子区域,判断每个子区域是否含有文字信息,对于包含有文字信息的子区域提取其中的文字信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海兑观信息科技技术有限公司,未经上海兑观信息科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910106685.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top