[发明专利]图片文字识别方法、装置及平台在审
申请号: | 201910106685.0 | 申请日: | 2019-02-02 |
公开(公告)号: | CN109919146A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 周钊;郑莹斌;叶浩 | 申请(专利权)人: | 上海兑观信息科技技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201404 上海市奉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字信息 区域提取 子区域 局部分割 拼接处理 图片文字 拼接 图片分割 图片区域 合并 全局 分割 | ||
一种图片文字识别方法,包括:局部分割,将包含有文字信息的图片分割为多个区域,判断每个区域是否含有文字信息,对于包含有文字信息的区域提取其中的文字信息;全局连接,将包含有文字信息的区域进行拼接处理,根据拼接合并后的区域提取识别出其中的文字信息。在局部分割步骤中,将所述的图片区域再进一步分割,生成多个子区域,判断每个子区域是否含有文字信息,对于包含有文字信息的子区域提取其中的文字信息;在全局连接步骤中,将包含有文字信息的子区域进行拼接处理,根据拼接合并后的区域提取识别出其中的文字信息。
技术领域
本发明属于图像处理技术领域,特别涉及一种图片文字识别方法、装置及平台。
背景技术
现有的对图片中包含的文本文字的提取识别,通常会使用到OCR。光学字符识别技术(OCR),是通过扫描、摄影等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。相对一般文本,通常以最终识别率、识别速度、版面理解正确率及版面还原满意度4个方面作为OCR技术的评测依据;而相对于表格及票据,通常以识别率或整张通过率及识别速度为测定OCR技术的实用标准。
OCR中通常还包括字符检测和字符识别。其中字符检测技术,通过一些图像处理的方法,获取文字边缘,形状等特征,从而获取文字的区域。目前的技术都是通过深度学习的方法,利用深度神经网络获取文字的特征,然后通过预先定义的基础文字框进行分类,回归或者直接分割的方法确定文字的区域。字符识别技术,当前的技术是通过深度学习的方法,利用循环神经网络获取图像的连续特征,然后通过分类的方式确定每个识别块的文字。
如图1所示的文字识别方法,首先通过传统的图像处理的方法对输入的图像进行二值化处理,然后根据文字的特征进行模糊处理,最后用区域检测算法标定出文字的区域,然后送入到识别网络中进行图像的处理。该技术简单,效率高,占用的计算资源较少。但是这种方法的缺点是,对输入图像的要求较高,只能处理文字大小相近且直线排列的文字,不能处理任意形状的文字。这里的任意形状文字,是由于很多图片中的文字,由于艺术美化的需要,采用了变体文字的表现形式,不仅包括常用字体,还包括又各种夸张变形的字体,给文字的自动识别带来困难。
又,例如图2所示的文字识别方法,借鉴通用图像物体检测的思路(如Faster-RCNN),采用深度神经网络提取文字的特征,然后根据这些特征判断预先设定好基础的文本框(通常为不同长宽比的矩形)是否存在文字以及文字区域的偏移量,从而确定文字的区域。之后送入到识别网络中,获取文字信息。该方法的缺点是,对于图像中可能存在的长文字区域比较容易检测不准确,位置信息不够精准,不能解决弯曲字体的识别。
发明内容
本发明实施例提供了一种图片文字识别方法及装置,针对图片中任意字体字形和大小的文字进行识别提取,解决了现有图片文字识别方法对于变体文字识别差错较大的问题。
本发明实施例之一,一种图片文字识别方法,该方法包括:
局部分割,将包含有文字信息的图片分割为多个区域,判断每个区域是否含有文字信息,对于包含有文字信息的区域提取其中的文字信息;
全局连接,将包含有文字信息的区域进行拼接处理,确定拼接合并区域内文字的中心位置,在根据文字中心位置调整文字区域边界,确定包含文字信息的区域。
优选的,在局部分割步骤中,将所述的图片区域再进一步分割,生成多个子区域,判断每个子区域是否含有文字信息,对于包含有文字信息的子区域提取其中的文字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海兑观信息科技技术有限公司,未经上海兑观信息科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910106685.0/2.html,转载请声明来源钻瓜专利网。