[发明专利]用于文本图片字符切分的深度学习网络、切分方法有效

专利信息
申请号: 201910701921.3 申请日: 2019-07-31
公开(公告)号: CN110895695B 公开(公告)日: 2023-02-24
发明(设计)人: 刘晋;张瑾英明 申请(专利权)人: 上海海事大学
主分类号: G06V30/148 分类号: G06V30/148;G06V30/146;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08
代理公司: 上海互顺专利代理事务所(普通合伙) 31332 代理人: 成秋丽
地址: 201306 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 文本 图片 字符 切分 深度 学习 网络 方法
【说明书】:

发明提供一种用于文本图片字符切分的深度学习网络,应用于图像识别技术领域,包括:特征金字塔网络,为基于通道空间双重注意力融合机制的网络结构,用于提取多尺度特征图;区域建议网络,用于在多尺度的特征图上逐像素生成锚点,每个尺度的特征图上都生成相应锚点框,通过所述锚点框进行卷积区分锚点框是前景还是背景的二分类分数;以及前景锚点框与其真值的偏移量;特征区分网络,用于通过将不同尺度的ROI对应至其相应的特征图上并输出相同尺寸的ROI特征图;构建简单卷积层和全连接层再次回归ROI与真值的偏移量来对ROI进行二次修正。应用本发明实施例,能够将图像文字识别和预测相结合,提高识别的准确率。

技术领域

本发明涉及图像处理技术领域,特别是涉及一种用于文本图片字符切分的深度学习网络和切分方法。

背景技术

文本识别通常采用的是光学字符识别(Optical Character Recognition,OCR),一种是端到端地以序列方式从图片中识别文本。

对于字符切分技术,多数还是使用基于规则以及传统机器学习算法,例如投影法,文字轮廓提取法等,但是当字符粘连重叠或间距过小以及左右结构的字时,常常会出现欠切分或过切分的情况,也无法获得任何更深层次的特征。

因此,现有的字符切分这导致上述问题一直都无法得到很好的解决。若使用其他机器学习方法来处理该问题,则存在切分速度慢,切分不精准的问题。

发明内容

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用于文本图片字符切分的深度学习网络及装置,旨在使用多种不同用途的注意力模块作用于二阶段的实例分割网络,不仅能够识别正常的字符,还能够从有噪声的文本行图片中精确切分出正常间距的字符,较小间距的字符,粘连字符,部分重叠字符等特殊情况。

为实现上述目的及其他相关目的,本发明提供一种用于文本图片字符切分的深度学习网络,所述深度学习网络包括:

特征金字塔网络,为基于通道空间双重注意力融合机制的网络结构,用于提取多尺度特征图;

区域建议网络,用于在多尺度的特征图上逐像素生成锚点,每个尺度的特征图上都生成相应锚点框,通过所述锚点框进行卷积区分锚点框是前景还是背景的二分类分数;以及前景锚点框与其真值的偏移量;

特征区分网络,用于通过将不同尺度的ROI对应至其相应的特征图上并输出相同尺寸的ROI特征图;构建简单卷积层和全连接层再次回归ROI与真值的偏移量来对ROI进行二次修正。

一种实现方式中,所述特征区分网络为于编码解码结构的特征区分网络,用于精细化生成的轮廓,包括一个平滑网络以及一个边界网络构成,所述平滑网络采用自底向上结构及若干残差精修块和通道注意力块构成。

一种实现方式中,所述采用长短时神经网络,根据所述图像信息进行预测,获取多个预测结果的步骤,包括:

所述特征金字塔网络包括:用于将输入通过卷积操作进行维度统一;

将高分辨率特征图HF进行全局平均池化,利用softmax激活函数求出通道级别的注意力图CA;

根据所述通道级别的注意力图CA,指导低分辨率特征图LF进行特征选择;

将低分辨率的特征图LF利用sigmoid激活函数求出像素点级别的注意力图SA;

根据所述像素点级别的注意力图SA,指导高分辨率的特征图找到字符轮廓;

将高分辨率特征图和低分辨率特征图联接,并进行降维处理;

利用残差捷径路线将最终结果与高分辨率特征图输入进行加和进行融合,获得融合结果。

一种实现方式中,所述融合结果的具体表达为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910701921.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top